ORT识别Captcha【记录】

By | 01月15日
Advertisement

心血来潮, 想识别一下一般论坛里登录的验证码,类似于这样的

ORT识别Captcha【记录】

网上有一个tesseract-ocr库,是一个OCR 引擎。

此引擎的优点重复下,字母类语言的识别率几乎可达100%,前提是图像最好黑白(二值化过地),噪点少地图,测试时发现每个字符的高度必须在10个像素以上才能识别.      增强识别率的关键是要识别的验证码图片越干净越好,为此准备了六种图像过滤,用以滤干净图像,有:图像二值化,锐化,中值滤波,线性灰度变换,转黑白灰度图,放大(非平滑缩放).    一般干扰不太严重的验证码,如支付宝使用图像二值化和线性灰度变换就可以做到100%识别,有噪点的才需要中值滤波.使用这六种过滤的组合应该可以搞定大部分比较弱智的验证码。

插播一段:

OCR技术是光学字符识别的缩写(Optical Character Recognition),是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。
 

Ruby gem rtesseract

本文出自 “悟道集” 博客,请务必保留此出处

Similar Posts:

  • Win7 电脑突然USB无法识别 方法记录

    Win7 本本 突然USB无法识别 只要是带USB的设备都 不能识别 最后在网上找到解决方法,可能是电池动了, 首先关了本本,然后把电池取出,再重装入,最后在开机, OK,可以用了

  • 信息管理系统/记录管理系统/配置管理系统

    信息管理系统 Information management systems: 用于以实物或者电子形式收集.存储和分发信息的设施.流程和程序. 10.2.2.4 管理沟通的工具,信息管理系统,用来管理和分发项目信息. 13.4.2.1 控制干系人参与的工具,为项目经理获取.存储和向干系人发布有关项目成本.进展和绩效等方面的信息提供了标准工具 记录管理系统 Records management system. 一套具体的流程.相关控制功能和工具,联合用于记录和保存项目信息. 12.3.2.7 控制采

  • 删除曾经使用过的USB设备记录

    首先,有几种方法可以查看电脑上使用的USB设备记录: 1.无需任何工具软件,手动法:电脑中添加一个环境变量,变量名为"devmgr_show_nonpresent_devices",值为"1".  然后在设备管理器中,勾上"查看"菜单中的"显示隐藏设备".  然后在"磁盘驱动器"."存储卷"."通用串行总线控制器"3个栏目下便可看见很多灰色的图标,这些图标就是在此电脑

  • 如何有效使用OpenPower720(上)

    如何有效使用OpenPower720(上) 李建文 (lijianw@cn.ibm.com), 软件工程师, IBM中国软件开发实验室 李建文,IBM中国软件开发实验室,软件工程师,熟悉POWER/OpenPower体系架构,AIX/Linux操作系统,喜欢阅读和实践,也喜欢思考有趣的问题.如果你有关于OpenPower720的想法或者问题,可以与他联系:lijianw@cn.ibm.com . 简介: 在本文中我们将介绍 OpenPower 系列的典型机型 OpenPower720,讲解如何更

  • 关于学习VB和ASP关系问题

    关于学习VB和ASP关系问题 说VB是ASP的基础是从软件工程的角度出发的. ASP的语言不仅仅只是命令格式差不多,而是包含在之内的命令完全就是VB语法.虽然ASP也是做为单独的一个技术来提出的,但他就是完全继承了VB所有的功能,并且以HTML语言整合(HTML负责界面上,ASP则负责功能上)形成一个B/S(浏览器/服务器)模式的网页程序. 虽然ASP也有很多网络教程.但是这些都不系统.都是半路出家,只是从一个例子告诉你怎么用.不会深入讨论,更不会将没有出现在例子里的方法都一一列举出来.而且,他

  • 3.7 CMMI3级——风险管理(Risk Management)

    有这样的说法:项目管理其实就是风险管理,把风险管理好了,项目也就管理好了.可见风险管理是多么重要啊! 在CMM的时候,还没有专门的PA是针对风险管理的. CMMI2级的PP这个PA的SP2.2提到要识别风险,但这里的要求还是处于项目级别层次的.3级中的RSKM,已经把风险管理上升到组织层面,组织级需要对风险进行分类.定义风险的属性.制定风险的管理策略等. RSKM有3个SG,SG1主要就是讲述组织级的要求,而SG2.SG3重点讲述项目如何进行风险管理活动. SG1 Preparation for

  • 从项目管理角度看软件配置管理

    项目的目地是为了创造一项产品或服务,因此,产品本身的生产工艺必然会成为项目管理过程的核心内容.无论在哪一种软件工程方法中,软件配置管理都是一项不可或缺的重要管理内容,特别是对于服务企业内部的信息技术部门来说,从产品生命周期出发,同时支持服务产品和软件产品,同时负责开发与运行,其管理复杂度很高,要想理顺各项工作的内部关系.理清各项工作之间的配合关系,都离不开配置管理这个基本手段,它是许多管理工作的"落地"部分.其实,配置管理并不是一个时髦的概念,在许多传统行业(例如制造业)中早已有之,软

  • 如何去理解什么是软件配置管理?

    如何去理解什么是软件配置管理? 作为软件配置管理工作者,差不多都有这样的经验:在认识新朋友时,当别人问起自己所从事的职业,自然回答到,"我从事软件配置管理工作".接着,十有八九,会被问到下一个问题"什么是软件配置管理?".总被问到相同的问题,倒还称不上是苦恼,真正的苦恼在于回答这个问题,因为软件配置管理真是不太容易说得清--解释了半天,结果往往是,"你这份工作好玄妙啊.隔行如隔山啊,我是搞不懂了." 是的,软件配置管理,确实不太好解释.软件开发过

  • 第 6 章项目时间管理

    第 6 章项目时间管理:聚焦于用来保证项目按时完成的各过程. 1.定义活动:识别为完成项目可交付成果而需采取的具体行动的过程. 2.排列活动顺序:识别和记录项目活动间逻辑关系的过程. 3.估算活动资源:估算各项活动所需材料.人员.设备和用品的种类和数量的过程. 4.估算活动持续时间:根据资源估算的结果,估算完成单项活动所需工作时段数的过程. 5.制定进度计划:分析活动顺序.持续时间.资源需求和进度约束,编制项目进度计划的过程. 6.控制进度:监督项目状态以更新项目进展.管理进度基准变更的过程.

  • DataSet的CRUD

    插入和查询: using System; using System.Collections; using System.Configuration; using System.Data; using System.Web; using System.Web.Security; using System.Web.UI; using System.Web.UI.HtmlControls; using System.Web.UI.WebControls; using System.Web.UI.Web

Tags: