1
mikawudi 2013-06-30 16:57:25 +08:00 2
和语言没啥关系,主要是看看图像处理方面的东西吧,验证码就不用做边缘检测了,简单的二值化处理下,然后分割一下,每个分割出来的数字(字母)的每个像素和标准的数字(字母)图像的每个像素点做异或运算,然后统计下和哪个标准数字(字母)图像的相似度最高,就是那个数字(字母)了....不过要考虑干扰噪点啊,干扰线啊什么的,然后如果生成验证码的时候用了旋转啊什么的那么就很难匹配了....我只用C#做过简单实验....不过思路大概就是这样的吧
|
3
andyhu 2013-07-02 20:52:59 +08:00
也可以直接deathbycaptcha人力解决
|
5
ufo22940268 2013-07-03 08:18:02 +08:00
|
6
justin1989 2013-07-03 09:25:17 +08:00
验证码里如果有扭曲和重叠,程序就基本搞不定了
|
7
VYSE 2013-07-03 09:40:28 +08:00
试过tesseract这类OCR,对验证码基本无解,除非针对某类特殊优化
|