如下验证码能被识别破解不
有没有什么思路可以借鉴
1
iambic 2015-12-17 11:30:35 +08:00
最后一个是输入那五个字还是输入结果?
|
2
winnie2012 2015-12-17 11:40:01 +08:00
可以啊,人肉打码,一分钱一个,中国闲着没事干的人一堆一堆的。
|
4
Ricky123 OP |
5
supman 2015-12-17 12:00:52 +08:00 via iPad
好牛掰的验证码啊
|
6
LuoLuoKaka 2015-12-17 12:02:49 +08:00 1
@winnie2012 可以把它做成游戏
|
7
jacy 2015-12-17 12:13:25 +08:00
汉字的 ocr 技术很落后的
|
8
wbsdty331 2015-12-17 12:34:30 +08:00
我记得 我以前搜狐帐号找回密码 就是这种
|
9
ihciah 2015-12-17 15:51:56 +08:00
看起来字的位置大致固定,所以直接切开扔 CNN 即可。
训练集可以自己生成。 可以用 VGG19 做 finetune |
10
ihciah 2015-12-17 15:52:58 +08:00
btw , 99%+肯定没有问题的
|
12
Mutoo 2015-12-17 16:12:47 +08:00
人肉打码明码标价 http://www.jsdati.com/page/price
|
13
cevincheung 2015-12-17 16:16:00 +08:00
还是自己用拖拽验证吧…… 用非主流验证方式就行。
|
14
kasp 2015-12-17 16:43:28 +08:00
企业信用信息公示系统就是用的这种
|
15
xierch 2015-12-17 20:03:58 +08:00
还都是成语.. 那这样组合就更少了,不是更容易..
|
16
10iii 2015-12-17 21:03:15 +08:00
前两天从 V2 连过去的 企业信用信息公示系统+1
|
18
tomb003 2015-12-18 02:19:00 +08:00 2
这种验证码识别非常容易,做这个验证码的人一看就没研究过破解验证码,属于闭门造车自己想象出来的。
首先,每个字的颜色都不一样,和背景的颜色也不一样,直接就可以扣出所有的单字。 由于汉字是方块的,可以很容易得到扣出字的四边。 得到四边后就可以求得扭曲的角度,转成正常未扭曲过的单字。 由于每个字都是单色的,可以很容易转成黑白两色矩阵,减少比对需要的数据量。 剩下的就是找出这个验证码用的所有字体。 然后用二分查找法比对,非常快。 |
21
mcone 2015-12-18 10:07:23 +08:00
前 2 个很简单,( 1 )字体颜色居然没变化,背景干扰可以很简单的通过 RGB 就给扔掉了,出了偶尔的粘连,字符切割基本不会出现任何问题;( 2 )没感觉错的话,这字没有经过扭曲吧,貌似就一个旋转?………切分好的话,完全是上世纪末就能解决的问题(实验室环境+工业界都有),即使是汉字,这是最标准的 OCR 。最重要的,( 3 ),居然是成语啊……他想不开么…………成语的话更简单了,找个词库,四个字第一候选认出来两个,认错 2 个,也能从其他候选里面纠正出来……
第三个的话,得加上语义分析,就不是简单的 OCR 的操作了。不住要做这个,不多讲 |