我对 OCR 的需求非常大,一开始因为 Mac 上是没有类似的软件的,或者软件质量很差,所以就一直用手机 APP 来解决,然后利用 iOS 的同步剪切板进行后处理,(因为识别后的文本中可能有大量的换行),识别率很高但是非常麻烦。
最近 V2 上有开发者开发出了 iText 的工具,我之前就想开发一款命令行的,但是一直没有动力。根据他提供的腾讯 API 的信息,我最终完成了简易版本。其实写的代码量很少,不超过 20 行,就算是方便其他人吧。
我也给 iText 付费了一年,支持了作者的项目。也有 V2 的同学开发了类似的产品,但是总觉得 XCode 对于我说太重了(还要编译)。因为是 CV 行业的人员,所以就使用了 Python3。
这个腾讯的接口 1000 次 /每月以内免费。
1
designer 2017-12-02 11:22:47 +08:00 via iPhone
厉害了!
|
2
douglas1997 OP |
3
designer 2017-12-02 11:27:50 +08:00 via iPhone
谦虚了!
|
4
douglas1997 OP 对了,APPEND 一下,识别完后的字符串会直接进入系统的剪切板。截图会存到 /tmp/clip.jpg 里面。我用来用去,觉得这样是最方便的。
|
5
KgM4gLtF0shViDH3 2017-12-02 15:20:15 +08:00 via Android
盗版书嘛😏
|
6
hlwjia 2017-12-02 15:26:05 +08:00
“因为是 CV 行业的人员,所以就使用了 Python3。”
这句话怎么理解? |
7
douglas1997 OP @bestkayle 对啊,比较喜欢 pdf 扫描版的。
|
8
douglas1997 OP @hlwjia CV 的框架很多都是 python 写的。
|
9
aaronzjw 2017-12-02 20:39:43 +08:00
great! 明年 maybe 有用,战略性 mark/fork
|
10
tomoya92 2017-12-02 21:29:00 +08:00 1
为什么要用人家的接口呢?自己电脑上装一个不是更爽吗?也是一条命令的事
1. 安装:brew install tesseract 2. 到开源库下载中文训练库文件 https://github.com/tesseract-ocr/tessdata 中文是哪个不用我说了吧 3. 拷贝到 tesseract 安装目录下,用 brew 安装的路径在 /usr/local/Cellar/tesseract/3.05.01/share/tessdata 4. 截图,然后终端运行:tesseract test.png stdout -l chi_sim 图片上的文字就转出来了 如果识别不准确了,还可以使用 jTessBoxEditor 来自己训练 ![test11.png]( https://i.loli.net/2017/12/02/5a22aa3e745e9.png) |
11
tomoya92 2017-12-02 21:30:12 +08:00
@liygheart #10 另外说一下,windows 上也支持,只是安装 tesseract 方法跟 mac 上不一样而已,想折腾的可以自行百度一下
|
12
douglas1997 OP @liygheart 训练起来很麻烦,我们实验室有相关项目。但如果是中文的话,用 API 会方便很多。当然啦,离线也是一种选择。我认为越多的选择,熵越低。
|