不太了解这块,前几天搜的 tesseract ,对固定格式的字体学习后识别率会高一些,但是不固定字体的文本或者有背景图的字体识别率不是很理想。
问 GPT 他说自己的知识库是 2021 年的,不清楚现在什么库比较好用。。
1
paidaxtis 2023-07-27 08:36:53 +08:00 via Android 2
paddleocr ,或者阿里读光
|
2
lxrmido 2023-07-27 09:10:12 +08:00 1
paddleocr +1
|
4
yushiro 2023-07-27 10:01:37 +08:00 via iPhone
如果你可以用在线 ocr ,腾讯有 ocr api 接口,企业认证以后每个月有 1000 次的免费额度。
|
5
99s 2023-07-27 10:05:10 +08:00
paddleocr +10086
|
6
Sting1226 2023-07-27 10:28:11 +08:00
有背景的,简单的 ps 里条一下色阶就可以了,复杂的操作就复杂点了。总之就是去掉背景。
|
7
panggmai 2023-07-27 15:18:17 +08:00
easyocr 不错
|
8
huluhulu 2023-07-27 15:35:01 +08:00
OcrLiteOnnx 可以,我经常用
|
9
minghan0313 OP 朋友想找我实现个功能,就是识别地方新闻节目后的一些公告信息。
我想法是每 5 秒钟截个图,ocr 扫一下,字符数量超过多少或者有部分关键字就保存图片。 像这种量付费的估计用不起了 0.0 |
10
suke119 2023-07-27 17:27:19 +08:00
paddleocr 确实可以 已经做成服务了,比微信的强
|
11
IDAEngine 2023-07-27 17:39:23 +08:00
EasyOCR 很不错的
|
12
busterian 2023-07-27 18:53:32 +08:00
腾讯接口吧, 有免费额度的。而且腾讯接口 ocr 功能齐全包括手写还有表格识别。单说手写识别准确率能把我的鸡爪字 99%识别出来已经很厉害了
|
14
paceewang1 2023-07-28 10:50:26 +08:00
@minghan0313 你这场景难道不是爬虫?
|
15
minghan0313 OP @paceewang1 我觉得算是吧。不过公告信息一般就是新闻结束后的 10 分钟内会出现。
|
16
minghan0313 OP paddleocr 识别率真的是好高!
|
17
pytth 347 天前 via iPhone 1
|
18
minghan0313 OP @pytth 感谢指路,收藏先。
|