最近项目需要识别功能,对接了第三方 OCR 公司 但出现问题频率太高了,windows 正常识别,部署到服务器就失败,环境换了又换(都是对方指定版本) 我看用的是一些 opencv 的包,也不懂很无奈
有擅长的朋友给些意见么
1
ala2008 3 天前
之前不是有人开源弄了个微信 ocr 吗,感觉挺强的
|
![]() |
2
lanweizhujiao 3 天前
那个我有 你敢使用吗?
|
4
datocp 3 天前 ![]() 之前的 px940 采集二维码,不知道算不算 ocr 。平时习惯 sysprep 生成 update 过的系统。
最后才发现只能装 ltsc2021 最原始的发行版本,不在线更新补丁,一些识别异常的问题就解决了。通常供应商指定的系统应该能解决吧,难道是显卡驱动部分嘛。显卡在 win10 以上的系统主要是截取的画面位置变化。软件快捷方式有 更改高 DPI 设置/替代高 DPI 缩放行为/应用程序。 |
![]() |
5
reeco 3 天前
部署个 paddleocr 解决
|
8
gxt92 3 天前 ![]() |
![]() |
10
LiuJiang 3 天前 ![]() 试试 openAI 最新的 o3 模型识别?
|
![]() |
12
Meld 3 天前 ![]() |
13
MartinYANG06 3 天前
用 docker 配好容器直接拉过去呗
|
![]() |
14
villivateur 3 天前
我用 ollama 自己部署的 gemma3 ,用来做 OCR 效率挺高的
|
15
mumbler 3 天前
OCR 开源项目就那几个,你们用的是哪个
|
![]() |
16
Alexf4 3 天前
AI 可以试试 gemini/o3
专精的就试试 PaddleOCR |
![]() |
17
BadMan 3 天前
如果你们有 gpu 机器,直接到 huggingface 上按排行榜下载一个 ocr 模型或者多模态大模型部署,效果很好的
|
![]() |
18
Patrick6 3 天前 ![]() |
19
nananqujava 3 天前
微信那个 OCR 提取我用了, 自己部署后效果不好, 听说和系统, CPU 型号有关
|
20
NoOneNoBody 3 天前
识别率如何是技术问题,但部署成功失败,就是管理问题了,不能只听外包的
opencv 本身不带 ocr ,它只是读图,以及方便定位(图片上的位置)、变换,它只是依赖的部分 目前国内用得广泛的就是 paddleocr ,这货最大问题是依赖问题,例如 numpy 2 、多环境部署都有问题 例如 opencv 版本比较新,opencv 依赖的 numpy 也新,那依赖较旧 numpy 版本的 paddleocr 就会冲突 我建议你就是找那些单独打包的,不太需要另装依赖的(如 docker ),以 api 方式跑,部署会比较简单 如果外包公司提供的在 windows 跑得比较顺,盲猜跟微信 ocr 有关 如果是对物理静态文件的 ocr ,一般都不太多问题,按上述方法做就可以了,github 上搜 umi ocr ,很多项目 如果是针对 stream ,例如网络传送、视频流、摄像头采集,没有物理文件的,这个才复杂些 |
![]() |
21
0312birdzhang 3 天前
ddddocr
|
![]() |
22
JxQg597 3 天前
Tesseract OCR
PaddleOCR 模型,支持调参,Python 调用。 Umi-OCR 支持 Docker 部署和 RestfulAPI ,本地模型用的 PaddleOCR https://github.com/hiroi-sora/Umi-OCR |
![]() |
23
243205964 3 天前
|
24
connectsixboy 3 天前
失败原因是什么呢?看看报错日志
|
![]() |
25
nicoljiang 3 天前
你们对接的哪家?
|
26
chaodada 3 天前
@nananqujava 我在阿里云的 ecs 部署效果特别差 本地部署效果就不错
|
![]() |
27
lmengmeng 3 天前
@villivateur 我有个同事做类似需求也是这样试了下,本地小模型效果好像就挺不错了
|
28
mx2dream 3 天前
Docling 也用过,可以完全在本地部署,支持 API 调用
|
29
cobbage 3 天前 via Android
调用接口不用考虑问题。linux 下 opencv 需要编译对版本的。还有个问题是否用了扩展模块。ocr 感觉还是需要对接模型。oc 你理解为一个不是项目语言的一个 lib 库就行了。
|
![]() |
30
bigtan 3 天前
|
31
nananqujava 3 天前
@chaodada #26 我也觉得很奇怪, 不知道问题出在哪, 这种黑盒
|
32
Damn 2 天前 via iPhone
@0312birdzhang 这个效果很不好,之前手搓公司 VPN 登录器,连预知验证码是两位数字加减(没有乘除)都识别不好。最后还是手工输入的。
|
33
lyhapple 2 天前
我有一个可以私有化部署的 OCR 服务,用 python 、flask 开发的,有 API 接口, 也可以打包成 docker 镜像,怎么联系楼主?
|
34
xiaomushen 2 天前
PaddleOCR, RapidOCR,私有化部署很简单,CPU 推理也很快
|
35
hmxxmh 2 天前 via Android
ppocr 读光 ocr 对印刷体都挺好的,手写体不行,v 友门有好用的手写 ocr 吗
|
36
kkss198x 2 天前
mistral 的 ocr 我自己在用 感觉中文识别有点弱
|
![]() |
37
pike0002 1 天前
Google, Azure 和 Mistral 都有 AI 加持的 OCR 服务。体验下来 Google 和 Azure 的靠谱一些,对于中文表现也还可以。
或者也可以看看 https://ocr.space/,CopyFish 似乎就是用的这个。 |
![]() |
38
roygong 1 天前 via iPhone
直接用微软的 Azure Document Intelligence ,开源项目 OpenWebUI 就对接了这个
|
![]() |
39
kekeabab 1 天前
不是,windows 和 macOS ,iOS ,都有自带的 OCR ,调一下不就好了。苹果自带那个支持巨多语言,我以前还参与过一个项目还是用 iPhone 做集群 OCR 服务卖的。
|
![]() |
40
liuzhedash 15 小时 35 分钟前
可以用 Tesseract OCR
效果马马虎虎但是也够用 |
41
zgjldxdyt1 14 小时 48 分钟前
豆包的最新视觉模型,1.5 vision pro ,识别文字效果不错,价格也还可以。
|
![]() |
42
unco020511 11 小时 24 分钟前
啊现在不都是直接用大模型了吗,4o 的 ocr 已经不错了
|