首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

关于交易安全的提示

这是一个创建于 1602 天前的主题，其中的信息可能已经有所发展或是发生改变。

一个 2000 元的图片识别类外包，返回一张图片至少包含多少个中文字符

背景

开发一个程序实现图片内容检索，用的 tesseract-ocr 识别图片比较慢，因此想做一个预处理，只识别包含大量文字的图片，忽略风景，人物等不含文字的照片

时间要求

7 天

开发要求

期望使用 python3 或者 C/C++
应提供编译，部署文档
应包含人物，风景，建筑，扫描件这 4 种类型的图片各 3 张

联系方式

微信 albertofwb （请注明 v 站-图片类外包）

2 条回复

1

xwhxbg

2020-07-08 22:34:19 +08:00

提供 training set 不？这个场景可以用个小模型先做分类，然后分类是扫描件的再用 ocr 扫描

2

albertofwb

OP

2020-07-09 00:51:27 +08:00 via Android

@xwhxbg 有人接了，因为主要想筛选扫描类文件，特征明显，用传统算法搞

关于 · 帮助文档 · 博客 · API · FAQ · 实用小工具 · 1006 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 20ms · UTC 21:52 · PVG 05:52 · LAX 13:52 · JFK 16:52
Developed with CodeLauncher
♥ Do have faith in what you're doing.