tldr: https://github.com/mayocream/koharu
文字检测模型用了基于 YOLOv5 和 DBNet 的 comic-text-detector ,OCR 模型用了基于 transformers 的 manga-ocr 。
程序用 Rust 和 Tauri 编写,界面用的是 React + Konva.js + TypeScript ;更详细可以看仓库的 README 。
程序支持兼容 OpenAI API 的任何后端,比如 LM Studio ,使用时注意打开 CORS 。
准备加上 segment 和 inpaint 功能,还在施工中……
刚学 Rust 三个月,写出来的第一个程序,还望轻喷 orz
![]() |
1
loveqianool 3 天前 ![]() |
![]() |
2
yidinghe 3 天前 via Android
以后直接用多模态 LLM ,因为多模态 LLM 不仅能识别文字内容,还会根据漫画内容来推断其真实意思。
|
3
RedNax 3 天前
好赞!
等多模态彻底成熟了是不是能直接修图嵌字…… |
4
ovtfkw 3 天前 via iPhone
哪里有汉化
|
![]() |
5
neteroster 3 天前 via Android ![]() |
![]() |
6
cijianzy 3 天前
这个不错。
|
7
qinghuazs 2 天前
|
![]() |
8
9yu OP @yidinghe 现在手动把漫画图片喂给 ChatGPT / Claude 也可以达到这个效果,不过我暂时还没尝试集成进程序里;感觉可以试试!就是 API 费用可能有点贵。
|
![]() |
9
9yu OP ![]() @neteroster
@RedNax 1L 分享的 manga-image-translator 这个项目其实可以全自动化,但是是 Python 写的,但是思路是差不多的: Detection / segment -> OCR -> LLM translate -> SD inpaint Koharu 还差 inpaint ,我打算这周加上去。 Python 的程序感觉不太容易分发,Rust 写的不需要其他任何依赖,方便一些。 |
11
xzaf 2 天前
厉害了,赞赞赞!
|
![]() |
12
lizhenda 19 小时 31 分钟前
不错哦,如果能直接改图就更好了。
|