V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
9yu
V2EX  ›  分享创造

我用 Rust 写了一个日漫汉化工具

  •  5
     
  •   9yu ·
    mayocream · 3 天前 · 1777 次点击

    tldr: https://github.com/mayocream/koharu

    文字检测模型用了基于 YOLOv5 和 DBNet 的 comic-text-detector ,OCR 模型用了基于 transformers 的 manga-ocr 。

    程序用 Rust 和 Tauri 编写,界面用的是 React + Konva.js + TypeScript ;更详细可以看仓库的 README 。

    程序支持兼容 OpenAI API 的任何后端,比如 LM Studio ,使用时注意打开 CORS 。

    准备加上 segment 和 inpaint 功能,还在施工中……

    刚学 Rust 三个月,写出来的第一个程序,还望轻喷 orz

    12 条回复    2025-04-24 14:44:04 +08:00
    loveqianool
        1
    loveqianool  
       3 天前   ❤️ 1
    yidinghe
        2
    yidinghe  
       3 天前 via Android
    以后直接用多模态 LLM ,因为多模态 LLM 不仅能识别文字内容,还会根据漫画内容来推断其真实意思。
    RedNax
        3
    RedNax  
       3 天前
    好赞!
    等多模态彻底成熟了是不是能直接修图嵌字……
    ovtfkw
        4
    ovtfkw  
       3 天前 via iPhone
    哪里有汉化
    neteroster
        5
    neteroster  
       3 天前 via Android   ❤️ 1
    @RedNax

    已经有一些辅助的,比如
    https://github.com/dmMaze/BallonsTranslator

    多模态完全成熟之后也许可以全自动化
    cijianzy
        6
    cijianzy  
       3 天前
    这个不错。
    qinghuazs
        7
    qinghuazs  
       2 天前
    为什么不搞韩漫的
    9yu
        8
    9yu  
    OP
       2 天前
    @yidinghe 现在手动把漫画图片喂给 ChatGPT / Claude 也可以达到这个效果,不过我暂时还没尝试集成进程序里;感觉可以试试!就是 API 费用可能有点贵。
    9yu
        9
    9yu  
    OP
       2 天前   ❤️ 1
    @neteroster
    @RedNax
    1L 分享的 manga-image-translator 这个项目其实可以全自动化,但是是 Python 写的,但是思路是差不多的:
    Detection / segment -> OCR -> LLM translate -> SD inpaint

    Koharu 还差 inpaint ,我打算这周加上去。
    Python 的程序感觉不太容易分发,Rust 写的不需要其他任何依赖,方便一些。
    9yu
        10
    9yu  
    OP
       2 天前
    @qinghuazs 因为基本上没看过……但是想学习韩语,韩国画师好多。
    xzaf
        11
    xzaf  
       2 天前
    厉害了,赞赞赞!
    lizhenda
        12
    lizhenda  
       19 小时 31 分钟前
    不错哦,如果能直接改图就更好了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5604 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 02:15 · PVG 10:15 · LAX 19:15 · JFK 22:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.