V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
siluplsy
V2EX  ›  程序员

分享一个 chrome 日语语音离线识别, Python 代码本地调用动态库实现

  •  
  •   siluplsy · 113 天前 · 1292 次点击
    这是一个创建于 113 天前的主题,其中的信息可能已经有所发展或是发生改变。

    here:

    https://huggingface.co/datasets/dlxjj/soda_jp_success_call

    目前只支持日语,是因为旧版的其他语言模型已经下载不到了。

    Linux: 
    /home/$USER/.config/google-chrome/SODA/1.1.1.7
    windows:
    C:\Users\%USERNAME%\AppData\Local\Google\Chrome\User Data\SODA\1.1.1.7\SODAFiles
    C:\Users\%USERNAME%\AppData\Local\Google\Chrome\User Data\SODALanguagePacks
    	# 语言包和 dll 在这里
    

    关于最新版的 windows dll 调用方法还有待研究。

    5 条回复    2024-07-30 22:04:40 +08:00
    kxg3030
        1
    kxg3030  
       113 天前
    谢谢分享 看看以后能不能用到
    Armor
        2
    Armor  
       113 天前
    语速很快的情况下,可以识别吗?🐶
    iorilu
        3
    iorilu  
       113 天前
    怎么个用法

    和 chrome 有啥关系

    有文章介绍怎么用贴一个吗
    SHF
        4
    SHF  
       113 天前
    我最近玩了下 https://github.com/SYSTRAN/faster-whisper ,可以勉强用用。
    还有 windows 的快捷键 ctrl + win + l 可以离线实时识别,效果也挺好,就是内容不能复制,急求复制方案,要是能复制就好了

    siluplsy
        5
    siluplsy  
    OP
       113 天前
    @iorilu chrome 浏览器 -> 设置 -> 无障碍 -> 实时字幕 -> 自动为音频和视频创建字幕 选项打勾

    下面下载并选择一种语言,此时打开一个视频网站比如 youtue ,它就会实时的识别音频,并弹窗显示识别出的字幕。

    上面的代码就是调用它的动态库而已。代码在 linux 下测试正常。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2807 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 15:26 · PVG 23:26 · LAX 07:26 · JFK 10:26
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.