V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Amose2024
V2EX  ›  问与答

求推荐一个应用可以将音频文件转成文本

  •  
  •   Amose2024 · 15 天前 · 847 次点击

    本人业余时间修了个管理方向的硕士学位,经常需要看视频课程或者听音频课程,有的时候一堂课甚至超过 4 个小时。不想听,觉得看起来快多了。求一个应用,可以让我快速上传大文件,并且很快转成文本内容。

    感谢

    11 条回复    2025-02-08 21:48:24 +08:00
    tpxcer
        1
    tpxcer  
       15 天前
    达芬奇
    loading
        2
    loading  
       15 天前
    通义可以转,还会总结。很多 AI 应用都具备这种功能了。
    Amose2024
        3
    Amose2024  
    OP
       15 天前
    @loading @tpxcer 谢谢。请问对于两个 G 大小的文件也可以处理吗?其实这种要上传就是比较麻烦的事情了
    loading
        4
    loading  
       15 天前
    建议通过其他软件,单独将音频剥离出来。如果是在线看的视频,甚至有机器人帮你完成,像通义,我只要给播客的地址,它就能做完,不用我上传。
    404neko
        5
    404neko  
       15 天前   ❤️ 1
    那肯定是 Whisper 了
    paopjian
        6
    paopjian  
       15 天前   ❤️ 2
    直接 pip 安装 buzz,启动 buzz 就可以用 whisper 模型做提取声音识别字幕了,安装 pytorch 还可以调 gpu 加速
    Amose2024
        7
    Amose2024  
    OP
       15 天前
    @loading 音视频都是需要登录验证的,给链接,通义怕是访问不了。
    @404neko @paopjian 我是有办法把音视频文件下载下来。没搞过 Whisper ,可以试试本地跑跑。谢谢
    iaiuse
        8
    iaiuse  
       15 天前 via iPhone
    飞书妙计。跑不了的
    Amose2024
        9
    Amose2024  
    OP
       15 天前
    @paopjian @404neko 果然可行,准确度异常的高,十分感谢~
    lneoi
        10
    lneoi  
       15 天前
    围观看看, 本地有好多音频, 也想整理成文字, 有的还是方言, 以前找的很多识别软件都是太长音频不支持, 要不然就是收费非常贵
    tpxcer
        11
    tpxcer  
       13 天前
    @Amose2024 可以
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2594 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 10:39 · PVG 18:39 · LAX 02:39 · JFK 05:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.