V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
7747139suy
V2EX  ›  Local LLM

求佬推荐一个本地可部署的音频转文字模型

  •  
  •   7747139suy · 3 天前 · 482 次点击

    8-16g 显卡可跑,中文能力强

    7 条回复    2024-12-30 17:21:58 +08:00
    lpf0309
        1
    lpf0309  
       3 天前
    百度 paddlespeech ,阿里的 funasr ,cpu 都能跑
    isSamle
        2
    isSamle  
       3 天前
    Whisper/SeamlessM4T/vosk
    mumbler
        3
    mumbler  
       3 天前
    donaldturinglee
        4
    donaldturinglee  
       3 天前
    cuda Whisper
    n
        5
    n  
       3 天前
    试了下,有些 cpu 都能跑,有趣。借楼请教这些方案哪个支持识别 speaker 呢?
    n
        6
    n  
       3 天前
    哦,不好意思,仔细看了下,几乎都支持。
    hellojay
        7
    hellojay  
       3 天前
    @n 好像都没有支持的。哎
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5761 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 18ms · UTC 03:22 · PVG 11:22 · LAX 19:22 · JFK 22:22
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.