V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
jiaqiliu
V2EX  ›  云计算

寻找飞书妙记(语音转文本)平替?

  •  
  •   jiaqiliu · 1 天前 · 1230 次点击

    飞书妙记的免费版开始限制 ASR 的时长了(每月 300 分钟)。有没有其他免费的替代品?或者本地部署的也可以。

    https://imgur.com/a/AzL3e7i

    16 条回复    2024-11-13 19:42:47 +08:00
    wkla
        1
    wkla  
       1 天前
    openai whisper.
    阿里达摩院 funasr.
    jiaqiliu
        2
    jiaqiliu  
    OP
       1 天前
    自己简单研究了下,有几个工具,都是离线方案:

    https://github.com/CheshireCC/faster-whisper-GUI
    faster-whisper 的 GUI ,bug 有点多,任务经常卡死,弃

    https://github.com/chidiwilliams/buzz
    也是一些 asr 引擎的 GUI ,比 faster-whisper 稳定,但是在我电脑上无法正常调用 GPU ,弃

    https://github.com/SubtitleEdit/subtitleedit
    主要是一个字母编辑软件,但是其中可以调用自选的底层引擎进行 ASR ,可以正常使用 GPU ,缺点是 ASR 没有进度条,其他还不错目前用的这个。笔记本 4060 ,用 largev3 模型处理一个 90 分钟的视频耗时 15 分钟。
    cyp0633
        3
    cyp0633  
       1 天前
    实现随便你,但是搭配的模型可以试试 belle-large-v3-punct ,在 whisper 基础上微调过效果好多了
    simonsww
        4
    simonsww  
       1 天前
    同找,妙记日常用的还挺多
    janpun
        5
    janpun  
       1 天前
    我也在找,妙记用的很多,企业级应用就是这点不好,我可以接受付款,但绑定了整个大平台的付费我就不想买了,因为我只用这个功能
    pozhenzi998
        6
    pozhenzi998  
       1 天前
    JensenQian
        7
    JensenQian  
       1 天前
    有黄老板显卡的话我用的这个 https://github.com/chidiwilliams/buzz
    JensenQian
        8
    JensenQian  
       1 天前
    @JensenQian https://github.com/chidiwilliams/buzz/blob/main/CONTRIBUTING.md#gpu-support
    默认用的 cpu ,gpu 的话自己看他文档设置,不过得有 cuda

    https://github.com/Const-me/Whisper
    这个支持 amd 的 gpu ,我的 6800H 的核显也能跑,但是好久没更新了
    steelshadow39
        9
    steelshadow39  
       1 天前
    最近看了阿里云的通义听悟,可以试试
    wulv
        10
    wulv  
       1 天前
    通义听悟、钉钉闪记
    Xi
        11
    Xi  
       1 天前
    通义听悟
    linxi7
        12
    linxi7  
       1 天前
    600 块一年,还有 1500 GB 云存储,平时再用用云文档之类的,感觉能回本。
    juicy
        13
    juicy  
       1 天前
    iorilu
        14
    iorilu  
       1 天前
    太多了, 自己折腾可以用 whisper

    或者我开发得 ai 字幕机 (www.aizimuji.com)
    ladeo
        15
    ladeo  
       1 天前
    通义听悟
    s4d
        16
    s4d  
       17 小时 56 分钟前
    我用三星手机自带的录音,AI 转录能识别音色,体验很棒。

    这个叫 Galaxy AI 。

    没有使用限制,但是貌似不能上传录音,必须用手机录。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4850 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 05:38 · PVG 13:38 · LAX 21:38 · JFK 00:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.