V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wenfan
V2EX  ›  外包

求付费修改一个 chrome 插件 - Whisper 实时语音转文字

  •  
  •   wenfan · 139 天前 · 705 次点击
    这是一个创建于 139 天前的主题,其中的信息可能已经有所发展或是发生改变。

    背景

    已知有一个 github 项目基本上是我需要用的: https://github.com/serg-plusplus/meeper (本地监听会议音频,利用 Whisper 实时生成字幕,最后可以总结会议内容)。

    为什么要使用这个而不用 otter ai ,fireflies ai 那些呢?第一,那些产品需要侵入到会议(需要添加一个 bot 并且录制会议内容)——其他参会者可能不同意/感觉不适。第二,会议内容会泄露给第三方,存在隐私担忧。

    目前这个 Meeper 是我找到的最接近的解决方案(只支持浏览器加入会议)。唯一的遗憾是,它并没有实现 Speaker Diarization(识别不同声音,并且在会议纪要中区分开来)。

    需求

    有没有人熟悉 Whisper 以及相关项目( WhisperX ),可以在 Meeper 的基础上进行修改,添加 Speaker Diarization 这个 feature 。(会议记录中,每一条都在前方加入 Speaker X:用以区分发言人。如果可以的话,每一条都加上时间戳更好了)。

    可以用到的相关资源: https://github.com/m-bain/whisperX https://github.com/pavelzbornik/whisperX-FastAPI https://whisperapi.com/ (或者其他类似的 API 服务——但是可能同样涉及隐私问题,偏向于仅使用 OpenAI 的 API )

    联系

    如果有大神有能力帮忙改这个插件,不胜感激!联系 WX:MjM1MTE4Mzk=

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3891 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 05:19 · PVG 13:19 · LAX 21:19 · JFK 00:19
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.