V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
reDesign
V2EX  ›  问与答

ChatGPT 的 stt 是用的 whisper 吗? 感觉比所有其他的语音输入都要强

  •  
  •   reDesign · 35 天前 · 917 次点击
    这是一个创建于 35 天前的主题,其中的信息可能已经有所发展或是发生改变。
    中英文混输比讯飞强,纯中文和讯飞差不多
    说的是这个东西

    第 1 条附言  ·  35 天前
    这个跟多模肽有关系么?我记得 GPT 3.5 的时候就有这个功能,现在选择 GPT4 也可以用这个功能。
    4 条回复    2024-10-19 19:18:22 +08:00
    malusama
        1
    malusama  
       35 天前   ❤️ 1
    这玩意估计就是模型支持语音的输入输出。。毕竟早就是多模态的了
    kyor0
        2
    kyor0  
       35 天前
    4o 是多模台的
    cyp0633
        3
    cyp0633  
       35 天前
    如果是 whisper ,效果会远不如讯飞
    chesha1
        4
    chesha1  
       34 天前
    官方文档里就有: https://platform.openai.com/docs/guides/speech-to-text

    The Audio API provides two speech to text endpoints, transcriptions and translations, based on our state-of-the-art open source large-v2 Whisper model.
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2820 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 04:00 · PVG 12:00 · LAX 20:00 · JFK 23:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.