V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
mogutouer
V2EX  ›  问与答

最近发现两个广东话粤语 TTS,效果很好接近口语,能猜到背后的模型吗

  •  
  •   mogutouer · 7 天前 · 1025 次点击
    1. https://cantonese.ai/
    2. https://cantontts.replit.app/

    非常接近现有普通话 TTS 的感觉,更接近真人说话的语气和停顿。

    听声音不是现有例如阿里微软等公司出的粤语 TTS 的声音,更像是私域语料训练的结果,用 CosyVoice2 试了一下,并不一样,应该不是用 CosyVoice2 ,对 TTS 了解的朋友能大概知道他们背后用的是哪个模型训练的吗?
    6 条回复    2025-02-25 10:52:57 +08:00
    cyhulk
        1
    cyhulk  
       7 天前
    cosyvoice2 的效果怎么样
    lizhengg
        2
    lizhengg  
       7 天前
    商汤的吧
    hahasong
        3
    hahasong  
       6 天前
    Dongdong 声线不就是抖音的
    mogutouer
        4
    mogutouer  
    OP
       6 天前
    @cyhulk #1 声音没问题,但粤语发音不准很难受
    loyth06
        5
    loyth06  
       6 天前
    蹲一下,类似这种语音方言模型是怎么训练出来的呢?
    zomco
        6
    zomco  
       6 天前
    蹲,感觉这个粤语模型比 CosyVoice2 好多了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   6017 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 06:15 · PVG 14:15 · LAX 22:15 · JFK 01:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.