V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
aitobox
V2EX  ›  问与答

请问目前有没有能够带入感情的朗读古诗文的 TTS

  •  1
     
  •   aitobox · 43 天前 · 1288 次点击
    这是一个创建于 43 天前的主题,其中的信息可能已经有所发展或是发生改变。

    试用了很多 TTS ,目前在流畅度上都没有什么问题了,读小段文字基本上感觉不到是 AI 合成的了;

    但是有没有带入感情的 TTS 生成引擎,比如读一段古诗文,能有抑扬顿挫,自动控制语速快慢的效果呢?

    7 条回复    2024-10-04 14:46:03 +08:00
    shinsekai
        1
    shinsekai  
       43 天前   ❤️ 1
    五言的诗,拉长每句第二个字的时长;七言的诗,拉长每句第四个字的时长
    kimwang
        2
    kimwang  
       43 天前 via Android
    https://github.com/netease-youdao/EmotiVoice/blob/main/README.zh.md

    网易 易魔声,不过全是命令行、docker 什么的,我不是挨踢的根本搞不定,如果大兄弟会可以教我一下。
    wyd011011daniel
        3
    wyd011011daniel  
       43 天前   ❤️ 1
    Azure 可以很有情感( SSML ),但要自动识别情感可能需要大模型生成标注。或者直接使用大语言模型试试?

    1.https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/speech-synthesis-markup-voice
    wyd011011daniel
        4
    wyd011011daniel  
       43 天前
    @wyd011011daniel #3 如果只是单纯的不带特别感情的朗诵,普通的固定格式 SSML 应该就可以做到,类似一楼的控制方法。
    aitobox
        5
    aitobox  
    OP
       43 天前
    @wyd011011daniel 这个推荐很好,我研究一下;谢谢
    bigtear
        6
    bigtear  
       43 天前
    我写的这个插件也是这个问题,想要尽可能效果好的朗诵里面的诗词,
    现在是用的 Azure TTS 服务,每首诗都识别情感感觉还是用大模型标注比较方便。

    https://github.com/xxnuo/jizhi-mod/
    RiverMud
        7
    RiverMud  
       43 天前 via iPhone
    iOS 17 某个版本前的 Siri 几乎可以认为能够有感情地朗读绝大部分古诗词,这个版本后的 Siri 全废了,给苹果反馈过无数次了,屁用没有。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2826 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 09:38 · PVG 17:38 · LAX 01:38 · JFK 04:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.