V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
WarlockMan
V2EX  ›  问与答

这种 AI 配音是如何调的

  •  
  •   WarlockMan · 363 天前 · 1287 次点击
    这是一个创建于 363 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我在学前端的时候刷到一个讲解什么是纯函数的视频, 声音是 AI 生成的,但他用的这个音色非常特殊, 不是各大语音合成厂商提供好的预制角色, 火山引擎和微软 Azure 里的预制音色都没找到他这种音色, 这种音色是他自己调的吗,是用 Azure 定制性训练出来的么

    源视频:什么是纯函数 https://www.bilibili.com/video/BV1QM41197sz/

    4 条回复    2023-11-06 09:45:03 +08:00
    gaobh
        1
    gaobh  
       363 天前 via iPhone
    腾讯云和阿里云的合成看看
    WarlockMan
        2
    WarlockMan  
    OP
       363 天前
    @gaobh
    国内的几个大厂都看过了,预制角色里面没这种音色,像是自己用材料训练的定制音色。
    目前语音合成领域前沿大厂有微软,谷歌,字节跳动旗下的火山,
    目前就体验这几家能把声音做到自然,
    百度,阿里和腾讯的引擎有很重的机械音,能听出非常不自然,感觉在梯队上差了一级。

    现在的微软 Azure 语音合成在"自然"这个指标上应该是最高的,
    大概在七八年前好像,微软有个语音助手的项目叫 cortana ,
    从那个时候微软就在死磕拟真程度,
    那时候它的自然度就已经是这么高了。

    字节的火山引擎我猜测大概率是调用的微软接口,
    大厂就这么几家,也就是微软在一直烧钱死磕 AI 领域十多年,
    其他厂商想赶上短时间应该很难,
    所以我猜测大概率是用的微软 Azure 接口训练的定制音色,
    但我只是猜测,不敢肯定
    asrpub
        3
    asrpub  
       363 天前 via Android
    就是普通的 TTS 吧,多找找其他的厂商,像魔音工坊也可以看看
    LLaMA2
        4
    LLaMA2  
       362 天前   ❤️ 1
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2642 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 12:17 · PVG 20:17 · LAX 05:17 · JFK 08:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.