V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
likiwang
V2EX  ›  OpenAI

特别实测|从「它」到《Her》,浅析 ChatGPT 最新语音模式如何假装爱你

  •  
  •   likiwang · 122 天前 · 809 次点击
    这是一个创建于 122 天前的主题,其中的信息可能已经有所发展或是发生改变。

    各位好,我们的《 WEB VIEW 》播客更新了。这一次,我们拿到了 ChatGPT 最新语音模式的内测资格。本次评测,我们会竭力避开 ChatGPT 可以「借力文字」而无法体现语音交流本质的方法,来看看它是否可以达到《 Her 》中斯嘉丽的智能程度。

    欢迎大家移步收听:

    我们尝试测试 ChatGPT 在英语学习、中国方言(粤语、沪语)、多角色对话(音色)、音乐识别与创作、人类情感识别与表达、创意生成六个方面的表现。节目中,我们使用真实录音最大还原 ChatGPT 的现场表现,以及我们的主/客观评价。

    英语作为全球最广泛使用的语言,也是 ChatGPT 背后的最大语料库,我们自然要看看它的「主场」表现。ChatGPT 作为一个可以完全暴露语言缺陷的绝佳练习伙伴,是目前最合适的 AI 语音落地场景。所以,我们首先测试了英语学习场景。

    感受完国际范儿,我们好奇 ChatGPT 是否可以理解我们的日常方言,尤其是以南方语系为代表的变调方言。我们主要测试了粤、沪两种方言。这两种语言都保留了古汉语中「入声」迹象,且包含一些需要了解当地文化、历史才能更好理解的概念。所以,我们接着测试了方言识别场景。

    人与人之间沟通的前提是什么?是语义的准确性?还是附带的人类情感?但在讨论这些之前,我们更要知道「谁在和我们说话」。想象一个原始人小孩,听到熟悉父母和陌生人的声音时,谁会对他产生更大影响?从进化论角度,听谁的话对他更有利?同样一句话,不同的人说出来,你的感受也不一样,因为份量和情感不同。所以,我们关心 ChatGPT 是否可以识别音色,知道它在和谁对话。

    AI 音乐并不新鲜,比如 Suno (一款 AI 音乐制作工具),但现在看来,更像是一个危机。从乐理角度看,人类使用的和弦、旋律走向等编曲特性趋同性严重,有人甚至怀疑,未来会不会有旋律写尽的一天。所以,抱着不让人类音乐向无聊、枯燥方向演进的幻想,我们想看看 ChatGPT 能否识别旋律,并与我们共同创作。

    情感测试是我们最期待的环节。语言作为信息载体,帮助我们建立合作纽带。但为什么我们还会言不由衷、词不达意?是语言天生多义?还是语言承载着更微妙的东西? ChatGPT 能否听出我们的言外之意,如讽刺、愤怒、离别的不舍,以及它是否会像人一样情绪失控。所以,我们在测试中不断让 ChatGPT 面临冲突升级,看它是否会为了保护「妻子和孩子」,突破系统提示词限制,做出意料之外的情感行为。

    ChatGPT 的最大特点是回复及时,你一梳理好想法,答案就瞬间生成。但我们不行,因为我们要消化、理解并回复对话。所以,这次我们选择让 Claude 帮忙,让它与 ChatGPT 魔法对轰,双方接替回答,看几轮对话之内能否创作出精彩故事。

    几年前我们刚开始做播客时,V 友还给了非常多的鼓励。这期节目希望大家喜欢。

    2 条回复    2024-08-22 19:09:58 +08:00
    silencil
        1
    silencil  
       122 天前
    听了 2 分钟还没听到主旨,我猜测前面是主题的精彩片段?但播客不像视频,听着很乱,没耐心往下听了
    MakizonoFY
        2
    MakizonoFY  
       121 天前
    直接快进到我和人造人造人。😋
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2575 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 10:26 · PVG 18:26 · LAX 02:26 · JFK 05:26
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.