我记得我小的时候,挺喜欢幻想有个人工智能的,就是一个虚拟伙伴,并且带有全知全能属性的那种。只不过觉得这个会是很未来很未来才很存在的。 现在 gpt 某种程度已经非常强大了,但是也只是自己去使用,给家人和小孩子使用还是很麻烦的。
考虑到现在二手旧手机已经到一个十分便宜的地步,不如在部署形态上在退化一些,让 gpt 在一个固定的终端上去使用,操作也要支持语音对话的能力,当然不是现在 OpenAI 客户端的 gpt4 语音聊天,只是自己做一个转换而已,功能尽量阉割在阉割,一切只需要简单好用就行。
琢磨这样一个东西,对于小朋友的吸引力一定会很大吧,想给家里人搞个,但还没琢磨很好的方案
1
ijk 2023-10-05 00:38:25 +08:00 via iPhone
直接用 Siri 或者什么助手接入 gpt 的脚本就 OK 了吧?
|
2
tool2d 2023-10-05 00:42:58 +08:00
我自己写了一个 apk ,用的是讯飞语音输入,转换语音成文字后,喂给 chatgpt 显示出来结果。
|
4
gezilzq OP https://github.com/Ai-Austin/Bing-GPT-Voice-Assistant
https://github.com/cogentapps/chat-with-gpt 感觉相关的带语音的客户端也是挺多的,再配合上应用常驻,加上唤醒词,应该能呈现一个很不错的效果。 |
5
tool2d 2023-10-05 00:57:45 +08:00 3
我再唠叨几句,毕竟自己写过。
可能很多人不知道,安卓有一套完善的语音录入体系,叫 voice_recognition_service ,默认绑定的是 GoogleTTSRecognitionService 因为 google tts 国内无法访问,你也可以通过 adb 后,用下面命令切换到讯飞语音的在线识别服务 settings put secure voice_recognition_service com.iflytek.speechcloud/com.iflytek.iatservice.SpeechService 然后就用代码调用 input keyevent KEYCODE_VOICE_ASSIST ,一键触发完整流程:语音录入->上传识别语音到文字->回调进自己的第三方 apk (通过 Intent 获取识别后的文本) 我试过别的语音识别方案,比如 openai 的 whisper ,但是中文识别率实在是很糟糕。 |
7
tool2d 2023-10-05 01:04:47 +08:00
@gezilzq 就自己用用,我家安卓机顶盒有 KEYCODE_VOICE_ASSIST 物理按键,可以用遥控器上的麦克风进行语音互动,就顺手写了一个插件。
|
8
gezilzq OP @tool2d 也就是通过把 apk 安装到机顶盒上,这样貌似更合理一些,遥控器的语音一般也不咋用,这样利用起来反倒挺有意思
|
9
blurethdao 2023-10-05 06:16:34 +08:00 via iPhone
chatgpt 官方 app 不就有吗,找个好的梯子就行了
|
10
acapla 2023-10-05 08:38:40 +08:00
感觉家里闲置的 amazon echo 有机会盘活了。
|
11
shoaly 2023-10-05 09:37:59 +08:00
我做了一个 bot 版本的, 输入就是正常的输入法自带的语音转文字, 然后 gpt 的文字通过微软服务转成 mp3, 给娃讲故事有非常好的效果, 随便编啊...
|
12
lDqe4OE6iOEUQNM7 2023-10-05 09:58:31 +08:00
他有幻觉,别带坏孩子了
|
13
Puteulanus 2023-10-05 10:51:54 +08:00
https://twitter.com/lewangx/status/1708104159923429696
https://twitter.com/lewangx/status/1694902285850026281 之前在推特看到有人设计开源了用火火兔改造的,现在咸鱼上已经有代改的了好像 |
14
Themyth 2023-10-05 12:43:21 +08:00
@Puteulanus 他好像自己卖 399 一个
|
15
Puteulanus 2023-10-05 12:46:04 +08:00
@Themyth 399 有点贵了感觉。。
|
16
gezilzq OP @James2099 这其实还真不算啥,大人或者身边人在一些常识经验性知识的传授时,往往也都会带来很多误解。在价值观方面,gpt 的道德系统也是足够的,对于一些知识错位的,我觉得倒是能接受的
|
17
gezilzq OP @Puteulanus 没错,这种只需要调用接口,单一的功能的硬件终端,带给生活直观的改变往往是巨大的
|
18
gezilzq OP @Puteulanus 没错,这种就是很希望的形态,极致单一的功能,只在一个很普通的硬件上即可运行。这种形态,往往比出现在本就认为智能的手机上,感触更深
|
20
csx163 2023-10-06 23:44:23 +08:00
百度好像有产品了,前段时间看到的新闻
|
21
fenglingyu 2023-10-07 09:42:30 +08:00 1
现在给小孩用生成式 ai 不知道是好是坏,毕竟 ai 是会一本正经说出秦琼大战关公这种,还不认错的
|
22
a30968932 2023-10-07 11:58:51 +08:00
你的想法听起来非常有趣!将 GPT-3 或类似的 AI 模型集成到一个专用终端,以便小朋友和家庭成员能够更轻松地与它互动,是一个有潜力的项目。以下是一些思考和建议:
1. **硬件选择**:选择一个便宜但功能足够的终端设备,可能需要一块显示屏、麦克风和扬声器,以及一个小型计算机(如树莓派)。 2. **用户界面**:创建一个简单的、易于使用的用户界面,最好支持语音交互和显示文本回复。这可以使小朋友和家庭成员更容易与 AI 进行互动。 3. **安全性和监控**:考虑到小朋友的使用,确保设备的内容是适合他们年龄的。另外,添加监控功能以监测使用情况,确保孩子们不会访问不适当的内容。 4. **功能选择**:根据目标受众,决定要保留哪些功能,可能包括教育内容、游戏、天气信息、故事讲述等。 5. **隐私考虑**:确保用户数据的隐私和安全,特别是在涉及儿童时。遵守适用的法律法规,如 COPPA (儿童在线隐私保护法)。 6. **学习和适应**:考虑让 AI 能够适应用户的需求和喜好,以提供更个性化的体验。 7. **用户支持**:提供用户支持和更新机制,以确保设备的稳定性和安全性。 请记住,这个项目可能涉及到软件开发、硬件集成和设计等多个方面,所以需要一支具备相关技能的团队来实现。另外,要确保合法性和道德性,以确保用户的权益和隐私受到保护。 |
23
yufeng0681 2023-10-07 14:02:55 +08:00
智谱清言 app , 下一个和它聊聊,看看满足你的需求么。
我目前看和 chatgpt 差不多。 |
24
lDqe4OE6iOEUQNM7 2023-10-07 17:37:27 +08:00
@gezilzq 手机版不是已经支持语音对话了,多语言
|
25
gezilzq OP @fenglingyu 我觉得接触到错误的知识很正常,只要不产生 AI 说的都是对的,这种预期就行。
|
26
aluckyapple 311 天前
@Themyth hi ,我是 lewangx 。可以单买替换电路板,自己在咸鱼上买一个火火兔,然后自己组装一下,组装过程非常的简单,这样会划算一些。整机因为一些原因价格比较高。
|
27
gezilzq OP @aluckyapple 噢吼! lewangx ,推上有关注你,也是在这个帖子上才发现有人做了这个东西,火火兔的项目我也一只在看,但是最终形态上和我想象的效果还是有些差距的,不过仍然很厉害!
|