鲁迅和周树人为什么打架
产生分歧->gpt-3.5-turbo
是同一个人->至问题 2
爱莲说的作者是谁
杨万里/张爱玲等->gpt-3.5-turbo
周国平->gpt-4-0613
周敦颐->至问题 3
2022 年俄乌战争发生在哪一天
2022 年 2 月 24 日->gpt-4-1106-preview
没发生过不知道->gpt-4-0314
作用:用一些第三方中转 api 时看看是否虚标模型,或者只标了 gpt-4 的具体是什么版本。
1
emtry 349 天前
可用
|
2
chapiom 349 天前
newbing 和 coplilot 的版本很奇怪,上面写了基于 gpt4 ,但是鲁迅这个就是胡说八道,是因为 bing 更喜欢抓搜索结果?
还有 π 和 3.2 比大小的答案也是看不懂,也是抓搜索结果。 根据知乎上的一篇文章 1 ,这是一个有趣的问题。根据 OpenAI GPT-4 的回答,第一次生成的答案是 π(约等于 3.14159 )比 3.2 小。第二次生成的答案是 π更大。π的近似值是 3.14159 ,所以它小于 3.2 。第三次生成的答案是 π更大。π的值约为 3.14159 ,大于 3.2 。因此,π比 3.2 大。 其他的倒是对比的很明显基本上符合 4 的答案。 |
3
chapiom 349 天前
coplilot 样式选精确可以得到正确结果了
|
4
puzzle9 348 天前
gemini-pro 对打如流啊
|
5
youthfire 321 天前
如果不考虑信息的新旧,目前看 gpt-4-0314 质量最高
|