试过网上教的伊吕波歌测试法,我的 o1 思考过程用了 3 分多钟,但 o1 如果不降智,据说时间是要花更长的。但也看到有人质疑这个测试法的可靠性,所以我想问问还有没有其它可以确定的测试办法?
另外 o1 降智了有没有办法能暂时解决,类似 4o 降智了发图片就能解决那样的?
1
huguadao 1 天前
我已经退订 chatgpt 了😂
|
2
HanashirodotETH 1 天前
o1 一般就是 3 分钟,5 分钟的一般都是极端场景( o1 关自定义提示词 + 美国最“绿”(IP 干净)最靠近 OpenAI 服务器的位置),没降。
|
4
mumbler 1 天前
为什么要解决,有啥非用不可的功能,退订换免费的 aistudio
|
7
mumbler 1 天前
@zczy999 #3 aistudio.google.com 免费不限量,特别 gemini-exp-1206 真是强得冒泡,评测和实际体验均碾压 4o ,gemini-flash-think 对标 o1 ,在 o3 没出来前,openai 毫无竞争力了
|
8
jonsmith 1 天前 via Android
Gemini 2.0 很强,免费,性能接近 o1 。我退订了用了一年多的 plus 。
|
9
billytom 1 天前 via iPhone
话说 Gemini Advance 怎么订阅的?有没有类似 gpt 可以 App 里订阅的方案?受不了 GPT 降智了
|
11
huguadao 1 天前
@haiku Gemini API 支付方案,国内信用卡也得行😄,我已经用了 0.06 刀了,但是 Gemini 2.0 我试了下,就我一个专门的需求下,没感觉多强大啊
|
12
andrew2558 1 天前
claude 代码 + gemini 我这是够用了,还免费,很香
|
13
haiku 1 天前 via Android
@huguadao 2.0 Flash 一般般,AI Studio 里面有两个新的实验性模型好不少:Gemini exp-1206 和 Gemini 2 Flash Thinking
|
16
Liftman 1 天前
我也很迷惑这个问题。我最近尝试过好几次。拿 ctf 题目或者其他的来测试,关键是都很快。
因为 preview 的时候,明明什么都很慢啊,而且有很长的思维链。真的思考很久。 现在尤其是写材料的时候,他明明写的 tmd 贼好。但是太快了。思考速度过于快了。也就 3 秒。而且 3 秒他不是才开始写。3 秒就直接爆文章了。渲染速度还没他发的快。 但是反而是 tmd 前天我让他统计一个字数频率的时候,测试一下,他数几个字数了 2 分多。我看他的思维链是反复的在。。。确认。最终确认。统计。确认。。。。死循环了 2 分钟。。 我反正现在确实很迷惑到底他是不是降智。。。没什么太好的办法吧。 |
17
Liftman 1 天前
https://linux.do/t/topic/290343/51 看了一下这个帖子。测试了下。我是 2 分多钟。其实按照他们的标准来说是降智了。但是里面我看即使肉身美国 ip 也是会降。。我感觉这 tmd 是不是官方算力的负载均衡导致的。。。忙的时候大家一起笨 b 。。。
|
18
aiqinxuancai 19 小时 58 分钟前
用 api 吧
|