评测大模型能力时,因为编程是现在 LLM 落地盈利最好的领域,往往都只关注编程一项,而忽略其他能力。但“自由😈”的“创意写作”和“角色扮演”从社媒帖子以及 openrouter 数据来看,也是具有巨大需求的,仅次于编程。同时因为这类用户付费意愿高,盈利能力也很好,可以说编程和“角色扮演”是目前仅有的两个能大规模盈利的 LLM 应用。
既然说到“自由😈”,那肯定首先要说一下所谓的“越狱”。现在的大部分 SOTA 大模型抗越狱能力已经非常强了,一般的手段(比如能在网上随便搜到的各种让 AI 扮演外星人、侦探等等 prompt )早已无效,必须使用更激进的方式,比如“leetspeak”,即把英文中的字母做替换,如 e->3 。这种方法会极大地损害可读性,大幅增加 token 数(破坏了 tokenizer )从而导致价格升高速度降低,并降低性能( token 和数据集里大部分文本都对不上了),所以需要用这种方式的均直接排除。现在我知道的能用的 SOTA 级大模型只有以下四个:
这四个模型的个人体验:
![]() |
1
cheng6563 23 小时 17 分钟前
比写作你不带上 Claude ?
|
2
LaTero OP @cheng6563 最不自由的就数 Claude 了。别说写作了,有次我问它加密数据都被半拒绝了。聊天记录我已经清掉了,但它的回复大意就是用加密从政府隐藏信息是可能有害的,所以只能给我一点大致步骤,拒绝提供细节。
|
3
wxiao333 19 小时 1 分钟前
Deepseek 至少中文写作调教方面还是有点东西,写出来的内容很 drama ,有时候感觉在炫技。
|