普通非专业用户，可以通过哪些问题测试大模型的综合能力？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 83 天前的主题，其中的信息可能已经有所发展或是发生改变。

今天开始体验国产大模型 DeepSeek ，前端时间刷到了一些短视频、文章的介绍，对这块国产大模型的评价还是挺高的，美其名曰国产之光。那么想知道有没有一些问题可以简单测试不同大模型之间的综合能力的？大家可以踊跃讨论呀，可以作为收藏

4 条回复 • 2025-02-12 14:47:37 +08:00

CapNemo

83 天前

一套问题如果流行起来，很容易被针对优化。基本上是无解的。

ijk0

81 天前 via iPhone

GHvyuR7N

80 天前 via iPhone

问自己擅长的东西呀，判断是不是适合自己很重要，也很容易判断。

maymay5

63 天前

自己不需要的生产力，很强又有什么意义