今天开始体验国产大模型 DeepSeek ,前端时间刷到了一些短视频、文章的介绍,对这块国产大模型的评价还是挺高的,美其名曰国产之光。 那么想知道有没有一些问题可以简单测试不同大模型之间的综合能力的? 大家可以踊跃讨论呀,可以作为收藏
1
CapNemo 7 天前
一套问题如果流行起来,很容易被针对优化。基本上是无解的。
|
2
ijk0 5 天前 via iPhone
看看 livebench.ai
|
3
GHvyuR7N 4 天前 via iPhone
问自己擅长的东西呀,判断是不是适合自己很重要,也很容易判断。
|