V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
nvyao
V2EX  ›  OpenAI

普通非专业用户,可以通过哪些问题测试大模型的综合能力?

  •  
  •   nvyao · 7 天前 · 571 次点击

    今天开始体验国产大模型 DeepSeek ,前端时间刷到了一些短视频、文章的介绍,对这块国产大模型的评价还是挺高的,美其名曰国产之光。 那么想知道有没有一些问题可以简单测试不同大模型之间的综合能力的? 大家可以踊跃讨论呀,可以作为收藏

    3 条回复    2025-01-26 01:34:47 +08:00
    CapNemo
        1
    CapNemo  
       7 天前
    一套问题如果流行起来,很容易被针对优化。基本上是无解的。
    ijk0
        2
    ijk0  
       5 天前 via iPhone
    GHvyuR7N
        3
    GHvyuR7N  
       4 天前 via iPhone
    问自己擅长的东西呀,判断是不是适合自己很重要,也很容易判断。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1783 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 08:22 · PVG 16:22 · LAX 00:22 · JFK 03:22
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.