为什么 LLM 不擅长数饺子？

llm

数饺子

31 条回复

1

sillydaddy

39 天前

容易眩晕产生幻觉。你数你也晕。

2

xuchkang171

OP

39 天前

智能驾驶都 L3 了，GPT 都能像人似的视频通话了，LLM 对图片进行描述时也知道方位。LLM 识别图片时，肯定有每个物品的坐标信息，剩下的工作不是统计一下就行了吗？

3

xuchkang171

OP

39 天前

@sillydaddy 哈哈，数了不到十个，犯懒直接掏出 AI 想让 AI 让我数，结果发现平日里各个几乎无所不能的 LLM 却没一个能帮我数饺子。

4

paopjian

39 天前

你真把 LLM 当万能答题机了? 有专门数签子的 AI, 想数饺子要么找更强模型要么专门训练

5

mazyi

39 天前

130 个，chatgpt 的答案

6

chanlk

39 天前

你可以用大量的饺子图片去训练一个专属的数饺子 AI ，准确率可以极高, 训练出来的模型也很小，普通电脑都可以跑。

7

beixiao

39 天前

op 饺子🥟包的不错👍

8

defaw

39 天前

有数数用的专用模型，倒也犯不着直接用 vl 模型数数

9

xiadengmaX1

39 天前

LLM 和 CV 的区别

10

aogu555

39 天前

答案就在标题里，LLM 全称叫‌‌ [大型语言模型] （ Large Language Model ）

11

yaron1123

39 天前

现在多模态大模型的视觉编码器倾向于提取图像整体特征，对每个物品的坐标定位是差的

12

pkoukk

39 天前

因为 LLM 叫语言模型，不叫视觉模型，这个需求你可以找 cv

13

wclebb

39 天前

我放 ChatGPT 去数了，因不能粘贴 AI 答案。
意思说大概在 97 ～ 100 个左右。

14

LianOuPaiGuT

39 天前

@mazyi 一共 81 个,AI 都是瞎编的

15

yoyolichen

39 天前

看饿了

16

zhoujx

39 天前

我用豆包数了一下，回答是：图中饺子共 86 个。它们整齐地摆放在盖帘上，下面还有一盆饺子馅呢。

17

SmiteChow

39 天前

人工智障而已，不要抱有侥幸心理。

18

v2tex

39 天前

挺好，以后就拿这个图测试 AI 的智能程度

19

maojun

39 天前 via iPhone

我发现很多不了解 LLM 的人喜欢把它当作某种神力…数东西就找 cv 嘛

20

rmijzy

39 天前

72 个 -> grok

21

shenyiyouge

39 天前

@beixiao 你是南方人吧

22

wxiao333

39 天前

有一个 app 可以自动数竹签数量的（四川火锅串串常用），原理类似吧

23

beixiao

39 天前

@shenyiyouge 不是，北方人

24

LanhuaMa

39 天前

@beixiao #23 吃桌角吗

25

beixiao

39 天前

@LanhuaMa 我们那吃桌，不吃桌角

26

shenyiyouge

39 天前

@beixiao #23 青岛，在我们这里饺子包成这样要挨骂的

27

oxykr

39 天前 via iPhone

81=>我

28

MartinYANG06

39 天前

说明大规模语言模型+视觉模块的能力做的还不够优秀。

29

gesse

39 天前

很简单，没有训练过这么多饺子图+饺子数答案的问答。
即使抓遍互联网，估计也没有多少这两的训练素材。

如果要追求准确，可以自己编写几十万个素材集训练🐶🐶🐶，应该可以有效果

30

ggp1ot2

39 天前

> The image has been displayed. To count the number of dumplings in the image, I'll need to apply image processing techniques. Let me analyze it for you.
>
> The image contains approximately 941 dumplings. This count is based on the number of detected contours in the image.

来自 ChatGPT o3-mini

31

silencelixing

39 天前

有没有人告诉我正确答案应该是多少个？我懒得数了