V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
pagepan
V2EX  ›  程序员

为什么 AI 生成人物的手指大多都容易出问题呢?

  •  
  •   pagepan ·
    ifeiwu · 4 天前 · 3026 次点击

    这一个月来,我一直在使用腾讯的 Ima.Copilot 生成图片。虽然生成的场景大多都很出色,但人物的手指总是出问题,这让我很头疼。每次遇到手指变形的情况,我都不得不重新生成,但如果重新生成,又会失去原本很喜欢的场景。有没有人知道如何在生成人物时避免手指变形呢?谢啦!

    以下是三张手指出现问题的图片例子,看起来有些诡异。

    a2e926a0117562c65be3.png bbd61803f068922c9b81.png 7166a05f237aeec24aec.png

    30 条回复    2025-04-21 10:08:35 +08:00
    wsseo
        1
    wsseo  
       4 天前
    因为手指太复杂。不是建模
    django88888
        2
    django88888  
       4 天前 via iPhone
    有客户会看的这么仔细吗
    cheng6563
        3
    cheng6563  
       4 天前
    你先想办法给手指各个形态起个名字,方便标注,就能解决这问题了。
    crackidz
        4
    crackidz  
       4 天前
    请教一下你的 ima 怎么生成的图片...
    jadehare
        5
    jadehare  
       4 天前
    个人猜测是因为多个手指的问题,鼻子旁边是嘴巴,是脸颊是眼睛眉毛,ai 比较好判断怎么画。但是手指边上有好几手指,形态也很多,ai 判断不出来画的是食指还是小拇指,不知道还要再画几个手指。并且形态太多了,五官就是五官,但是手指可以说每张图的形态都不太一样。
    crackidz
        6
    crackidz  
       4 天前   ❤️ 3
    这个其实算莫拉维克悖论的范畴,有一个现象是人类所独有的高阶智慧能力只需要非常少的计算能力,例如推理,但是无意识的技能和直觉却需要极大的运算能力。所以好不好实现,你看他是否在所谓你一般认知里的高阶智慧能力就可以了,越简单的事情,AI 越不太容易做好
    runningowl
        7
    runningowl  
       4 天前
    画画的 AI 以为那玩意儿跟羽毛一样,多一点少一点没差别
    runningowl
        8
    runningowl  
       4 天前
    画画的 AI 以为那玩意儿跟羽毛一样,多一点少一点没差别
    cubeWX
        9
    cubeWX  
       4 天前
    就是信息颗粒度的问题
    haimall
        10
    haimall  
       4 天前
    @crackidz #4 画一张 xxxx
    haimall
        11
    haimall  
       4 天前
    你让它 生成时注意手指数量为 5 个
    katwalk
        12
    katwalk  
       4 天前
    ChatGPT 4o 的手好像稳多了,没那么容易出问题
    sentinelK
        13
    sentinelK  
       4 天前
    1 、手指占整个画面的比例小。
    2 、手指的几何形状复杂,很容易遮挡。
    3 、手指非常灵活,手又是人类很重要的与其他物体互动的部位。

    以上就导致了手部形态的统计学最优更难以找到。和盲人摸象一个道理。
    rekulas
        14
    rekulas  
       4 天前   ❤️ 1
    换个模型,很多新模型已经处理的不错了
    基于重绘功能,你可以只重绘手部,这样不会破坏其他地方
    DOLLOR
        15
    DOLLOR  
       4 天前
    一方面手确实很复杂,不同的观测角度和姿势,千变万化。
    另一方面,人类语言对“手”的描述却很贫乏又模糊,让 AI 建立起语言和“手”的各种姿势的对应关系不容易。
    jackmod
        16
    jackmod  
       4 天前
    手的姿态很多,分类复杂,那么相似分类的数据就会变少。所以可能是因为训练不到位。
    zhmouV2
        17
    zhmouV2  
       4 天前 via Android
    楼上说得很清楚了,以人像来说 一般正面侧面背面几个姿态就完事了,标注的也很清晰。但是手的形态千变万化任意摆放,标注的不清晰 很难对手进行拟合
    pagepan
        18
    pagepan  
    OP
       4 天前
    @crackidz 这样提示:“在中国,有一对现代夫妻和他们的女儿,他们的家虽然简陋,但却充满了幸福的氛围。生成一张图片 1280*768px”
    gpt5
        19
    gpt5  
       4 天前 via iPad
    4o 画手没问题,找人工标的。
    wuzhewuyou
        20
    wuzhewuyou  
       4 天前 via Android
    @pagepan 我第一眼以为是支付宝生日图
    hehe5120
        21
    hehe5120  
       4 天前
    第一张图里面墙上挂的照片好像也有问题,有 2 个妈妈?
    qfchannel
        22
    qfchannel  
       4 天前
    人类画画多手指也是很正常的
    mumbler
        23
    mumbler  
       4 天前
    模型能力太差,主流的画图模型早就解决这个问题了
    leo72638
        24
    leo72638  
       4 天前 via iPhone
    生成文字多半也不行,AI 图上如果有文字尤其是中文的都是乱七八糟
    LaTero
        25
    LaTero  
       4 天前
    latent space 的“分辨率”其实是很低的,尤其是你这种普通分辨率就已经偏低的图。最终图片里手指的宽度其实也就十几个像素,AI 眼里可能就是非常模糊的一坨。如果分辨率高并且手占画面比例非常大效果还是可以的。
    sNullp
        26
    sNullp  
       4 天前   ❤️ 2
    https://c7.io/system/media_attachments/files/111/483/502/362/637/133/original/7d3d10cc72a1ba2c.jpg

    这位是 Friedrich Ernst Waldemar ,普鲁士的瓦尔德马王子。这副肖像画是他的母亲,Victoria, Princess Royal (维多利亚长公主,https://en.wikipedia.org/wiki/Victoria,_Princess_Royal )画的。这幅肖像里小 Waldemar 是揣着手的,这是因为 Victoria 虽然绘画技巧已经很高(但不是专业画家),但不会画手。这让我想起来现在 AI 绘画画不好手,意料之外的相似性。

    我是在德国 Burg Hohenzollern 看到的这幅画的真迹。上面的信息也是讲解员告诉我的。他还说辛普森一家的创作者也画不好手,所以小黄人们都只有 4 个手指。

    Source: https://c7.io/@snullp/111483540721178227
    pagepan
        27
    pagepan  
    OP
       4 天前
    @leo72638 确实是这样
    pagepan
        28
    pagepan  
    OP
       4 天前
    @wuzhewuyou 不理解什么意思
    LieEar
        29
    LieEar  
       4 天前
    其实就是让人来画,手也是很难画好的部分。“画马难画走,画人难画手”
    CHTuring
        30
    CHTuring  
       2 天前
    @LieEar #29 确实,当时我学画画的时候也是最怕画手。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5073 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 08:24 · PVG 16:24 · LAX 01:24 · JFK 04:24
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.