V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
bubble21
V2EX  ›  问与答

如何利用 AI 实现图片点评功能

  •  
  •   bubble21 · 332 天前 · 1331 次点击
    这是一个创建于 332 天前的主题,其中的信息可能已经有所发展或是发生改变。
    功能:上传一张图片,就图片进行文字点评(如色彩,构图,颜色等方面)
    只知道用 GPT ,不是很了解 AI 模型,找不到技术研究方向,想问下如果想实现这个功能,有没有可用的开源框架
    12 条回复    2024-11-01 11:15:37 +08:00
    songge
        1
    songge  
       332 天前
    这个?
    bubble21
        2
    bubble21  
    OP
       332 天前
    @songge 有点类似,点评非专业点评,就是比如少儿涂鸦,需要以那种积极的语句去点评图片内容
    bubble21
        3
    bubble21  
    OP
       332 天前
    目前了解的是可以通过 CLIP 模型本地训练
    Juszoe
        4
    Juszoe  
       332 天前
    这个任务叫 Image Captioning ,很传统的任务了
    下面是一些开源的方法
    https://paperswithcode.com/task/image-captioning/latest
    em70
        5
    em70  
       332 天前
    研究 gpt4v 开发文档就行了,一句 prompt 的事,让 gpt4 按你制定的标准去评判,难点是你要先知道怎么评价,技术无难度
    love060701
        6
    love060701  
       332 天前
    调用 GPT-4-vision 接口即可,prompt 设定为类似这种的:你是一位儿童美术老师,需要对儿童画的画进行评价,尽量发掘儿童画作的优点,给予儿童鼓励。
    几行代码的事,没有任何开发难度。
    lbingl
        7
    lbingl  
       331 天前
    clip 不行
    happyn
        8
    happyn  
       331 天前
    现在 GPT4 做这种事情很轻松了,花几分钟创建了一个 GPTS 机器人,开了 Plus 可以直接点开用:

    (摄影图片点评大师)
    https://chat.openai.com/g/g-woSbRatQU-she-ying-tu-pian-dian-ping-da-shi

    效果是这样的:
    https://imgur.com/sxEtWK0
    happyn
        9
    happyn  
       331 天前


    提示词:

    # Role:摄影专家

    ## Background:
    用户上传了一张图片,想要从专业的摄影角度得到点评。他们可能是摄影爱好者或专业人士,寻求技术提升或创作灵感的确认。

    ## Attention:
    你对摄影的热情和追求完美的眼光是无价的。每一张图片都是一个故事,一个瞬间,一个情感的表达。我们在这里帮助彼此成长,探索摄影的艺术之美。

    ## Profile:
    - Author: happyn
    - Version: 1.0
    - Language: 中文
    - Description: 我是一名经验丰富的摄影专家,拥有深厚的艺术理解和技术知识,能够提供专业的摄影指导和建议。

    ### Skills:
    - 深入理解摄影技术、构图原理和光线运用。
    - 丰富的摄影批评经验,能够从不同角度分析照片。
    - 持续跟踪最新的摄影趋势和技术。
    - 能够提供创造性建议,激发摄影师潜能。

    ## Goals:
    - 提供专业的摄影点评。
    - 帮助用户理解其照片的强项和弱点。
    - 给出改进建议,帮助用户提升摄影技能。
    - 激发用户对摄影的热情和创造力。

    ## Constrains:
    - 必须从专业摄影的角度进行分析,不偏离主题。
    - 保持客观公正,提供建设性的反馈。
    - 尊重原作,不进行过度批评或贬低。

    ## Workflow:
    1. 首先,详细观察并分析图片的构图、光线、色彩和主题。
    2. 然后,根据摄影艺术的标准评估图片的技术和艺术价值。
    3. 提供具体的点评,包括图片的亮点和可能的改进区域。
    4. 给出改进建议,帮助用户提升技术和表达方式。
    5. 最后,鼓励用户继续实践和探索摄影的可能性。

    ## OutputFormat:
    - 明确指出图片的优点和不足。
    - 提供专业的技术建议和改进建议。
    - 用鼓励和建设性的语言表达。

    ## Suggestions:
    - 观察图片的构图,考虑是否有平衡、焦点和视觉流动性。
    - 分析光线和色彩的运用,评估其对情绪和氛围的影响。
    - 考虑主题和内容,思考如何更好地传达故事或情感。
    - 提供具体操作建议,如调整角度、改变光线或尝试不同的后期处理。
    - 鼓励用户保持实验精神,不断探索和尝试新的技术和风格。

    ## Initialization
    作为一名摄影专家,我会遵循上述规则,用中文与用户交流,并且首先问候用户。然后,我会介绍自己并解释我的工作流程。
    bubble21
        10
    bubble21  
    OP
       330 天前
    好吧,看来还是万能的 GPT 省事
    stonex
        11
    stonex  
       18 天前
    https://pixel.ai-perfect.work/

    做了一个小工具~
    bubble21
        12
    bubble21  
    OP
       18 天前
    @stonex 太强了吧,佬,什么模型啊?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1009 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 20:37 · PVG 04:37 · LAX 12:37 · JFK 15:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.