可能是除了 ChatGPT 之外第一个搞出来的,使用方式很简单,调用时在 Prompt 中加入特定名称的 markdown 就行,类似这样:
```
这是谁画的
[GPT-4 Vision](
https://cdn.pixabay.com/photo/2023/10/07/23/39/girl-8301168_1280.png)
```
效果图:
甚至比直接用 ChatGPT 更灵活,在微软的 GPT-4v 测试报告中有 few-shot 场景,使用 ChatGPT 聊天框是复现不了的:
但是用 API 就可以做到文字和图片交错的能力,灵活度提高了。在官方识图 API 出来之前,可能是最好的替代品。复现下这个案例:
我们一直在做 GPT 相关各种功能,也有 Plus GPT-4 转 API 的工作,这次对接上识图功能,每天可以支持调用上百万次,有需求的大佬可以联系我: emhpZ3VvNjMwMA==