假期玩了一下 stable diffusion 以及各种衍生 AI ;貌似现在生成质量最好的是 NovelAi ,由于投喂了大量二次元图片训练出的模型,在生成图片速度和质量上勉强可以打败中下水平画师了;感觉以后插画行业开始卷机器人了;
由此也衍生出来一个问题,如何精确的描述关键字,来生成满足需求的图片,已经变成一门复杂的咒术学问;以前 AI 训练自嘲说是炼丹,现在看来是互相炼;炼丹者和 AI 互相投喂,来提高丹药质量。
比如我在知乎上看到一个典型的赛博咒术:
{{{masterpiece}}}, best quality, illustration,dark background, sunlight, beautiful detailed eyes, 1girl, expressionless, blue eyes, {{{white short hair}}}, {{wavy hair}},{{{dishevled hair}}}, messy hair, long bangs, hairs between eyes, {{{{white bloomers}}}},{{open clothes}}
生成如下图片:
那么这个炼丹步骤已经需要非常熟练的咒术咏唱技巧了;记得当年有个科幻小说叫<真名实姓>,讲述技术发展到一定阶段,就好像比拼巫术一样,现在 AI 已经往这个方向走了;
那么,现在有没有专门系统研究赛博魔咒的书籍可供学习呢?
1
fqwl 2022-10-10 21:57:25 +08:00
前两天我有了个和楼主很像的想法,不过我想到的名字是现代魔法教程。
|
2
Puteulanus 2022-10-10 21:59:55 +08:00 1
色图炼金术师
|
3
yzqtdu 2022-10-10 22:11:12 +08:00
prompt engineer ,我猜玄学 prompt 以后会更加规范
|
4
renmu 2022-10-10 22:20:02 +08:00 via Android
这个大括号是啥含义
|
5
iloveoovx 2022-10-10 22:21:58 +08:00
当然有了,都整理成册了。
dallery.gallery/the-dalle-2-prompt-book/ 另外,艺术相关依然需要学,艺术史之类变得更加重要。咒术来自于哪,不还是艺术史,艺术家们的行业术语。普通人都不知道怎么描述他们想表达的画面。 |
6
7zlid 2022-10-10 22:23:36 +08:00 via Android
游吟歌者
|
7
memorybox OP @Puteulanus 不光是人像,我的理解是二次元的图像质量高的数据集比较好找,所以投喂出来 NovelAI 的模型;理论上只有有足够高质量的数据集,各类图像模型都能投喂出来;
@renmu 大括号增强关键字权重 |
10
lithiumii 2022-10-18 14:38:54 +08:00 via Android
这些至少还是人话(英语),某些 linux 命令看起来才像咒语吧……
|