笑话大全网 - 笑话小品 - 划掉你做过的图片素材——如何还原涂鸦照片

划掉你做过的图片素材——如何还原涂鸦照片

你做了什么,把照片划掉了?在载文之前,简单说两句:

AI画图在22年刚出来的时候被关注和尝试了一段时间,很快就被抛弃了。没有他,卖家的秀和买家的秀差别太大。看着自己生成的垃圾图,和别人生成的精美画作对比,真的是一种说服。直到最近ControlNet刷了一波屏,觉得离可用的制作工具又近了一步,才被重新研究。事实证明,短短几个月,整个AI画的进度速度真的让我背脊发凉。大家都在疯狂的用AI做地图,玩新工具(Controlnet),玩插件(LORA,Dreambooth,Hypernetwork),玩模型(ChilloutMixdddd),但是关于哔哩哔哩和知乎使用StableDiffusion却没有系统的介绍,这让我一时有点迷茫。

这篇新手教学文章引用自

本网站强烈建议初学者阅读本网站下的每一篇文章。可以说涵盖了StableDiffusion最高级使用的方方面面,让你以最快的速度了解最新的机型、插件、原理、技术和使用方式。

提示是AI画图中最重要的输入控制项,也就是有很多定制的模型可以让你更直接更简单的生成特定风格的图像。你仍然需要写一个好的提示来获得一个值得展示的图像。我相信大部分中国用户和我一样,大概都是英文读3星写0星的玩家。看别人改别人的提示也可以。如果是自己写的,除了veryverybeautiful__,你就想不出别的词了。这篇基础教学文章通过对关键词进行分类,让你更清楚地知道应该使用或查询哪些词来构建你需要的图像。此外,本文还介绍了关键词加权、混合等非常实用的技巧,以及SD如何理解你的输入词汇等基础知识。相信无论你是想修改提示还是自己从头开始写,无论你是新手还是老手,即使你已经开始使用chatGPT辅助生成提示,这篇文章还是非常值得一读的。

本文原文链接为

以下为文字翻译,请勿转载:

StableDiffusionprompt:adedefinitiveguide

知道如何构造一个优秀的提示,是每个SD用户首先要学习的。本文通过总结实验和以往的经验,给出了构造指令的方法和相关技巧。总之,在这篇文章中你会学到所有关于提示的信息。

什么是优秀的提示指令?

一份优秀的提示说明书应该详细而具体。一个好方法是在关键词分组列表中找到一个符合你需求的词。

关键词分组如下:

1.科目

2.绘画媒介

3.绘画风格

4.艺术家姓名

5.网站(全球资讯网的主机站)

6.解决

7.详细描述(附加详细信息)

8.颜色

9.照明设备

在实际编写的一组提示指令中,没有必要包含上述各组中的所有关键字。你只需要把这个分组列表当成一个提示列表,知道在添加新的提示时如何选择。

接下来,我们将对这些组中的关键字逐一进行测试,下面的测试将使用默认模型sdv1.5basemodel。为了明确每个关键字的功能,测试中不会使用negativeprompts。但是不要担心,我们将在文章的后面学习如何使用否定提示指令。下面的图片都是用30步,DP M++2mkarasampler,512x704分辨率参数生成的。翻译注意:后续翻译文章中使用的图片并非原文中的图片,而是译者本人使用Colab上的基本模型转载的,以防作者乱说。其中CFG为7,batch count = 8,Seed使用随机设置-1,选中Restoreface,通常会生成三次或更多次来选择可用的示例图。另外,与作者不同的是,我增加了“截,裸”的负面指令,以提高提款率,规避审核风险。

科目

主体代表你在图片中看到的实体。写说明书的时候,最常见的错误就是缺少足够的实体关键词。

例如,我现在想生成一张asorceresscastingmagic的图片。一个新的SD播放器可能会写这个

女记者

这样写是可以的,但是留下的想象空间太大了。这个女巫长什么样?能有什么词形容她能让她看起来更清晰吗?她穿的是什么?她释放了什么魔法?她是站着、跑着还是飘在空中?图像的背景是什么?

StableDiffusion无法读取我们的想法,我们必须说出我们需要的所有细节。

对于人物来说,一个常见的技巧就是使用明星的名字,因为这些单词会对输出结果产生很强的作用,也是控制输出主体外观的一个非常好的方法。但需要注意的是,使用这些名称不仅会导致输出结果的面貌发生变化,还会导致输出同质的姿势、风格等物体。这一点会在文章后面的“关联效应”章节详细介绍。

举个例子,我们先把这个女巫做成EmmaWatson的样子,Emma Watson也是SD中使用最广泛的关键词。我们希望这个女巫充满力量和神秘,使用闪电魔法。她的造型充满了细节。看看能不能生成一些有趣的图片。

EmmaWatsonasapowerfulmysterioussorceress,铸造发光魔术,细节服装

EmmaWatson在模型中是如此的常见和有效。我觉得SD用户这么喜欢用她的名字,是因为她看起来很优雅,很年轻,同时她在目前互联网上的大部分图片中的形象也是一致的。相信我,不是所有的女演员都这样,尤其是活跃在90年代甚至更早的女演员。

绘画介质(中等)

媒体代表用来制作绘画的材料。举一些例子比如插画,油画),3d渲染,摄影。媒体关键词对输出结果也有很强的影响,一个相关词汇的修改会改变整个输出结果的风格。

再加一个相关的关键词,digitalpainting。

EmmaWatsonasapowerfulmysterioussorceress,铸造发光魔法,细节服装,数码绘画

输出结果变成了我们想要的风格!图片从照片变成了数码画。

绘画风格

风格代表一种绘画艺术风格,如印象派、超现实主义、波普艺术等。

让我们试着在说明中添加一些风格关键词:超现实主义、幻想、超现实主义、全身。

EmmaWatsonasapowerfulmysterioussorceress,铸造发光魔法,细节服装,数码绘画,超现实主义,幻想,超现实主义,全身

嗯(表示踌躇等)...很难说这些词对结果的影响有多大,也许是因为这些风格关键词已经被前面的关键词暗示了。但是看起来留住他们是没有问题的。

艺术家(艺术家)

艺人名字也是影响权重很高的关键词。通过指定艺术家的姓名,您可以使您的输出与其特定的艺术风格相匹配。此外,许多艺术家的名字通常被用来获得一个混合的艺术风格。接下来,我们将添加两个艺术家关键词:超级英雄漫画家StanleyArtgermLau和19世纪的肖像画家AlphonseMucha。

EmmaWatsonasapowerfulmysterioussorceress,castinglightningmagic,细节服装,数码绘画,超现实主义,幻想,超现实主义,全身,by Stanley artgermlauandalphonsemucha

我们可以看到,这两位艺术家的绘画风格结合起来,效果非常好。夏目是一位非常著名的画家。在我非专业的认知里,他可以算是塔罗牌画风的创始人。他的画有一种突出的古典、巴洛克和图形风格,这是另一位画家所不熟悉的。在生成的示例图中,您可以看到木下的风格非常引人注目。这里我在做样图的时候把闪电的英文单词拼错了,所以大家可以看到生成的图中基本没有闪电,但是因为木下+艾玛真的很好听,我就不改了。

网站名称(网站)

像Artstation、DeviantArt这样的图片收集网站,已经聚集了大量流派明确的图片。加入这样的关键词可以让我们的输出结果收敛到网站上图片的艺术风格。

EmmaWatsonasapowerfulmysterioussorceress,castinglightningmagic,细节服装,数码绘画,超现实主义,幻想,超现实主义,全身,by Stanley artgermlauandalphonsemucha,artstation

看起来变化不大,但生成的图片确实像你在Artstation上能找到的那张。翻译注:我不确定作者所说的网站是重刻过程中有效的关键词类别。当我在webui中输入artstation时,token的数量从43变成了45,我非常怀疑模型把它拆分成两个字:art和station作为输入(原因见文章后面“指令可以有多长”一章)。另外,网站本身风格多样,我不太明白会对输出结果有什么影响。我会在下面的例子中删除这个关键词,防止造成不好的影响。至于和上一节相比的闪电,那只是因为我把闪电的拼写纠正正确了。

分辨率(分辨率)

锐度表示输出图像的锐度和细节。我们尝试添加这两个关键词:highlydetailed,sharpfocus。

EmmaWatsonasapowerfulmysterioussorceress,castinglightningmagic,细节服装,数字绘画,超现实主义,幻想,超现实主义,全身,bystanley artgermlauandalphonsemucha,artstation,highlydetailed,sharpfocus

嗯,好像没多大作用。应该是之前的图经过了锐化和细化,不过加进去也没什么坏处。

附加详细信息(附加详细信息)

细节描述是调整画面的调味。我们尝试加入sci-fi(科幻)、stunninglybeautiful(美丽)和反乌托邦(反乌托邦),对形象做一些调整。

EmmaWatsonasapowerfulmysterioussorceress,castinglightningmagic,细节服装,数字绘画,超现实主义,幻想,超现实主义,全身,bystanley artgermlauandalphonsemucha,artstation,highlydetailed,sharpfocus,科幻,绝美,反乌托邦

颜色(彩色)

通过添加颜色关键字,您可以控制图像的整体颜色。您添加的颜色可以用作整个图像的色调或某个对象的颜色。

我们试图通过使用关键字虹彩黄金给图像添加一点金色。

EmmaWatsonasapowerfulmysterioussorceress,castinglightningmagic,细节服装,数字绘画,超现实主义,幻想,超现实主义,全身,bystanley artgermalauandalphonsemucha,artstation,highlydetailed,sharpfocus,科幻,绝美,反乌托邦,彩虹色

黄金效果非常好!

照明(照明)

所有摄影师都会告诉你,一部电影的要素之一就是灯光。光照关键词对生成的图片也有很大的影响。让我们试着在说明书中加入电影灯光和黑暗。

EmmaWatsonasapowerfulmysterioussorceress、castinglightningmagic、细节服装、数字绘画、超现实主义、幻想、超现实主义、全身、bystanley artgermlauandalphonsemucha、artstation、highlydetailed、sharpfocus、科幻、美轮美奂、反乌托邦、彩虹色、电影灯光、黑暗

以上,我们已经完成了整个演示的提示指令的构建。

摘要

也许你已经注意到,仅仅在基本的目标对象上添加几个关键词,就已经可以生成一个很好的图像了。构建StableDiffusion的输入指令通常不需要添加太多的关键字。

否定提示

负面提示指令是另一个非常有效的调整图像的输入。你可以通过输入你不想要的而不是你想要的来调整图像。负面提示指令不仅可以排除实物,还可以是风格或其他不想要的图像特征(如丑陋、变形)。

如果你用的是二代模型版SD(注:目前大部分人用的是一代模型版1.4/1.5),那么负提示指令是必选项,否则你得到的图像会比一代模型版差很多。对于第一代版本,负命令是可选的,但实际使用时会设置。毕竟,即使负命令没有提高图像的效果,也不会对其造成任何伤害。

我将使用一般的否定提示指令。您可以在本文中了解更多关于它的原理和更详细的用法。

丑陋、平铺、手下垂、脚下垂、脸下垂、脸歪、脸歪、四肢外、毁容、变形、身体歪、人体解剖、水印、签名、截止、低对比度、曝光不足、曝光过度、脸歪、初学者、业余、脸歪、模糊、草稿、粒状

可以看出,否定提示指令使图像中的主体更加突出,不会显得过于平淡。

构建良好指令的过程

迭代构造

您应该使用迭代过程来构建提示指令。正如前面的例子所展示的,随着关键字一个接一个地添加到正文中,我们最终可以生成很棒的图片。

我总是从简单的说明开始,只包含主题、媒介和风格等关键词。生成至少4张图片来观察结果。这些基本指令大部分在100%的情况下无效。你需要对你使用的基本关键词有一些统计上的认识。

在迭代过程中,一次最多添加2个关键词,也至少生成4张图来观察效果。

使用否定提示命令

使用一般的否定提示指令总是一个可靠的开始。

否定提示指令加关键词也是迭代造句的一部分。这些负面关键词可以是你想在图像中避免出现的物体或身体部位。(由于第一代机型不太擅长渲染手部,所以通过在负指令中加入关键字“手”直接隐藏在图像中也是不错的选择。)

提示说明书写作技巧

您可以调整关键字的影响因子,也可以控制在特定采样步骤后切换关键字。

自动111 GUI翻译可以使用以下语法注意:是stable-difference-webui。您可以在Colabnotebook上使用该工具,或者将其部署到您的本地Windows或Mac计算机上。

关键词权重

(这个语法可以用在webui中。)

你可以用语法`( keyword: weight)`来控制关键词的影响因素。权重是一个数值,小于1表示重要性低,大于1表示重要性高。

例如,我们可以在下面的指令中为关键字dog增加权重。

狗,秋天巴黎,华丽,美丽,大气,共鸣,雾,烟,火,烟囱,雨,潮湿,原始,水坑,融化,滴水,雪,小溪,郁郁葱葱,冰,桥,森林,玫瑰,花,bystanleyartgermlau,gregrutkowski,thomaskindkade,alphonsemucha,loish,normanrockwell。

增加狗的重量会导致更多的狗出现在图像中,反之亦然。并非所有的图像权重都有这样的效果,但在大多数情况下,您可以预期权重会有这样的效果。

这种技术不仅可以用于主要关键字,还可以用于所有关键字类别,如风格或照明。

()和[]语法

(这个语法可以用在webui中。)

()和[]是相当于调整关键词权重的语法。(关键词)'会将括号中的关键词权重增加1.1倍,相当于'(关键词:1.1)'。【关键词】“将括号中的关键词权重降低到0.9倍,相当于“(关键词:0.9)”。

你可以像代数公式一样使用多个括号来倍增权重效果。

(关键字):1.1

((关键字)):1.21

(((关键字))):1.33

同样,使用多个括号的效果如下:

【关键词】:0.9

[[关键词]]:0.81

[[[关键字]]]:0.73

关键词混合

(这个语法可以用在webui中。)

你可以混合使用两个关键词,这就是所谓的promptscheduling。语法如下:

[关键词1:关键词2:影响因子]

“影响因子”控制哪一步采样提示指令中的关键字1将切换到关键字2,关键字2是一个介于0和1之间的参数。

例如,使用以下说明

油画肖像[JoeBiden:DonaldTrump:0.5]

将输入的步长参数设置为30。

这意味着在生成过程的前15个步骤中使用以下指令。

油画肖像

在步骤16到30的下一个生成过程中,指令将变成如下。

油画肖像

影响因素参数将决定关键词何时改变。在上面的例子中,它将在30步x 0.5 = 15步之后执行。

调整影响因子的效果可以看做是不同程度地混合了两位总统的肖像。

你可能注意到了,川普穿白色西装,更喜欢拜登的服装搭配,这其实说明了关键词混搭中一个很重要的规律:关键词1决定了整体的混搭效果。扩散的生成步骤越早,对图像整体混合结果的影响越大,而后期的生成步骤只负责逐渐改善细节。

小测验:如果把上面例子中的JoeBiden和DonaldTrump反过来,你觉得生成的图片会怎么样?

面部融合

关键字混合常用于借用两个不同的明星来创建一个新的面孔。例如,[艾玛·沃特森:琥珀听说:0.85],40步,会产生一张介于之间的脸:

[Emma Watson:amber heard:0.85]油画,背景模糊,优雅

选择两个合适的名字,调整参数,就可以得到我们想要的外观。

破产版本提示对提示

利用关键字混合,可以得到类似于prompt-to-prompt的效果,即通过编辑生成一对高度相似的图像。以下两幅图使用了相同的提示指令,只是使用了命令调度语法将苹果替换为火焰,两幅图的种子和步骤的参数设置也是相同的。注:此处使用的示例图片为本人制作,与原文不符。提示指令改成用火球代替苹果,主要是因为火焰不是很有效。

【Emma Watson:amber heard:0.75】holding an【苹果:火球:0.9】,shiningbokehdepthoffieldbackground背景,经典,油画,人像,优雅,upperclass,红唇,耳挂。步骤:40,采样器:DPM++2MKarras,CFGscale:6,种子:805277495

混合因子需要微调。具体是怎么操作的?其背后的理论是,输出图像的整体效果是由早期的扩散过程决定的。当扩散过程开始集中在更小的区域时,切换任何关键词都不会对图像的整体结果产生很大的影响。这使得以这种方式仅改变图像的一小部分成为可能。

指令可以有多长?

指令长度取决于您使用的StableDiffusion应用程序,该应用程序可能会限制提示中的关键字数量。在SD生成的基本版本中,指令被限制为75个令牌。

应该注意的是,记号不同于单词。SD使用的CLIP模型会自动将提示指令转换成一组单词,即模型已知单词的数字表示。如果使用模型不知道的单词或短语,该单词将被分成两部分。