解密AI绘画与修图:Stable Diffusion+Photoshop_王岩;王希竹 编著_AZW3_MOBI_EPUB_PDF_电子书(无页码)_王岩;王希竹 编著
内容节选
4.1任意转换图片风格 在文生图中,我们通过文字描述想要的内容,然后从模型库中抽取符合描述的图片。然而,文字承载的信息量有限,即使编写了大段提示词并且调整了各种语法权重,也很难让AI准确理解。AI就算理解了,也未必能生成令人满意的图片,因此会导致大量时间都花费在反复尝试的过程中,俗称“抽卡”。 俗话说一图胜千言。图像本身承载了丰富的信息,包括角色、构图、配色等,因此AI无须理解画面的内容,只需从参考图中提取像素信息,然后将其作为特征向量映射到生成结果上,就能最大程度地还原,让生成的图像更加稳定和准确。图生图主要有三个作用:一是风格迁移,二是高清重绘,三是修复和放大。在本节中,我们将介绍如何使用图生图功能进行图片风格迁移。 单击WebUI上方的“图生图”选项卡,除了多出一个图像窗口外,其余的选项、参数和“文生图”没有太大区别。在图像窗口上单击,上传一张照片,如图4-1所示。我们的目标是把这张照片重绘成手绘风格的头像。 在“重绘尺寸”选项组中,单击 按钮。根据参考图的分辨率设置生成图片的尺寸,锁定宽高比后将宽度设置为512,如图4-2所示。 ▲图4-1 图4-2 接下来,使用不同风格的大模型分别生成图片,确保参考图中的人物、背景和动作都能得到还原,如图4-3所示。当前的生成结果可能比较粗糙,但这一步的主要目的是寻找满意的画风,并确定适合的大模型。 图4-3 “重绘幅度”是图生图中最重要的设置参数,它决定了参考图被重画的程度。通过图4-4可以看到,当“重绘幅度”参数值低于0.4时,重绘的图片只会发生细微变化;当数值在0.5到0.7之间时,重绘的图片逐渐迁移成大模型的风格;而当数值超过0.8以后,角色的面容和服饰开始偏离参考图。 图4-4 图生图实质上就是利用大模型重新绘制参考图。在这个过程中,仍然需要使用提示词,特别是画质提示词和反向提示词,以避免抽取到低画质的种子。单击“生成”按钮下方的 和 按钮可以根据参考图中的内容反推提示词。CLIP算法反推出来的是自然语言,偏向于描述图片包含的内容;而DeepBooru算法反推出来的是词组和短语,偏向于描述图片的分类,如图4-5所示。 图4-5 由于反推模型损坏,一些用户单击这两个按钮后,会在提示词栏中出现错误提示,解决方法可以查看随书附赠素材中的说明文档。此外,我们也可以单击WebUI上方的“WD1.4标签器”选项卡,上传参考图后自动反推提示词,如图4-6所示。 图4-6 在“反推”下拉菜单中,一般选择速度较快的“wd14-vit-v2-git”模型,或者是精度比较高的“wd14-swinv2-v2-git”模型;“阈值”参数用来设置侦测图片特征的灵敏度,数值越小灵敏度越大,反推出来的提示词越多,如图4-7所示。 接下来,单击“发送到图生图”按钮,将提示词复制到“图生图”选项卡。在“生成”按钮下方的预设样式下拉菜单中选择“基础起手式”,然后单击 按钮以载入提示词。随后,调整质量提示词和反向提示词的权重,并输入画风提示词,如图4-8所示。 ▲图4-7 图4-8 单击“重绘尺寸倍数”选项卡,利用“尺度”参数提高生成结果的分辨率,如图4-9所示。然后生成图片,其效果如图4-10所示。 ▲图4-9 图4-10 希望生成结果更贴近原图时,可以展开“ControlNet”可折叠面板,勾选“启用”和“完美像素模式”复选框。在“控制类型”选项组中单击“Scribble/Sketch(涂鸦/草图)”单选按钮,把“控制权重”参数设置为0.5,如图4-11所示。 图4-11 继续在“ControlNet单元1”中勾选“启用”和“完美像素模式”复选框,然后单击“Depth(深度)”单选按钮。在“预处理器”下拉菜单中选择“depth_zoe”,如图4-12所示。再次生成图片,效果如图4-13所示。 ▲图4-12 图4-13 勾选模型上方的“Refiner”复选框。如果感觉手绘风格太强,可以在“模型”下拉菜单中选择一个具有真实感的大模型;如果感觉手绘风格太弱,可以选择卡通风格更强的大模型。这个选项相当于把两个大模型的效果融合到一起。而“切换时机”参数决定第二个大模型何时参与到生成图片的采样中,如图4-14所示。生成图片,效果如图4-15所示。 ▲图4-14 图4-15 要将卡通图片转换成真人照片比较简单。首先上传图片,然后进行提示词反推;接着,输入常用的反向提示词,如图4-16所示。 图4-16 选择一个真人风格大模型,然后将“重绘幅度”参数设置为0.6。根据参考图的宽高比设置重绘尺寸。接着,继续单击“重绘尺寸倍数”选项卡,将“尺度”参数设置为2,把生成尺寸放大1倍,如图4-17所示。然后生成图片,其效果如图4-18所示。 ▲图4-17 图4-18 我们还可以使用SDXL Styles插件,一键切换任意画风。在Web......
- 信息
- 内容简介
- 前言
- 第1章 常用AI图像生成工具简介
- 1.1 Midjourney
- 1.2 DALL-E 3
- 1.3 Stable Diffusion
- 1.4 文心一格
- 1.5 在线版图片生成网站
- 第2章 Stable Diffusion的基本运用
- 2.1 启动器和硬件要求
- 2.2 编写正反提示词
- 2.3 提示词进阶用法
- 2.4 文生图参数详解
- 2.5 安装和管理模型
- 2.6 修复生成的图片
- 2.7 提示词辅助插件
- 第3章 精确制导武器ControlNet
- 3.1 定义角色的姿势和动作
- 3.2 风格迁移和线稿上色
- 3.3 深度图和法线贴图
- 3.4 生成一致性的角色
- 3.5 把光影融入图片中
- 3.6 图片的修复和改造
- 3.7 使用多重控制网络
- 第4章 Stable Diffusion进阶玩法
- 4.1 任意转换图片风格
- 4.2 使用局部重绘功能
- 4.3 涂鸦和涂鸦重绘
- 4.4 超分辨率放大图片
- 4.5 小显存运行SDXL
- 4.6 加速SDXL大模型
- 4.7 测试参数和提示词
- 第5章 Stable Diffusion实用插件
- 5.1 容量无限的风格宝库
- 5.2 批量更换服装和发型
- 5.3 图片和视频一键换脸
- 5.4 打造会说话的数字人
- 5.5 真人视频转换成动漫风格的视频
- 5.6 提示词生成流畅动画
- 5.7 快速打造瞬息全宇宙
- 第6章 把Stable Diffusion集成到Photoshop中
- 6.1 用插件打通Photoshop和Stable Diffusion
- 6.2 使用技巧和注意事项
- 6.3 手绘草图转精美图片
- 6.4 语义分割识别万物
- 6.5 制作艺术字和海报
- 6.6 创成式填充和外绘扩图
- 6.7 老旧照片修复上色
- 第7章 AI绘图实战案例及模型推荐
- 7.1 打造影楼级AI照片
- 7.2 个人虚拟形象定制
- 7.3 小说推文封面设计
- 7.4 制作写真和杂志封面
- 7.5 电商产品展示图设计