2025-01-17 17:25:17 | 来源: AICG工具箱
把文字或者logo融入到自然风景中,这应该是一种很奇妙的体验,同时这也会为我们的设计作品带来不一样的闪光点!
Stable Diffusion文字融入图片,主要方法就是在正常文生图基础上用controlnet增加文字控制,下面我就将制作此类图片的整个过程记录下来,希望你也能轻松学会,并能举一反三,发扬光大。
话不多说,咱们马上开始~
01.文字图片准备
准备好你自己制作的黑白文字底图,图片的宽高比自行定义,效果如下:
02.模型准备
这里需要用到几个模型,模型我会放到网盘,文章末尾会有获取资料的方法。
1、大模型(写实)
realisticVisionV51_v40VAE.safetensors
02、controlNet的qrcode_monster模型control_v1p_sd15_qrcode_monster.safetensors
03、controlNet的brightness模型
control_v1p_sd15_brightness.safetensors
这里需要注意一下:qrcode_monster和brightness模型都有一个.yaml的配置文件。请将网盘中的四个文件全部下载下来放在stable-diffusion-webuiextensionssd-webui-controlnetmodels文件夹中。
03.参数设置
正面提示词:
This is a highly detailed photograph depicting the bustling daytime scenery of Hong Kong"s Victoria Harbor,with various cruise ships shuttling in and out of the sea,high-rise buildings,and blue sky,
当然也可以自己发挥,并不一定要一样。
负面提示词:常用的任意都行
采样方法:DPM++ 2M Karras
采样迭代步数:30
宽度:960.高度:540(尺寸根据你自己的实际需要,尺寸尽量不要太大,否则你的电脑会挂)
CFG:7
参数说明
控制权重:
数值范围从0到2.数字越大,文字融入图片就越强烈,数字越小,文字与图片融入就越和谐,这主要取决于实际作用效果。
引导介入时机:
数值范围从0到1.数字越大,开始介入时间就越晚,文字参与作画过程就越短;数字越小,开始介入时间就越早,文字参与作画过程就越长,同样也取决于实际作用效果。
引导终止时机:
数值范围从0到1.数字越大,终止介入时间就越晚,文字参与作画过程就越长;数字越小,终止介入时间就越早,文字参与作画过程就越短,同样也取决于实际作用效果。
弄清楚基本原理之后,我们就可以点击“生成”开始愉快的跑图了。
挑选到比较满意的图片后,点击图片下方的发送图像和生成参数到图生图选项卡进行放大处理。
将重绘幅度改成0.35.重绘幅度值越小,对画面重构范围就越小,反之越大。
脚本选择Ultimate SD upscale,目标尺寸类型选择Scale from image size,放大算法可以选择4x-UltraSharp,也可以选择R-ESRGAN 4x+,他们最终效果都差不多,但原理有所差别:4x-UltraSharp是把图片分成四个大小一样的区域进行分区渲染,所占用的内存比较小,而R-ESRGAN 4x+是整个图片一起渲染,所占用的内存量巨大,题主8G显存放大4倍时直接崩塌,而选择4x-UltraSharp放大时可以轻松完成。
将放大后的图拿到PS爱国版中稍加修饰,即可出图。这里放几张图供大家参考。
作者的公众号二维码丨扫一扫,关注我
知名一线互联网设计师
在这里我会不定时的分享一些设计经验和3D设计
热门榜单
Replika,ai伙伴
常用AICool Gift Ideas
常用AI文心一言
常用AIHi Echo — 网易有道
常用AI有道速读 — 网易有道
常用AI讯飞听见
常用AI快影
常用AIWPS AI
常用AI美图设计室
常用AI热门资讯
淘宝AI应用_淘宝问问AI导购助手_官方内测教程方法
01-03金山WPS AI新功能新玩法首发测评:不含水分,中文版「GPT+Office」真的来了!
01-07一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度丨Lumiere AI使用体验分享
12-30GPTs教程_怎么自己做GPTs_GPTs部署安装
01-15有哪些好用的大模型_SDXL大模型测评
01-03首批85个ChatGPT Plus插件全面测评:能打“五星”的插件只有6个
01-07国内首次2024全科高考AI测评开分:阿里通义、GPT-4o等七款大模型参与,文科进一本理科进二本
12-25实测阿里通义千问视觉大模型Qwen-VL Max「超大杯」:会读图、写代码,秒懂网络梗图,中文顶流性能视觉大模型
12-30Midjourney V6生图超进化!国外大神深度测评:对比V5.2版本,画质逼真骇人,人像细节不再有「AI感」
12-30谷歌Gemini引发争议!网友质疑宣传片疑似剪辑效果 夸大宣传丨实测对标GPT-4测评基准有失偏颇
12-30