一、最常用的基础模块
1. 模型加载模块
用于加载模型和权重,是任何工作流的起点。
Checkpoint Loader
加载 Stable Diffusion 主模型(包括 UNet、VAE、CLIP)。
- UNet:负责图像生成的“骨干网络”。
- CLIP:负责解析提示词,把文字转成模型能理解的条件向量。
- VAE:负责潜空间 ↔ 像素空间的相互转换。
LoraLoader
加载 Lora 模型,对主模型进行微调,实现特定风格、人物、服装效果。
CLIP是OpenAI开源的神经网络模型,它可以将自然语言和视觉信息进行联合训练,从而实现图像和文本之间的跨模态理解
2. 文本与条件模块
决定生成图像的“内容”和“风格”。
- CLIP Text Encode
把正面提示词、负面提示词转成条件向量。
- Conditioning Combine / Conditioning Set
用来组合多个提示条件,比如同时加入风格 Lora、提示权重、引导参数。
- ControlNet Loader + ControlNet Apply
用来加载并应用 ControlNet,比如姿势参考、草图参考、深度图参考。
3. 采样模块
真正“画图”的地方,决定生成的细节质量和风格。
KSampler
最常用的采样器模块,输入模型、条件、种子、步数,输出潜空间图像。
主要参数:
- steps:迭代步数,越多细节越好,但速度更慢
- cfg scale:提示词遵从度,数值高则更贴近提示词
- sampler_name:采样算法,比如 Euler、DPM++ 等
4. 图像处理模块
处理输入和输出图像,让结果更符合预期。
- Load Image / Save Image
读取和保存图像。
- Image Resize / Crop / Scale
调整图像大小、裁剪比例。
- Mask 操作
生成、修改、组合遮罩,用于局部重绘或精修。
5. 潜空间与解码模块
把生成好的潜空间转成可看的图像。
- VAE Decode
把潜空间解码成普通图像。
- VAE Encode
把普通图像编码到潜空间,常用于图生图、Inpainting。
6. 预览与调试模块
- Preview Image
在界面中直接预览结果。
- Queue Prompt / Execute Workflow
执行整个工作流,批量运行生成。
7. 组合与高级模块
- Compositor
多图层组合、混合、叠加。
- Conditioning Strength
调整提示条件权重,灵活控制图像生成风格和细节。
- Latent Noise / Latent Mix
修改潜空间噪声,控制生成随机性和多样性。