目录

ComfyUI基础模块讲解

一、最常用的基础模块

1. 模型加载模块

用于加载模型和权重,是任何工作流的起点。

Checkpoint Loader

加载 Stable Diffusion 主模型(包括 UNet、VAE、CLIP)。

  • UNet:负责图像生成的“骨干网络”。
  • CLIP:负责解析提示词,把文字转成模型能理解的条件向量。
  • VAE:负责潜空间 ↔ 像素空间的相互转换。

LoraLoader

加载 Lora 模型,对主模型进行微调,实现特定风格、人物、服装效果。

CLIP是OpenAI开源的神经网络模型,它可以将自然语言和视觉信息进行联合训练,从而实现图像和文本之间的跨模态理解

2. 文本与条件模块

决定生成图像的“内容”和“风格”。

  • CLIP Text Encode

把正面提示词、负面提示词转成条件向量。

  • Conditioning Combine / Conditioning Set

用来组合多个提示条件,比如同时加入风格 Lora、提示权重、引导参数。

  • ControlNet Loader + ControlNet Apply

用来加载并应用 ControlNet,比如姿势参考、草图参考、深度图参考。

3. 采样模块

真正“画图”的地方,决定生成的细节质量和风格。

KSampler

最常用的采样器模块,输入模型、条件、种子、步数,输出潜空间图像。

主要参数:

  • steps:迭代步数,越多细节越好,但速度更慢
  • cfg scale:提示词遵从度,数值高则更贴近提示词
  • sampler_name:采样算法,比如 Euler、DPM++ 等

4. 图像处理模块

处理输入和输出图像,让结果更符合预期。

  • Load Image / Save Image

读取和保存图像。

  • Image Resize / Crop / Scale

调整图像大小、裁剪比例。

  • Mask 操作

生成、修改、组合遮罩,用于局部重绘或精修。

5. 潜空间与解码模块

把生成好的潜空间转成可看的图像。

  • VAE Decode

把潜空间解码成普通图像。

  • VAE Encode

把普通图像编码到潜空间,常用于图生图、Inpainting。

6. 预览与调试模块

  • Preview Image

在界面中直接预览结果。

  • Queue Prompt / Execute Workflow

执行整个工作流,批量运行生成。

7. 组合与高级模块

  • Compositor

多图层组合、混合、叠加。

  • Conditioning Strength

调整提示条件权重,灵活控制图像生成风格和细节。

  • Latent Noise / Latent Mix

修改潜空间噪声,控制生成随机性和多样性。