节点功能:CLIP Set Last Layer 是 ComfyUI 中用于控制 CLIP 图像编码器中“使用哪一层的输出特征”的实用节点
CLIP 的训练目标是让图像和文本在最后一层的 embedding 中对齐(通常使用图像编码器的最终 [CLS] token])。
然而,在实际使用中我们发现:
图像编码器不同层的输出有不同的抽象层次;
某些任务(如风格迁移、构图保持)不需要用最终语义层的输出,而是更适合中间层特征;
所以我们可以通过 CLIP Set Last Layer 人为选用非最终层作为输出 embedding,来获得更“颜色风格/细节纹理”的特征,而不是“高抽象语义”。