原生节点 ComfyUI 官方

CLIP视觉编码

CLIP Vision Encode 2025-06-29 2100

该节点是一个图像编码节点，使用的是 CLIP Vision 模型 —— 一种能“理解图片”的 AI 模型。你把一张图像输入进来，它会把这张图像转成一种“向量”形式（称为图像特征编码），供后续模型使用，比如：IPAdapter 图像风格控制；检索相似图像；与文本提示配合做图像引导（如图文混合生成）；在多模态模型中对图像内容做特征提取。

节点中英文对比

按当前节点配置，分别展示中文与英文节点结构。

中文节点

CLIP视觉编码

clip视觉

图像

CLIP视觉输出

裁剪

center

英文节点

CLIP Vision Encode

clip_vision

image

CLIP_VISION_OUTPUT

crop

center

参数说明

依据当前节点关联的 `NodesItems` 数据展示输入、输出与控件说明。

输入参数

clip视觉 clip_vision

图像编码模型，一般来自 Load CLIPVision 节点输出。提供 CLIP 模型的视觉部分。

图像 image

输入图像，用于提取视觉特征。

输出参数

CLIP视觉输出 CLIP_VISION_OUTPUT

图像在 CLIP 模型中的编码特征结果。

控件参数

裁剪 crop

图像裁剪方式。可选值包括： - center：裁剪中心区域用于特征提取； - none：不裁剪，使用整张图像。

详细说明

结合节点用途、参数和调用方式，给出更完整的说明内容。