原生节点 ComfyUI 官方

CLIP视觉编码

CLIP Vision Encode 1664

该节点是一个 图像编码节点,使用的是 CLIP Vision 模型 —— 一种能“理解图片”的 AI 模型。你把一张图像输入进来,它会把这张图像转成一种“向量”形式(称为 图像特征编码),供后续模型使用,比如:IPAdapter 图像风格控制;检索相似图像;与文本提示配合做图像引导(如图文混合生成);在多模态模型中对图像内容做特征提取。

节点中英文对比

按当前节点配置,分别展示中文与英文节点结构。

中文节点
CLIP视觉编码
  • clip视觉
  • 图像
  • CLIP视觉输出
  • 裁剪
    center
    英文节点
    CLIP Vision Encode
  • clip_vision
  • image
  • CLIP_VISION_OUTPUT
  • crop
    center

    参数说明

    依据当前节点关联的 `NodesItems` 数据展示输入、输出与控件说明。

    输入参数
    clip视觉 clip_vision
    图像编码模型,一般来自 Load CLIPVision 节点输出。提供 CLIP 模型的视觉部分。
    图像 image
    输入图像,用于提取视觉特征。
    输出参数
    CLIP视觉输出 CLIP_VISION_OUTPUT
    图像在 CLIP 模型中的编码特征结果。
    控件参数
    裁剪 crop
    图像裁剪方式。可选值包括: - center:裁剪中心区域用于特征提取; - none:不裁剪,使用整张图像。

    详细说明

    结合节点用途、参数和调用方式,给出更完整的说明内容。

     

    同类节点导航

    继续浏览同一分类下的相邻节点,方便串联学习。