图层工具:加载JoyCaption2模型(高级)

节点功能:加载多模态视觉语言模型 (VLM) ,专门用于 图像理解与描述生成。LayerUtility: Load JoyCaption2 Model(Advance)-
节点中英文对比
图层工具:加载JoyCaption2模型(高级)
  • joy2_model
  • llm_model
    device
    dtype
    vlm_lora
    LayerUtility: Load JoyCaption2 Model(Advance)
  • joy2_model
  • llm_model
    device
    dtype
    vlm_lora
    图层工具:加载JoyCaption2模型(高级) - 参数说明
    输出参数
    joy2_model
    返回已加载的 JoyCaption2 模型对象与所使用的设备,封装于列表中。
    控件参数
    llm_model
    选择加载的语言模型名称。
    device
    指定推理设备,目前仅支持 'cuda'。
    dtype
    模型加载的权重量化类型。可选值包括: - nf4:低比特精度,高效运行; - bf16:较高精度。
    vlm_lora
    选择是否加载视觉语言微调权重(LoRA)。可选值: - text_model:加载文本 LoRA。 - none:不加载。
    暂无节点说明
    节点列表 首页