图层工具:提示词反推(高级)

节点功能:基于Gemini视觉API的智能图像标签生成器,可将任意图像自动转换为适合Stable Diffusion的优化提示词(prompt),支持关键词替换和语义增强。LayerUtility: PromptTagger(Advance)-
节点中英文对比
图层工具:提示词反推(高级)
  • image
  • text
  • api
    token_limit
    exclude_word
    replace_with_word
    LayerUtility: PromptTagger(Advance)
  • image
  • text
  • api
    token_limit
    exclude_word
    replace_with_word
    图层工具:提示词反推(高级) - 参数说明
    输入参数
    image
    输入图像,用于提取和生成 Stable Diffusion 所需的英文 prompt。
    输出参数
    text
    返回 Gemini 模型生成的英文 Stable Diffusion Prompt,已按需排除或替换指定关键词。
    控件参数
    api
    选择使用的 Gemini 模型 API。可选项包括: • gemini-1.5-flash • gemini-pro-vision 推荐选择 gemini-pro-vision,支持多模态图像理解。gemini-1.5-flash 更轻量,适用于通用处理但不支持图像输入。
    token_limit
    控制输出 prompt 的最大 token 数(词数)。范围 2~1024,默认值为 80。
    exclude_word
    要排除或替换的关键词或短语,可用于纠正模型生成的标签。
    replace_with_word
    替代关键词,若不为空则用于替换 exclude_word 中的词。
    暂无节点说明
    节点列表 首页