图层工具:提示词反推(高级)
节点功能:基于Gemini视觉API的智能图像标签生成器,可将任意图像自动转换为适合Stable Diffusion的优化提示词(prompt),支持关键词替换和语义增强。LayerUtility: PromptTagger(Advance)-
节点中英文对比
图层工具:提示词反推(高级)
api
token_limit
exclude_word
replace_with_word
LayerUtility: PromptTagger(Advance)
api
token_limit
exclude_word
replace_with_word
图层工具:提示词反推(高级) - 参数说明
输入参数
image
输入图像,用于提取和生成 Stable Diffusion 所需的英文 prompt。
输出参数
text
返回 Gemini 模型生成的英文 Stable Diffusion Prompt,已按需排除或替换指定关键词。
控件参数
api
选择使用的 Gemini 模型 API。可选项包括:
• gemini-1.5-flash
• gemini-pro-vision
推荐选择 gemini-pro-vision,支持多模态图像理解。gemini-1.5-flash 更轻量,适用于通用处理但不支持图像输入。
token_limit
控制输出 prompt 的最大 token 数(词数)。范围 2~1024,默认值为 80。
exclude_word
要排除或替换的关键词或短语,可用于纠正模型生成的标签。
replace_with_word
替代关键词,若不为空则用于替换 exclude_word 中的词。
暂无节点说明