第三方插件
ComfyUI-KJNodes
Patch Sage Attention KJ
用于优化模型的注意力机制,提高推理速度。(加速效果不明显)Patch Sage Attention
节点中英文对比
按当前节点配置,分别展示中文与英文节点结构。
中文节点
Patch Sage Attention KJ
sage_attention
英文节点
Patch Sage Attention KJ
sage_attention
参数说明
依据当前节点关联的 `NodesItems` 数据展示输入、输出与控件说明。
输入参数
模型
model
输入待应用注意力机制 patch 的模型。
输出参数
模型
MODEL
返回应用了 SageAttention 全局 Patch 的模型。
控件参数
sage_attention
sage_attention
指定 SageAttention 模式,修改 ComfyUI 的全局 Attention 实现。
- disabled:关闭 SageAttention,恢复默认 Comfy Attention。
- auto:自动判断后端适配模式(推荐)。
- sageattn_qk_int8_pv_fp16_cuda:NVIDIA FP16 模式,速度快、兼容性好。
- sageattn_qk_int8_pv_fp16_triton:Triton 编译版本,适合特定 GPU。
- sageattn_qk_int8_pv_fp8_cuda:FP8 精度版本,极致加速但可能有精度偏差。
详细说明
结合节点用途、参数和调用方式,给出更完整的说明内容。
暂无节点说明
同类节点导航
继续浏览同一分类下的相邻节点,方便串联学习。