第三方插件 ComfyUI-KJNodes

Patch Sage Attention KJ

Patch Sage Attention KJ 2026-01-28 590

用于优化模型的注意力机制，提高推理速度。（加速效果不明显）Patch Sage Attention

节点中英文对比

按当前节点配置，分别展示中文与英文节点结构。

中文节点

Patch Sage Attention KJ

模型

sage_attention

英文节点

Patch Sage Attention KJ

model

MODEL

sage_attention

参数说明

依据当前节点关联的 `NodesItems` 数据展示输入、输出与控件说明。

输入参数

模型 model

输入待应用注意力机制 patch 的模型。

输出参数

模型 MODEL

返回应用了 SageAttention 全局 Patch 的模型。

控件参数

sage_attention sage_attention

指定 SageAttention 模式，修改 ComfyUI 的全局 Attention 实现。 - disabled：关闭 SageAttention，恢复默认 Comfy Attention。 - auto：自动判断后端适配模式（推荐）。 - sageattn_qk_int8_pv_fp16_cuda：NVIDIA FP16 模式，速度快、兼容性好。 - sageattn_qk_int8_pv_fp16_triton：Triton 编译版本，适合特定 GPU。 - sageattn_qk_int8_pv_fp8_cuda：FP8 精度版本，极致加速但可能有精度偏差。

详细说明

结合节点用途、参数和调用方式，给出更完整的说明内容。

暂无节点说明