Patch Sage Attention KJ

节点功能:用于优化模型的注意力机制,提高推理速度。(加速效果不明显)Patch Sage Attention
节点中英文对比
Patch Sage Attention KJ
  • 模型
  • 模型
  • sage_attention
    Patch Sage Attention KJ
  • model
  • MODEL
  • sage_attention
    Patch Sage Attention KJ - 参数说明
    输入参数
    model
    输入待应用注意力机制 patch 的模型。
    输出参数
    MODEL
    返回应用了 SageAttention 全局 Patch 的模型。
    控件参数
    sage_attention
    指定 SageAttention 模式,修改 ComfyUI 的全局 Attention 实现。 - disabled:关闭 SageAttention,恢复默认 Comfy Attention。 - auto:自动判断后端适配模式(推荐)。 - sageattn_qk_int8_pv_fp16_cuda:NVIDIA FP16 模式,速度快、兼容性好。 - sageattn_qk_int8_pv_fp16_triton:Triton 编译版本,适合特定 GPU。 - sageattn_qk_int8_pv_fp8_cuda:FP8 精度版本,极致加速但可能有精度偏差。
    暂无节点说明
    节点列表 首页