TorchCompileModelFluxAdvanced

节点功能:将 Flux 模型的特定部分编译为优化的计算图,从而提高推理速度。(beta节点)
节点中英文对比
TorchCompileModelFluxAdvanced
  • 模型
  • 模型
  • backend
    fullgraph
    mode
    double_blocks
    single_blocks
    dynamic
    dynamo_cache_size_limit
    TorchCompileModelFluxAdvanced
  • model
  • MODEL
  • backend
    fullgraph
    mode
    double_blocks
    single_blocks
    dynamic
    dynamo_cache_size_limit
    TorchCompileModelFluxAdvanced - 参数说明
    输入参数
    model
    输入待编译的模型,通常来自 Diffusion 模型加载器节点。
    输出参数
    MODEL
    返回已编译优化过的模型结构,保持原始结构不变。
    控件参数
    backend
    指定 torch.compile 的后端。
    fullgraph
    是否启用 Full Graph 模式,默认关闭。启用后,编译器尝试将所有操作融合为单一图,可能提升性能,但不稳定,建议在模型确定稳定运行后开启。
    mode
    设置 Torch Compile 编译策略。 - default:通用模式,推荐初学者使用。 - max-autotune:自动调优以最大化性能。 - max-autotune-no-cudagraphs:兼容性更高的调优模式。 - reduce-overhead:降低资源占用,适合低配环境。
    double_blocks
    要编译的 double_blocks 层索引,例如:0-2,4,6。double_blocks 是 UNet 中的残差结构,计算密集,优先考虑编译。输入为逗号分隔或范围格式字符串,如 0-3,5,7。
    single_blocks
    要编译的 single_blocks 层索引,例如:0-10。
    dynamic
    是否启用动态形状编译,默认关闭。
    dynamo_cache_size_limit
    设置 dynamo 缓存上限,单位为图数,默认值 64。
    暂无节点说明
    节点列表 首页