TorchCompileModelFluxAdvanced

TorchCompileModelFluxAdvanced 2026年1月28日 00:57 80 人浏览

节点功能：将 Flux 模型的特定部分编译为优化的计算图，从而提高推理速度。（beta节点）

节点中英文对比

模型

backend

fullgraph

mode

double_blocks

single_blocks

dynamic

dynamo_cache_size_limit

TorchCompileModelFluxAdvanced

model

MODEL

backend

fullgraph

mode

double_blocks

single_blocks

dynamic

dynamo_cache_size_limit

TorchCompileModelFluxAdvanced - 参数说明

输入参数

model

输入待编译的模型，通常来自 Diffusion 模型加载器节点。

输出参数

MODEL

返回已编译优化过的模型结构，保持原始结构不变。

控件参数

backend

指定 torch.compile 的后端。

fullgraph

是否启用 Full Graph 模式，默认关闭。启用后，编译器尝试将所有操作融合为单一图，可能提升性能，但不稳定，建议在模型确定稳定运行后开启。

mode

设置 Torch Compile 编译策略。 - default：通用模式，推荐初学者使用。 - max-autotune：自动调优以最大化性能。 - max-autotune-no-cudagraphs：兼容性更高的调优模式。 - reduce-overhead：降低资源占用，适合低配环境。

double_blocks

要编译的 double_blocks 层索引，例如：0-2,4,6。double_blocks 是 UNet 中的残差结构，计算密集，优先考虑编译。输入为逗号分隔或范围格式字符串，如 0-3,5,7。

single_blocks

要编译的 single_blocks 层索引，例如：0-10。

dynamic

是否启用动态形状编译，默认关闭。

dynamo_cache_size_limit

设置 dynamo 缓存上限，单位为图数，默认值 64。

暂无节点说明