TorchCompileModelFluxAdvanced
节点功能:将 Flux 模型的特定部分编译为优化的计算图,从而提高推理速度。(beta节点)
节点中英文对比
TorchCompileModelFluxAdvanced
backend
fullgraph
mode
double_blocks
single_blocks
dynamic
dynamo_cache_size_limit
TorchCompileModelFluxAdvanced
backend
fullgraph
mode
double_blocks
single_blocks
dynamic
dynamo_cache_size_limit
TorchCompileModelFluxAdvanced - 参数说明
输入参数
model
输入待编译的模型,通常来自 Diffusion 模型加载器节点。
输出参数
MODEL
返回已编译优化过的模型结构,保持原始结构不变。
控件参数
backend
指定 torch.compile 的后端。
fullgraph
是否启用 Full Graph 模式,默认关闭。启用后,编译器尝试将所有操作融合为单一图,可能提升性能,但不稳定,建议在模型确定稳定运行后开启。
mode
设置 Torch Compile 编译策略。
- default:通用模式,推荐初学者使用。
- max-autotune:自动调优以最大化性能。
- max-autotune-no-cudagraphs:兼容性更高的调优模式。
- reduce-overhead:降低资源占用,适合低配环境。
double_blocks
要编译的 double_blocks 层索引,例如:0-2,4,6。double_blocks 是 UNet 中的残差结构,计算密集,优先考虑编译。输入为逗号分隔或范围格式字符串,如 0-3,5,7。
single_blocks
要编译的 single_blocks 层索引,例如:0-10。
dynamic
是否启用动态形状编译,默认关闭。
dynamo_cache_size_limit
设置 dynamo 缓存上限,单位为图数,默认值 64。
暂无节点说明