LatentSync1.6 Node

节点功能:用于 同步处理图像(视频帧)和音频数据,并执行推理以生成输出视频和音频。LatentSync1.6
节点中英文对比
LatentSync1.6 Node
  • images
  • audio
  • images
  • audio
  • seed
    lips_expression
    inference_steps
    LatentSync1.6 Node
  • images
  • audio
  • images
  • audio
  • seed
    lips_expression
    inference_steps
    LatentSync1.6 Node - 参数说明
    输入参数
    images
    一组输入图像(视频帧),要求为形如 [B, H, W, C] 的张量序列。至少应包含多帧,图像应为 RGB 格式,输入前建议统一尺寸。
    audio
    包含 waveform(Tensor)与 sample_rate(采样率)的字典对象。输入音频自动重采样至 16kHz,用于驱动唇部表情变化。
    输出参数
    images
    输出图像序列(同步动画帧)。
    audio
    处理后音频(已重采样为 16kHz)。
    控件参数
    seed
    随机种子。
    lips_expression
    范围:1.0 ~ 3.0,控制嘴部动作幅度(即 guidance scale)。建议范围 1.2~2.0,数值越高唇部越夸张。
    inference_steps
    迭代推理步数,范围:1~999。越大生成质量越高,但耗时越长。一般设置在 10~30 足够。
    暂无节点说明
    节点列表 首页