WanVideo ImageToVideo Encode

节点功能:将输入图像(可选起始图像、结束图像或控制嵌入)编码为视频的潜在表示(latent embeddings),用于图像到视频(I2V)生成流程WanVideo ImageToVideo
节点中英文对比
WanVideo ImageToVideo Encode
  • vae
  • clip_embeds
  • start_image
  • end_image
  • control_embeds
  • temporal_mask
  • extra_latents
  • image_embeds
  • width
    height
    num_frames
    noise_aug_strength
    start_latent_strength
    end_latent_strength
    force_offload
    fun_or_fl2v_model
    WanVideo ImageToVideo Encode
  • vae
  • clip_embeds
  • start_image
  • end_image
  • control_embeds
  • temporal_mask
  • extra_latents
  • image_embeds
  • width
    height
    num_frames
    noise_aug_strength
    start_latent_strength
    end_latent_strength
    force_offload
    fun_or_fl2v_model
    WanVideo ImageToVideo Encode - 参数说明
    输入参数
    vae
    用于将图像编码为 latent 的 VAE 模型。
    clip_embeds
    来自 CLIP 编码的图像特征,用于增强语义一致性。
    start_image
    起始图像,将作为起始帧进行编码。可选核心输入,为 I2V 提供参考图。
    end_image
    结束图像,将作为最终帧引导生成趋势。建议用于双参考图生成,提升首尾一致性。
    control_embeds
    控制信号,用于引导某些特定模型(如 Fun)的视频生成。若使用 control 模型(如 FlowEdit),需提供该项。
    temporal_mask
    指定参考图在哪些帧中生效的时间掩码。可实现中段自由生成,首尾受参考图约束。
    extra_latents
    额外添加的 latent 序列(如 Skyreels 使用的 A2 引导帧)。
    输出参数
    image_embeds
    包含编码后的视频 latent 信息、掩码、clip 上下文等结构。
    控件参数
    width
    编码图像的宽度。必须为 8 的倍数。
    height
    编码图像的高度。必须为 8 的倍数。
    num_frames
    生成的视频帧数,实际将被四帧对齐处理。通常设为奇数如 81,代表 1 张参考图 + 80 帧生成。
    noise_aug_strength
    噪声增强强度,在参考图上添加轻微噪声以增加运动感。I2V 使用时建议设为 0.1~0.3,可增强运动但保持内容稳定。
    start_latent_strength
    开始帧 latent 强度调节系数。设置 <1 可增加生成变化,=1 表示不改变参考图引导力。
    end_latent_strength
    结束帧 latent 强度调节系数。若存在 end_image,控制其影响力;建议与 start 相配合调节。
    force_offload
    是否在编码后卸载 VAE 模型释放显存。显存紧张时建议启用。默认值为 True。
    fun_or_fl2v_model
    是否启用 Fun 或 FLF2V 模式,调整帧拼接与 mask 行为。若使用官方 Fun 或 FLF2V 模型必须开启。默认 True。
    暂无节点说明
    节点列表 首页