WanVideo ImageToVideo Encode

WanVideo ImageToVideo Encode 2026年1月30日 16:40 78 人浏览

节点功能：将输入图像（可选起始图像、结束图像或控制嵌入）编码为视频的潜在表示（latent embeddings），用于图像到视频（I2V）生成流程WanVideo ImageToVideo

节点中英文对比

vae

clip_embeds

start_image

end_image

control_embeds

temporal_mask

extra_latents

image_embeds

width

height

num_frames

noise_aug_strength

start_latent_strength

end_latent_strength

force_offload

fun_or_fl2v_model

WanVideo ImageToVideo Encode

vae

clip_embeds

start_image

end_image

control_embeds

temporal_mask

extra_latents

image_embeds

width

height

num_frames

noise_aug_strength

start_latent_strength

end_latent_strength

force_offload

fun_or_fl2v_model

WanVideo ImageToVideo Encode - 参数说明

输入参数

vae

用于将图像编码为 latent 的 VAE 模型。

clip_embeds

来自 CLIP 编码的图像特征，用于增强语义一致性。

start_image

起始图像，将作为起始帧进行编码。可选核心输入，为 I2V 提供参考图。

end_image

结束图像，将作为最终帧引导生成趋势。建议用于双参考图生成，提升首尾一致性。

control_embeds

控制信号，用于引导某些特定模型（如 Fun）的视频生成。若使用 control 模型（如 FlowEdit），需提供该项。

temporal_mask

指定参考图在哪些帧中生效的时间掩码。可实现中段自由生成，首尾受参考图约束。

extra_latents

额外添加的 latent 序列（如 Skyreels 使用的 A2 引导帧）。

输出参数

image_embeds

包含编码后的视频 latent 信息、掩码、clip 上下文等结构。

控件参数

width

编码图像的宽度。必须为 8 的倍数。

height

编码图像的高度。必须为 8 的倍数。

num_frames

生成的视频帧数，实际将被四帧对齐处理。通常设为奇数如 81，代表 1 张参考图 + 80 帧生成。

noise_aug_strength

噪声增强强度，在参考图上添加轻微噪声以增加运动感。I2V 使用时建议设为 0.1~0.3，可增强运动但保持内容稳定。

start_latent_strength

开始帧 latent 强度调节系数。设置 <1 可增加生成变化，=1 表示不改变参考图引导力。

end_latent_strength

结束帧 latent 强度调节系数。若存在 end_image，控制其影响力；建议与 start 相配合调节。

force_offload

是否在编码后卸载 VAE 模型释放显存。显存紧张时建议启用。默认值为 True。

fun_or_fl2v_model

是否启用 Fun 或 FLF2V 模式，调整帧拼接与 mask 行为。若使用官方 Fun 或 FLF2V 模型必须开启。默认 True。

暂无节点说明