阿里开源通义万相首尾帧生视频模型

作者：

文少

责任编辑：

刘沙

来源：

电脑商情在线

时间：

2025-04-18 10:53

关键字：

阿里开源通义万相首尾帧生视频模型

　　4月18日，阿里宣布开源通义万相首尾帧生视频14B 模型，成为业内首个开源的百亿级参数规模首尾帧生视频模型。

　　该模型可根据用户指定的开始和结束图片，生成一段能衔接首尾画面的 720p 高清视频，满足延时摄影、变身等更可控、更定制化的视频生成需求。

　　首尾帧生视频比文生视频、单图生视频可控性更高，但训练难度大，对模型的指令遵循、视频内容与首尾帧一致性、视频过渡自然流畅性等要求高。

　　通义万相首尾帧生视频模型基于 Wan2.1 文生视频基础模型架构，引入了额外条件控制机制，可实现流畅且精准的首尾帧变换。在训练阶段，团队构建了专门的首尾帧模式训练数据，采用并行策略提升训练和生成效率，保障高分辨率视频生成效果。

　　目前用户可在通义万相官网免费体验，或在 GitHub、Hugging Face、魔搭社区下载模型进行本地部署和二次开发。

精彩专题