阿里开源通义万相首尾帧生视频模型
作者:
文少
责任编辑:刘沙
来源:
电脑商情在线
时间:2025-04-18 10:53
关键字:
阿里 开源 通义万相 首尾帧生视频模型
4月18日,阿里宣布开源通义万相首尾帧生视频14B 模型,成为业内首个开源的百亿级参数规模首尾帧生视频模型。
该模型可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的 720p 高清视频,满足延时摄影、变身等更可控、更定制化的视频生成需求。
首尾帧生视频比文生视频、单图生视频可控性更高,但训练难度大,对模型的指令遵循、视频内容与首尾帧一致性、视频过渡自然流畅性等要求高。
通义万相首尾帧生视频模型基于 Wan2.1 文生视频基础模型架构,引入了额外条件控制机制,可实现流畅且精准的首尾帧变换。在训练阶段,团队构建了专门的首尾帧模式训练数据,采用并行策略提升训练和生成效率,保障高分辨率视频生成效果。
目前用户可在通义万相官网免费体验,或在 GitHub、Hugging Face、魔搭社区下载模型进行本地部署和二次开发。