阿里开源通义万相首尾帧生视频模型

作者:

文少

责任编辑:

刘沙

来源:

电脑商情在线

时间:

2025-04-18 10:53

关键字:

阿里 开源 通义万相 首尾帧生视频模型

  4月18日,阿里宣布开源通义万相首尾帧生视频14B 模型,成为业内首个开源的百亿级参数规模首尾帧生视频模型。

  该模型可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的 720p 高清视频,满足延时摄影、变身等更可控、更定制化的视频生成需求。

  首尾帧生视频比文生视频、单图生视频可控性更高,但训练难度大,对模型的指令遵循、视频内容与首尾帧一致性、视频过渡自然流畅性等要求高。

  通义万相首尾帧生视频模型基于 Wan2.1 文生视频基础模型架构,引入了额外条件控制机制,可实现流畅且精准的首尾帧变换。在训练阶段,团队构建了专门的首尾帧模式训练数据,采用并行策略提升训练和生成效率,保障高分辨率视频生成效果。

  目前用户可在通义万相官网免费体验,或在 GitHub、Hugging Face、魔搭社区下载模型进行本地部署和二次开发。


ToB最前沿

ToB最前沿抖音号

CBI科技在线

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-3
京公网安备:11010502051901号
ICP证:京B2-20230255