腾讯混元推出图生视频模型,现已开源

作者:

文少

责任编辑:

刘沙

来源:

电脑商情在线

时间:

2025-03-07 11:27

关键字:

腾讯混元 图生视频 模型 开源

  3月6日,腾讯混元宣布图生视频模型正式上线,企业和开发者可通过腾讯云申请使用API接口,用户也可通过混元AI视频官网体验。

  图生视频模型总参数量为130亿,支持生成背景音效及2K高质量视频。该模型适用于多种角色和场景,如写实视频、动漫角色、CGI角色制作等等。用户只需上传一张图片并简要描述希望实现的画面运动和镜头调度,混元即可生成5秒短视频并配上背景音效。此外,上传人物图片并输入文字或音频,图片中人物就可以“说话”、“唱歌”,甚至一键生成跳舞视频。

  目前其开源模型已在GitHub、HuggingFace等主流开发者社区供下载体验。开源内容包括权重、推理代码和LoRA训练代码,支持开发者基于混元训练专属LoRA等衍生模型。

  混元视频生成模型具备灵活的扩展性,图生视频和文生视频在相同数据集上预训练,可以捕捉到丰富的视觉和语义信息,再结合多种输入条件,从而实现多维度视频控制。

ToB最前沿

ToB最前沿抖音号

CBI科技在线

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-3
京公网安备:11010502051901号
ICP证:京B2-20230255