腾讯混元推出图生视频模型，现已开源

作者：

文少

责任编辑：

刘沙

来源：

电脑商情在线

时间：

2025-03-07 11:27

关键字：

腾讯混元图生视频模型开源

　　3月6日，腾讯混元宣布图生视频模型正式上线，企业和开发者可通过腾讯云申请使用API接口，用户也可通过混元AI视频官网体验。

　　图生视频模型总参数量为130亿，支持生成背景音效及2K高质量视频。该模型适用于多种角色和场景，如写实视频、动漫角色、CGI角色制作等等。用户只需上传一张图片并简要描述希望实现的画面运动和镜头调度，混元即可生成5秒短视频并配上背景音效。此外，上传人物图片并输入文字或音频，图片中人物就可以“说话”、“唱歌”，甚至一键生成跳舞视频。

　　目前其开源模型已在GitHub、HuggingFace等主流开发者社区供下载体验。开源内容包括权重、推理代码和LoRA训练代码，支持开发者基于混元训练专属LoRA等衍生模型。

　　混元视频生成模型具备灵活的扩展性，图生视频和文生视频在相同数据集上预训练，可以捕捉到丰富的视觉和语义信息，再结合多种输入条件，从而实现多维度视频控制。

腾讯混元推出图生视频模型，现已开源

精彩专题

智库专家