腾讯混元推出图生视频模型,现已开源
作者:
文少
责任编辑:刘沙
来源:
电脑商情在线
时间:2025-03-07 11:27
关键字:
腾讯混元 图生视频 模型 开源
3月6日,腾讯混元宣布图生视频模型正式上线,企业和开发者可通过腾讯云申请使用API接口,用户也可通过混元AI视频官网体验。
图生视频模型总参数量为130亿,支持生成背景音效及2K高质量视频。该模型适用于多种角色和场景,如写实视频、动漫角色、CGI角色制作等等。用户只需上传一张图片并简要描述希望实现的画面运动和镜头调度,混元即可生成5秒短视频并配上背景音效。此外,上传人物图片并输入文字或音频,图片中人物就可以“说话”、“唱歌”,甚至一键生成跳舞视频。
目前其开源模型已在GitHub、HuggingFace等主流开发者社区供下载体验。开源内容包括权重、推理代码和LoRA训练代码,支持开发者基于混元训练专属LoRA等衍生模型。
混元视频生成模型具备灵活的扩展性,图生视频和文生视频在相同数据集上预训练,可以捕捉到丰富的视觉和语义信息,再结合多种输入条件,从而实现多维度视频控制。