腾讯混元发布并开源语音数字人模型

作者：

文少

责任编辑：

刘沙

来源：

电脑商情在线

时间：

2025-05-29 11:29

关键字：

腾讯混元开源语音数字人模型

　　5月28日，腾讯混元发布并开源了语音数字人模型HunyuanVideo-Avatar。

　　该模型由腾讯混元视频大模型（HunyuanVideo）和腾讯音乐天琴实验室MuseV技术联合研发。

　　据介绍，这款语音数字人模型具备头肩、半身与全身景别支持，涵盖多种风格、多个物种与双人场景，为视频创作者提供了高一致性与高动态性的视频生成能力。

　　用户只需上传人物图像和音频，该模型即可自动识别图片和音频中的元素，如人物所处环境、音频背后的情感等等，进而生成人物自然说话或唱歌的视频，甚至包含人物表情、唇形同步及全身动作。

精彩专题