腾讯混元发布并开源语音数字人模型
作者:
文少
责任编辑:刘沙
来源:
电脑商情在线
时间:2025-05-29 11:29
关键字:
腾讯混元 开源 语音数字人 模型
5月28日,腾讯混元发布并开源了语音数字人模型HunyuanVideo-Avatar。
该模型由腾讯混元视频大模型(HunyuanVideo)和腾讯音乐天琴实验室MuseV技术联合研发。
据介绍,这款语音数字人模型具备头肩、半身与全身景别支持,涵盖多种风格、多个物种与双人场景,为视频创作者提供了高一致性与高动态性的视频生成能力。
用户只需上传人物图像和音频,该模型即可自动识别图片和音频中的元素,如人物所处环境、音频背后的情感等等,进而生成人物自然说话或唱歌的视频,甚至包含人物表情、唇形同步及全身动作。