腾讯混元发布并开源语音数字人模型

作者:

文少

责任编辑:

刘沙

来源:

电脑商情在线

时间:

2025-05-29 11:29

关键字:

腾讯混元 开源 语音数字人 模型

  5月28日,腾讯混元发布并开源了语音数字人模型HunyuanVideo-Avatar。

  该模型由腾讯混元视频大模型(HunyuanVideo)和腾讯音乐天琴实验室MuseV技术联合研发。

  据介绍,这款语音数字人模型具备头肩、半身与全身景别支持,涵盖多种风格、多个物种与双人场景,为视频创作者提供了高一致性与高动态性的视频生成能力。

  用户只需上传人物图像和音频,该模型即可自动识别图片和音频中的元素,如人物所处环境、音频背后的情感等等,进而生成人物自然说话或唱歌的视频,甚至包含人物表情、唇形同步及全身动作。

ToB最前沿

ToB最前沿抖音号

CBI科技在线

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-3
京公网安备:11010502051901号
ICP证:京B2-20230255