阿里巴巴发布并开源全模态大模型
作者:
文少
责任编辑:刘沙
来源:
电脑商情在线
时间:2025-03-27 11:24
关键字:
阿里巴巴 开源 大模型 Qwen2.5-Omni
3月27日,阿里巴巴正式发布并开源了通义千问Qwen2.5-Omni-7B,这是阿里巴巴首个端到端全模态大模型,能够同时处理文本、图像、音频和视频等多种输入形式,并能够实时生成文本以及自然语音合成输出,为多模态交互场景提供了强大的支持。
在多模态融合任务OmniBench等测评中,Qwen2.5-Omni展现出了卓越的性能,全维度超越了Google的Gemini-1.5-Pro等同类模型,刷新了业界纪录。
其独特的多感官认知能力接近人类,能够与世界进行实时交互。更值得一提的是,Qwen2.5-Omni具备通过音视频识别情绪的能力,在处理复杂任务时能够进行更智能、更自然的反馈与决策,从而为用户带来更加人性化的交互体验。
与那些参数规模达数千亿的闭源大模型不同,Qwen2.5-Omni只有7B,让全模态大模型能够在产业上广泛应用。手机等智能终端上也能轻松部署和运行该模型。
目前,Qwen2.5-Omni已在魔搭社区和Hugging Face同步开源,开发者和企业可以免费下载商用Qwen2.5-Omni。此外,用户还可以在Qwen Chat上直接体验这一全模态大模型。