阿里巴巴发布并开源全模态大模型

作者:

文少

责任编辑:

刘沙

来源:

电脑商情在线

时间:

2025-03-27 11:24

关键字:

阿里巴巴 开源 大模型 Qwen2.5-Omni

  3月27日,阿里巴巴正式发布并开源了通义千问Qwen2.5-Omni-7B,这是阿里巴巴首个端到端全模态大模型,能够同时处理文本、图像、音频和视频等多种输入形式,并能够实时生成文本以及自然语音合成输出,为多模态交互场景提供了强大的支持。

  在多模态融合任务OmniBench等测评中,Qwen2.5-Omni展现出了卓越的性能,全维度超越了Google的Gemini-1.5-Pro等同类模型,刷新了业界纪录。

  其独特的多感官认知能力接近人类,能够与世界进行实时交互。更值得一提的是,Qwen2.5-Omni具备通过音视频识别情绪的能力,在处理复杂任务时能够进行更智能、更自然的反馈与决策,从而为用户带来更加人性化的交互体验。

  与那些参数规模达数千亿的闭源大模型不同,Qwen2.5-Omni只有7B,让全模态大模型能够在产业上广泛应用。手机等智能终端上也能轻松部署和运行该模型。

  目前,Qwen2.5-Omni已在魔搭社区和Hugging Face同步开源,开发者和企业可以免费下载商用Qwen2.5-Omni。此外,用户还可以在Qwen Chat上直接体验这一全模态大模型。

ToB最前沿

ToB最前沿抖音号

CBI科技在线

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-3
京公网安备:11010502051901号
ICP证:京B2-20230255