阿里云发布通义千问2.5和百炼2.0,加速推动云与AI融合

作者:

CBINEWS

责任编辑:

邹大斌

来源:

电脑商情在线

时间:

2024-05-10 15:20

关键字:

阿里云 AI 云计算

“通用大模型就像百科全书,有几本就行了,用不着这么多。”微博COO、新浪移动CEO王巍在5月9日举行的阿里云AI峰会上如此说。王巍的观点无疑具有代表性。在过去的一年,ChatGPT的成功引发了人们对生成式AI技术的追捧,市场上涌现了大量的通用大语言模型,被业界称为“百模大战”。

微博选择合作的阿里云通义千问正是众多通用大模型之一。5月9日,在阿里云AI峰会上阿里云公布了通义千问大模型的最新进展,目前通义大模型通过阿里云已经服务企业超过9万,通过钉钉已经服务企业超过220万,开源大模型下载量超过700万。会上,阿里云还发布了通义千问2.5、百炼2.0、通义灵码企业版,同时还宣布开源通义千问110B参数的大模型等。

做最强的中国大模型

阿里云在大模型上发力很早。大多数人知道大模型是在2022年11月ChatGPT发布,而阿里云早在2022年的云栖大会上就发布了MaaS服务和魔搭社区。也正是有之前的技术积累,在ChatGPT推出后的2023年4年阿里云就正式发布了自己的通用大模型通义千问,也是最早问世的通用大模型之一,不久阿里云又推出了通义万相等多个专用大模型以及通义开源版Qwen。

在阿里云AI峰会上,阿里云发布了最新版的通义千问大模型——通义千问2.5。相比通义千问2.1版本,通义千问2.5能力全面提升,其理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得如此出色的成绩。

通义系列其他大模型表现也令人惊讶。比如,通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。

阿里云CTO周靖人表示,通义大模型问世一年多来,已经具有了业界领先的文生图、智能编码、文档解析、音视频理解等能力,大模型性能全面赶超GPT-4 Turbo,是最强中文大模型。

会上,阿里云还发布了最新版通义开源模型和代码助手通义灵活企业版:1100亿参数的Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型。在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界最强的竞争力。

而通义灵码是国内用户规模第一的智能编码助手,基于SOTA水准的通义千问代码模型CodeQwen1.5研发。2023年10月发布至今,通义灵码的插件下载量已超350万,每日推荐代码超3000万次,被开发者采纳的代码超亿行。

会上,阿里云还宣布“通义千问APP”更名为“通义APP”。通义APP以性能媲美GPT-4 Turbo的基模为底座,并把通义实验室前沿的文生图、智能编码、文档解析、音视频理解、视觉生成等能力“All in one”,成为每个人的全能AI助手。比如,通义APP单次可处理多达1000万字的长文档,还能同时解析100份不同格式的文档,通义APP还集成了国内最受欢迎的智能编码助手通义灵码,能帮助所有人随时随地在手机上写代码、读代码、学习编程技能。

推动AI与云融合

除了不断优化和提升通义系列大模型之外,阿里云还在发力大模型的生态,致力于推动云与AI的融合。

“云计算的边界正在从传统的IaaS、PaaS、SaaS不断扩展,往下向芯片层、向上向业务层扩展。同时,其内涵也在不断丰富,这就是云和AI日益走向融合,甚至可能有一天AI就是云计算。”阿里云公共云事业部总裁刘伟光表示。

在云、AI融合的道路上,开源魔搭社区ModelScope就是阿里云的一个重要布局。作为AI开发者的重要聚集地,魔搭社区已经吸引了超过200万AI开发者,模型累计下载超过4500万次,依托底层的云能力和魔搭社区,开发者可以更快速实现模型的部署。

同时,阿里云还在持续打造百炼大模型平台,来简化大模型的开发、训练和优化。2023年10月,阿里云对外发布了百炼大模型平台,开发者可通过“拖拉拽”5分钟开发一款大模型应用,几小时就打造出一个专属模型,而把精力专注于应用创新。本次大会上,阿里云发布百炼2.0,将其升级成为阿里云承载云+AI能力的重要平台,提供一站式、全托管的大模型定制与应用服务。升级后,百炼可以更好支持地大型企业和成熟开发者的需求。

周靖人介绍,当下企业应用大模型存在三种范式:一是对大模型开箱即用,二是对大模型进行微调和持续训练,三是基于模型开发应用,其中最典型的需求是RAG,以企业数据对大模型进行知识增强。围绕这些需求,百炼打造了模型中心和应用中心,提供最丰富的模型和最易用的工具箱。

对希望直接调用模型进行推理的企业,百炼集成了上百款大模型API,除了通义、Llama、ChatGLM等系列,还首家托管百川等系列三方模型,覆盖国内外主流厂商;对需进一步训练模型的用户,百炼提供从数据管理、模型调优、评测到部署的全链路模型服务,用户可弹性按需调用算力;对希望打造RAG应用的企业,百炼支持Assistant API开发模式,可在百炼上轻松创建知识库,并一键开启知识检索增强(RAG),通过Assistant API联合输出。

从阿里云百炼发布半年来,已服务一汽、微博、完美世界、朗新集团、央视网、蓝凌科技等众多企业。例如,一汽红旗在百炼上调用通义千问和大模型分析能力打造了专属BI智能体,管理人员可随时让大模型生成销售额图表,并分析相关情况。在本次大会上,微博、中国一汽、小爱同学等还分享了各自与阿里云在百炼平台合作经验。

结束语

今天,随着公有云市场逐步成熟,市场的竞争焦点已经转到AI,无论是云服务三巨头的微软、AWS、谷歌云还是国内的腾讯云、华为云,都纷纷布局大模型和AI。阿里云在云和AI上的布局都很早,并且已经卓有成效,这也为阿里云赢得了先发优势,无疑有利于巩固阿里云在竞争日趋激烈的公有云市场的领先地位。

ToB最前沿

ToB最前沿抖音号

CBI科技在线

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-3
京公网安备:11010502051901号
ICP证:京B2-20230255