Google I/O大会:AI 无处不再

作者:

CBINEWS

责任编辑:

邹大斌

来源:

电脑商情在线

时间:

2025-05-21 09:41

关键字:

Google Google I/O Gemini

周二,17届年度谷歌开发者大会 Google I/O开幕,Alphabet 及其子公司谷歌(Google)的首席执行官桑达尔·皮查伊(Sundar Pichai)像去年以及前年一样,再次强调人工智能的变革力量。

在一片喧嚣之中,这位“巧克力工厂”(指代谷歌)的领导者确实承诺将在今年晚些时候为企业用户推出一些与AI相关的新功能和产品。

皮查伊首先提到,“Gemini 季节”将于5月20日开始,并补充道:“我不太明白这有什么大不了的;在谷歌,每一天都是 Gemini 的季节。”

Gemini 季节原本是一个占星术语,但谷歌用它来指代其AI模型家族。而皮查伊的文字游戏也颇具讽刺意味,因为AI和占星术一样,最初也是基于人们对未来的信念来推广的。

不过,这种情况正在改变,随着实际应用场景变得越来越清晰。皮查伊的主题演讲强调了成果和基准测试。“我们现在的发布速度比以往任何时候都快,”他说。或许他意识到,就在前一天,微软CEO萨提亚·纳德拉(Satya Nadella)在几百英里外的西雅图Build大会上发表了类似的讲话。

皮查伊表示:“自上一届I/O以来,我们已经宣布了十多个模型和研究突破,并发布了超过20个重要的AI产品和功能。”

他还重点介绍了公司最先进的大型语言模型(LLM)Gemini 2.5 Pro的进展,并将其Elo基准评分与早期版本进行比较:Gemini 2.5 Pro为1448分,Gemini 2.0 Pro为1379,Gemini 1.5 Pro为1249,Gemini 1.0 Pro为1111。“今天,Gemini 2.5 Pro 在所有类别中横扫 LLMArena 排行榜。”他说。

皮查伊将Gemini的成功归功于谷歌在基础设施方面的“全栈式”方法,并指出谷歌最新的第七代张量处理单元(TPU),代号为Ironwood,其性能是上一代的10倍,每个模块可提供42.5 exaFLOPS的算力。这款TPU将在今年晚些时候向谷歌云客户开放。

他表示,这种基础设施使谷歌“能够在最具性价比的价格点上交付最佳模型”。

但人工智能不仅仅是基准测试,皮查伊还介绍了三个可能在企业中获得广泛应用的项目:Starline、Astra 和 Mariner。

Project Starline 是一个3D视频会议系统,曾在2021年展示过,如今已加入AI技术。该项目催生了 Google Beam,正如皮查伊所说:“使用一种新的顶尖视频模型,将2D视频流转化为逼真的3D体验。”

通过六台摄像头组成的阵列,视频会议参与者可以从不同角度被捕捉,然后以每秒60帧的速度实时呈现在3D光场显示屏上。

谷歌还宣布与惠普(HP)合作,将在今年晚些时候向客户提供 Google Beam。

此外,Starline 技术也已融入 Google Meet——谷歌的视频会议服务中,推出了实时双向语言翻译功能,由听起来相对自然的人工智能语音播报。

皮查伊表示,英语和西班牙语的翻译目前对小型企业的Meet订阅用户可用,更多语言将在未来几周内上线,企业用户则将在今年晚些时候获得该功能。

最后,Gemini API 从 Project Mariner 中获得了多项能力。Project Mariner 是一项研究项目,探索软件代理如何使用计算机。这些能力包括多任务处理和“教-重复”功能,即可以教会模型完成特定任务后,它能够自主规划类似的任务。

他还透露,谷歌的生成式AI SDK 现在兼容 Anthropic 公司提出的 Model Context Protocol(简称 MCP),这是一种标准化应用程序与大型语言模型交互方式的协议。

就像谷歌多年前在其各项服务中打通用户账户数据一样,该公司正努力让AI服务更具个性化。“我们正在通过一个名为‘个人上下文’(Personal Context)的功能实现这一点,”皮查伊说。“在获得你许可的前提下,Gemini 模型可以在你的谷歌应用之间使用相关的上下文信息,并确保这一过程是私密的、透明的,并且完全由你掌控。”

在Gmail中,这一功能将体现为“个性化智能回复”,即由AI生成的自动回复听起来像是你自己写的那样。

他说:“比如说,我的朋友写信给我寻求建议,他要去犹他州自驾游,记得我之前去过那里。如果我说实话,我可能会草草地回一句无关痛痒的话。对不起,费利克斯。但有了‘个性化智能回复’,我可以成为一个更好的朋友。这是因为Gemini几乎能替我完成全部工作——查找我在Drive中的笔记、扫描过往邮件中的预订信息、在Google Docs中找到我的行程安排,比如那次去锡安国家公园的旅行。”

“Gemini会匹配我过去电子邮件中的常用问候语,捕捉我的语气、风格和习惯用词,然后自动生成回复。”

“个人上下文”功能将在今年夏天作为Gmail订阅用户的专属功能上线,并可用于发送给朋友的邮件中。不过如果他们发现你把沟通任务交给了Gemini,可能会重新考虑你们的友谊。

当然,面向普通消费者也有不少AI新功能。

谷歌对AI的热情如此之高,以至于从今天起,面向美国用户推出了全新的“AI模式”(AI Mode)到其核心产品——Google Search中。该功能可在Google Labs设置中启用,但尚未说明是否会影响网站流量来源。

皮查伊表示:“对于那些希望获得端到端AI搜索体验的用户,我们推出了全新的AI模式。这是对搜索的一次彻底重构。”

AI模式支持更长、更复杂的查询,更像是你会向AI模型提出的问题。谷歌将在搜索界面中新增一个“AI模式”标签页,在“个人上下文”功能上线后也将整合进去。从本周开始,Google Search将连接Gemini 2.5。

Project Astra 是由谷歌DeepMind研发的原型AI助手,目前已将其摄像头与屏幕共享能力集成进Gemini的个人助理功能中。一段测试者拍摄的视频显示,这个AI助手通过视觉识别功能纠正了测试者对周围物体描述的错误。

视频结束时,皮查伊说道:“Gemini非常擅长告诉你什么时候错了。”他还补充说,这项功能现已向所有使用Android和iOS设备的Gemini用户提供。

谷歌还宣布了一系列新的生成式媒体模型:

  • Veo 3:用于生成视频;
  • Imagen 4:用于生成图像;
  • Lyria 2:用于生成音乐;
  • 同时还推出了一款新的AI电影制作工具——Flow。

此外,谷歌还推出了 SynthID Detector,这是一个帮助识别AI生成内容的网站。这有点像枪支制造商运营一家创伤中心。

皮查伊总结道:“AI带来的机会确实是前所未有的巨大。它的真正潜力能否释放,将取决于这一代开发者和技术构建者,要让他们确保AI的好处惠及尽可能多的人。”

ToB最前沿

ToB最前沿抖音号

CBI科技在线

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-3
京公网安备:11010502051901号
ICP证:京B2-20230255