谷歌DeepMind发布通用世界模型Genie 3

作者:

文少

责任编辑:

刘沙

来源:

电脑商情在线

时间:

2025-08-06 11:05

关键字:

谷歌 DeepMind 世界模型 Genie 3

  近日,谷歌旗下DeepMind实验室正式推出第三代世界模型 Genie 3。该模型能够通过一段文字提示,实时生成可维持长达数分钟的720p动态三维环境,用户可以在其中以24 fps 的帧率实时导航,

  DeepMind将其定位为“为具身智能体提供一个无限丰富的训练场”,并已与多任务智能体 SIMA 展开联合测试。

  DeepMind 在模拟环境方面持续投入已有十余年:从训练能玩转即时战略游戏的 AI,到为机器人搭建的开放式学习平台,均指向同一目标——构建能理解、预测并交互的“世界模型”。

  如今,Genie 3首次把“实时可控”与“长时一致性”同时带到通用场景,并实现了多项核心技术突破:

  物理级逼真度:可模拟水流、光影变化和复杂的环境互动,如,直升机在悬崖瀑布边机动。

  长时程环境一致性:Genie 3 环境在几分钟内基本保持一致,视觉记忆可回溯到一分钟前,确保用户折返同一地点时,环境细节保持一致。

  可提示的世界事件:Genie 3 支持更具表现力的基于文本的交互形式,用户一句话即可改变天气条件或召唤生物,为“假设”场景提供丰富的沙盒。

  不过,DeepMind也表示,当前Genie 3仍存在行动空间受限、缺乏多智能体模拟、地理精度不足、文字渲染模糊及连续互动仅数分钟等局限。

  目前DeepMind 已向少量学者和创作者开放Genie 3的“研究预览版”,用于收集反馈并评估潜在风险。

ToB最前沿

ToB最前沿抖音号

CBI科技在线

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-3
京公网安备:11010502051901号
ICP证:京B2-20230255