Databricks Data+ AI 峰会 2025五大重要发布
CBINEWS
责任编辑:邹大斌
电脑商情在线
时间:2025-06-17 11:02
DataBricks Data+AI Agentic AI
在上周举行的 Databricks Data+ AI 峰会 2025 上,该公司展示了其云原生数据湖仓平台即将新增的一系列生成式 AI 和代理式 AI(Agentic AI)功能——这与其竞争对手 Snowflake 前一周的做法如出一辙。
由于两家公司的技术大会时间如此接近,各自的工程团队几乎没有时间对彼此发布的新产品做出反应。但这也意味着他们面临更大的压力,必须提前宣布尚未完全准备就绪的产品,以免被对方抢先,或许也解释了为何有大量功能仍处于 beta 测试或“预览”阶段。
以下是一些在本次峰会上发布的、未来开发者和数据专业人士可能有机会亲自尝试的关键新产品和功能。
自动化贯穿始终
许多企业正转向使用 AI 代理来实现部分流程自动化。对此,Databricks 推出了 Agent Bricks —— 一个用于自动化构建 AI 代理的工具。
它是公司 Data Intelligence 平台 的核心组成部分。Databricks 将其定位为一种简化代理构建流程的方式,因为大多数企业既没有时间也没有足够的人才去反复迭代地构建并匹配一个代理到具体用例中。分析人士指出,这一领域此前一直被竞争对手忽视。
另一个让 Databricks 在代理构建工具方面区别于其他厂商的地方,在于它采用了不同的代理生命周期管理方式——不是通过构建者界面,而是通过 Unity Catalog 和 MLflow 3.0 来进行管理。
目前该功能仍在 beta 测试阶段,其接口已支持 模型上下文协议(MCP),预计未来还将支持 谷歌的 A2A 协议。
消除数据工程瓶颈
Databricks 正在努力帮助企业在 AI 项目中消除因数据工程效率低下而造成的瓶颈的另一个领域是数据管理。
为此,它推出了由生成式 AI 助手驱动的数据管理工具 Lakeflow Designer,使数据分析师能够承担以往通常需要数据工程师处理的任务。
Lakeflow Designer 可以被称为“ETL 领域的 Canva”,提供即时、可视化、AI 辅助的数据管道开发体验。同时,Databricks 也将其视为促进分析师与工程师之间协作的一种方式。
该工具已集成进 Lakeflow Declarative Pipelines,并支持 Git 和 DevOps 流程,提供血缘追踪、访问控制和审计能力。
业务用户也能使用分析工具
Databricks 还推出了一款面向非技术人员的、无需编码的 Data Intelligence 平台版本,名为 Databricks One,通过对话式用户界面向业务用户提供 AI 和商业智能工具。
作为当前处于私测阶段的 One 平台的一部分,Databricks 用户可通过 Data Intelligence 平台免费访问 Databricks One,并获得 AI/BI 仪表板、Genie 和 Databricks Apps 等功能,同时内置 Unity Catalog 和 Databricks IAM 平台提供的治理与安全机制。
AI/BI 仪表板 将使企业中的非技术人员能够创建和访问数据可视化图表,并执行高级分析,而无需编写代码。Genie 是一款对话式助手,用户可以使用自然语言向其提问关于数据的问题。
此外,Databricks 还推出了其 Data Intelligence 平台的免费版本,旨在让更多数据专业人士和开发者使用该平台。
将 Neon 集成进 Data Intelligence 平台
在以 10 亿美元收购 Neon 一个月后,这家云湖仓服务提供商将 Neon 的 PostgreSQL 架构以 Lakebase 的形式集成进了其 Data Intelligence 平台。
将托管型 PostgreSQL 数据库加入 Data Intelligence 平台后,开发者可以更快速地构建和部署 AI 代理,而无需同时扩展计算和存储资源,从而避免性能瓶颈,简化基础设施问题并降低成本。
BladeBridge 支持下的 AI 辅助数据迁移集成
在 2 月份收购 BladeBridge 后,Databricks 最终将其功能集成进 Data Intelligence 平台,命名为 Lakebridge —— 一个免费的、AI 辅助的数据迁移工具,可帮助企业将数据迁移至 Databricks SQL。
本月早些时候,Databricks 的竞争对手 Snowflake 也推出了类似工具 SnowCovert,利用代理协助企业将数据、数据仓库、商业智能(BI)报告和代码迁移到其平台。
另外,Databricks 还宣布了 Unity Catalog 在管理 Apache Iceberg 表格 方面的能力进一步增强。