Snowflake 推出Cortex AISQL 简化非结构化数据分析
CBINEWS
责任编辑:邹大斌
电脑商情在线
时间:2025-06-04 09:37
Snowflake AI SQL AISQL 数据仓库
Snowflake 正在为其 SQL 引擎添加由生成式 AI 驱动的新功能,以帮助数据分析师及其组织更轻松地使用 SQL 分析非结构化数据。
这些新的 AISQL 功能将成为 Snowflake Cortex 的一部分。Cortex 是 Snowflake Data Cloud 内的一个全托管服务,提供使用大语言模型(LLMs)所需的构建模块,而无需管理复杂的 GPU 基础设施。该服务目前已包括一些Serverless函数,可从 SQL 或 Python 中调用,用于分析数据或构建 AI 应用程序。
Snowflake 产品高级副总裁 Christian Kleinerman 表示,AISQL 在这些Serverless函数的基础上进一步发展,能够实现对非结构化数据的分析、提升查询性能,并消除数据分析师对数据工程师和开发人员的依赖。
对于希望获得更准确商业洞察和更快决策的企业来说,直接通过 SQL 查询非结构化数据的能力至关重要。
Constellation Research 的首席分析师 Michael Ni 指出,Snowflake 并不是首次支持通过 SQL 语法访问非结构化数据,但这些由生成式 AI 赋能的功能使这一过程变得更加简便。在 AISQL 推出之前,企业可以通过多种方式使用 SQL 来访问非结构化数据——例如使用 Document AI 加载文档中的数据、使用 TEXT 列,或创建带有 FILE 列的表并通过 SQL 执行查询,尽管存在一定的限制。
Google 的 BigQuery ML 也允许企业使用 SQL 对基于非结构化数据准备的机器学习模型结果进行查询。
Ni 还强调,AISQL 最重要的意义在于它可能消除数据分析师对数据工程师或科学家的依赖。
“通过将生成式 AI 嵌入熟悉的 SQL 语法中,Snowflake 使得数据分析师无需编写 Python 代码或管理机器学习流水线,就能执行情感分析、图像分类和文档解析等任务——将 AI 真正落地到查询层,而不仅仅停留在实验室阶段。”他说。
Futurum Group 数据与分析业务负责人 Bradley Shimmin 表示,AISQL 的另一个优势是,它有助于让 Snowflake 成为企业统一的数据查询引擎,可以处理各种类型的数据。
Shimmin 指出,Snowflake 并不是唯一一家试图将非结构化数据与结构化数据融合进行分析的数据仓库软件提供商。Databricks、Google 和 Oracle 等厂商要么已经推出了类似能力,要么正在开发相关功能。
但他补充道:“这些厂商还需要在分析领域做更多工作,才能真正为企业创造价值,尤其是在 SQL 方面,或许可以引入增强检索生成(RAG)的方法,或者提高生成 SQL 语句的准确性与质量。”
Shimmin 提到,IBM 是在这方面做得较多的一家厂商:最近,IBM 在 watsonx.data 中推出了一项更新,通过对目标用于 RAG 流水线的非结构化数据源添加可查询的结构化数据来加以增强。“用户随后可以结合 SQL 和语义搜索,优化数据访问和准确性。”
Cortex AISQL 使用了来自 Anthropic、Meta、Mistral 和 OpenAI 等公司的大型语言模型(LLMs)来生成 SQL 函数。
在性能方面,Snowflake 宣称该功能可以根据不同数据集将查询响应时间缩短 30% 至 70%,并在进行数据过滤或连接操作时节省高达 60% 的成本。
目前,Cortex AISQL 已进入公开预览阶段。