为支持AI工作负载,Redis新增向量集合数据类型

作者:

CBINEWS

责任编辑:

邹大斌

来源:

电脑商情在线

时间:

2025-04-14 08:26

关键字:

Redis 数据库 向量集合 向量数据库 AI

Redis 创始人 Salvatore Sanfilippo 的回归结出了果实——为这个广泛使用的从缓存转型为多模型数据库的系统引入了一种新的数据类型:向量集合。

向量集合的灵感来源于 Redis 的核心数据类型之一——有序集合(sorted sets),后者以处理有序集合而闻名。向量集合提供了一种原生方式来存储和查询高维嵌入,重点是为 AI 工作负载提供向量相似性搜索。

Redis 最初于 2009 年诞生,旨在构建一个高性能的键值数据库。到 2020 年底,它已成为 AWS 上最受欢迎的数据库,这得益于它在云原生应用堆栈中作为缓存和消息代理的流行地位。此后,Redis 扩大了其雄心,增加了机器学习功能和对 JSON 文档的支持,试图超越其缓存的根基。

Sanfilippo,以昵称 antirez 更为人知,于 2020 年中期辞去了 Redis 的维护者职务,表示他希望专注于编写代码而不是管理项目。

他于去年 12 月回归,成为“公司与社区之间的桥梁,同时也是能够制作编程演示、发明和描述新模式、撰写有关新旧事物的文档、视频和博客文章的人”,根据他的博客,这里指的是继续指导软件开发的 Redis 公司。

这种新的数据类型是 Sanfilippo 回归的成果,并在 Redis 的有序集合基础上进行了扩展,通过启用高维向量嵌入的存储和查询——例如,在生成式 AI 应用中,这些嵌入通常用于在大型语言模型(LLM)中表示语义含义。

Redis 已经通过其 2023 年推出的查询引擎支持向量相似性搜索,这使得开发人员能够根据余弦相似性等接近度指标找到与目标输入最相似的向量。

Redis 首席执行官 Rowan Trollope 表示,向量数据集提供了一个更底层的 API,使开发人员能够更直接地控制底层向量数据——这一转变旨在灵活性和性能。

“它非常快,易于组合,并且在你如何在应用程序中实现它方面非常灵活。这非常符合 Redis 的理念。Sanfilippo 必须重写整个向量数据库的基础——称为 HNSW(分层可导航小世界)——作为一种新算法,”他说。

向量集将以测试版形式作为 Redis 8 社区版的一部分于 5 月推出,其功能和 API 将根据反馈进行调整。

Redis 还宣布了 LangCache,这被描述为 AI 应用和代理的语义缓存服务。其目标是通过缓存对语义相似查询的先前响应来减少对大型语言模型(LLM)的昂贵且延迟敏感的调用。

LangCache 将作为完全托管的 REST 服务推出,位于应用程序和 LLM 之间,拦截请求以在可能的情况下提供缓存的响应。

“在数据库世界中,当你有一个确定性的查询,比如 SQL 字符串时,缓存并不像听起来那么简单。在语言模型的情况下,你需要一个概率性或语义缓存,因此我们在底层使用我们的向量数据库,并使用一个针对缓存优化的微调嵌入模型,”Trollope 告诉我们。

ToB最前沿

ToB最前沿抖音号

CBI科技在线

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-3
京公网安备:11010502051901号
ICP证:京B2-20230255