OceanBase 发布首款 AI 数据库 seekdb
CBINEWS
责任编辑:邹大斌
电脑商情在线
时间:2025-11-19 11:51
OceanBase Seekdb 数据库 AI
在 AI 浪潮席卷全球的今天,数据库——这个支撑数字经济的隐形基建,正经历着变革与重塑。诞生于 15 年前的 OceanBase ,也交出了 2025 年的答卷。
11 月 18 日,在 2025 年度发布会上发布并开源了 OceanBase 首款 AI 原生混合搜索数据库 seekdb(简称 seekdb )。开发者仅需三行代码,即可快速构建知识库、智能体等 AI 应用,轻松应对百亿级多模数据检索,真正实现“开箱即用”的 AI 数据基座。
这是 OceanBase 为 AI 时代的“量身定制”,也是专注面向未来的创新突破。
CEO 杨冰认为,AI 的真正瓶颈不在模型,而在数据。尤其在金融、政务等高敏场景,AI 需在毫秒级完成实时推理,并安全融合私有数据。而传统架构依赖多系统拼接数据链路,不仅复杂低效,还易引发权限混乱与延迟风险。
“OceanBase seekdb 不是传统数据库的功能叠加,而是专为 AI 时代重构的 AI 原生数据库。”杨冰表示,“它继承 OceanBase 的代码和设计理念,更轻量、更敏捷,目标是成为大模型与私有数据融合计算的‘实时入口层’。我们希望与开发者一起,在混合搜索、多模融合和 AI 内置等方向加速迭代、大胆创新。”
seekd带来三大核心突破:
一是AI原生混合搜索能力。seekdb 支持在一个查询中融合向量检索、全文搜索与标量过滤,采用“粗排+精排”多阶段检索机制,在低延迟下提升精度。支持通过原生 SQL 及 Python SDK,同步完成结构化过滤、关键词匹配与向量语义计算。其内置 AI Function 功能,更允许直接在数据库内调用大模型或向量处理函数,显著提升效率并降低跨系统权限泄露风险。例如,在金融反欺诈场景中,系统可毫秒级响应“过去 7 天交易超 5 万元、地理位置异常且行为模式接近历史欺诈样本”,无需跨多个系统调用。
二是极简部署,开箱即用。seekdb 最低起步配置仅需 1 核 CPU、2GB 内存,支持 pip install 一键安装、秒级启动,兼容嵌入式与客户端/服务器双部署模式,可轻松集成至智能 Agent、开发工具链或本地应用,大幅降低 AI 应用的工程门槛。
三是更开发者友好。seekdb 以 Apache 2.0 协议全球开源,开发者可自由使用、修改和扩展。产品全面兼容 Dify、Coze、LangChain、LlamaIndex 等 30 余种 AI 框架及 MCP 大模型协议,无缝融入 AI 生态。同期开源的 PowerRAG 智能文档解析框架与 PowerMem 分层记忆架构,后者在 LOCOMO Benchmark 以 78.70 分达到 SOTA 水准,Token 消耗降低 96%,大幅节省推理成本。
作为 OceanBase “Data x AI”战略的关键一环,OceanBase 4.4 一体化融合版本正式发布,该版本首次将 TP、AP 与 AI 能力集成于单一内核,兼具分布式扩展、多云部署与金融级高可用,帮助企业避免后期架构重构风险。商用 4.4.2 LTS 版本将于 2026 年 2 月 2 日推出。
目前,OceanBase 混合搜索能力已在多个行业落地:中国联通基于混合搜索构建统一 AI 知识库,解决私有文档的权限管理与高效检索难题;蚂蚁百宝箱基于混合搜索实现智能体在线搜索。
“这不仅是技术产品,更是开发范式的跃迁。”杨冰表示,“传统数据库只‘存’数据,而 seekdb 能‘理解’数据语义,混合搜索正是 AI 原生数据库的关键分水岭。”杨冰强调:“未来数据库必须同时服务‘人’与‘智能体’。在一个数据库中支撑事务、分析与 AI 混合搜索,在数据源头驱动实时、可信的智能。”
目前,seekdb 已在 GitHub 开源,新域名 oceanbase.ai 同步启用,全球开发者可免费下载使用。此举是 OceanBase 践行 AI 战略的关键一步,旨在推动行业加速迈向“ AI 原生”架构,为全球智能化转型提供更现代、更可落地的数据底座。
