三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库

16次阅读
没有评论

三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库

全球客户数已突破4000家

AI时代,真是啥都要快。

三行代码构建一个AI应用,现在就这样被蚂蚁OceanBase游刃有余地实现了。

三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库

熟悉数据库的朋友都知道,OceanBase是蚂蚁集团于2010年发布的一款全自研的国产企业级分布式关系数据库

历经15年迭代升级,如今它不仅在权威测评中稳居国产数据库第一梯队,其稳定性更是经过了“双十一”等高并发场景的持续验证。

悄悄补充一句,OceanBase还在现场秀出了最新成绩单——全球客户数已突破4000家,连续五年年均增速超100%,服务覆盖16个国家和地区、60多个地域、240多个可用区。

而且截至今年5月,经过四年开源实践,OceanBase已形成拥有超过25000名开发者的活跃社区,累计下载量突破百万

三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库

但随着AI时代的到来,OceanBase也迎来了新的考验:

AI时代需要怎样的数据库?OceanBase如何继续保持领先?

一切答案,都藏在刚刚落幕的2025 OceanBase年度发布会上了——

这一次,他们不是用语言,而是用实打实的产品给出最新思考。

面向AI时代的原生混合搜索数据库

具体而言,OceanBase发布并开源了其首款AI数据库——OceanBase seekdb(简称seekdb)。

发布会上的介绍是酱婶儿的:

开发者仅需三行代码,即可快速构建知识库、智能体等AI应用,轻松应对百亿级多模数据检索,真正实现“开箱即用”的AI数据基座。

三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库

MIT的一项研究显示,超95%的企业AI项目因多模态数据割裂、系统链路冗长、权限管理复杂难以落地。

而seekdb正是在这些痛点上下文章:

过去在做交易和分析时,行业主要关注数据库中的查询以及数据分析等功能,但在AI应用场景下,除了交易和分析功能外,更需要对不同类型和模块的数据进行混合检索和综合利用。

在OceanBase CTO杨传辉看来,这是与传统最大的区别,也是当前行业普遍面临的挑战。换言之:

混合搜索,正在成为AI原生数据库的“分水岭”。

于是,他们就为seekdb配备了AI原生混合搜索能力

它支持在一个查询中融合向量检索、全文搜索与标量过滤,采用“粗排+精排”多阶段检索机制,在低延迟的同时提升精度。依托成熟的事务引擎,它支持实时写入与ACID一致性,并兼容MySQL生态。

此外,seekdb支持标量、向量、文本、JSON和GIS等多模数据的统一存储与检索。例如,在反欺诈场景中,可直接查询“近7天交易超5万元、位置异常且行为类似历史欺诈样本”,无需跨系统调用,兼顾性能与安全。

三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库

而针对落地难的问题,seekdb也支持极简部署,开箱即用

据介绍,seekdb最低仅需1核CPU、2GB内存,支持pip install一键安装、秒级启动,兼容嵌入式与客户端/服务器双部署模式,可轻松集成至智能Agent、开发工具链或本地应用,大幅降低AI应用的工程门槛。

这就好比将一套企业级数据库的复杂度,降低到了像使用一个普通Python库一样简单,从而让开发者能专注于AI应用逻辑本身,而非底层基础设施的运维。

三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库

最后,OceanBase这次还把seekdb给开源了。

采用开发者友好的Apache 2.0协议,用户可自由使用、修改和扩展。

而且产品全面兼容HuggingFace、Dify、LangChain等30余种AI框架及MCP大模型协议,无缝融入AI生态;并提供SQL及PythonSDK,适配不同开发习惯。

三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库

整体而言,在OceanBase CEO杨冰看来,AI的真正瓶颈不在模型,而在数据

尤其在金融、政务等高敏场景,AI需在毫秒级完成实时推理,并安全融合私有数据。而传统架构依赖多系统拼接数据链路,不仅复杂低效,还易引发权限混乱与延迟风险。他表示:

seekdb不是传统数据库的功能叠加,而是专为AI时代重构的AI原生数据库

它继承OceanBase的代码和设计理念,更轻量、更敏捷,目标是成为大模型与私有数据融合计算的‘实时入口层’。

而且,作为OceanBase“Data×AI”战略的关键一环,seekdb既可独立使用,也可融入新发布的OceanBase 4.4一体化融合版本

三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库

该版本首次将TP(联机事务处理)、AP(联机分析处理)与AI能力集成于单一内核,兼具分布式扩展、多云部署与金融级高可用,以帮助企业避免后期架构重构。

据悉其商用LTS版本将于2026年2月2日推出。

还开源了这些

与此同时,OceanBase还开源了一系列工具。它们与seekdb一起,构成了OceanBase面向AI应用的完整工具链,覆盖数据管理、检索、解析、记忆等关键环节。

智能文档解析框架PowerRAG

PowerRAG是OceanBase基于其“混合搜索”能力打造的、源自蚂蚁内部实践的企业级RAG(检索增强生成)解决方案。

一旦开发者需要构建一个企业知识库、智能客服等AI应用,直接用PowerRAG,就可以省去自己组合多种工具(向量数据库+全文搜索引擎+关系数据库)、并反复调优以达到生产标准的繁琐过程。

三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库

分层记忆架构PowerMem

PowerMem核心解决,如何让大模型更高效、更智能地记住和管理与用户互动的上下文信息。

它充当了一个外部的、可无限扩展的“记忆仓库”,帮助AI应用(尤其是智能体Agent)存储、检索和利用海量的历史对话、用户偏好、知识片段等上下文信息。

在记忆体领域的权威评测基准LoCoMo Benchmark上,它以73.70分登顶SOTA,Token消耗降低96%,大幅节省了推理成本。

三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库

至此,通过以上这些开源发布,面对“AI时代我们需要怎样的数据架构”这一问题,OceanBase给出的答案也很清晰了——

通过“多负载+多模+混合多云”实现数据统一,并通过“弹性底座+原生多租户/混合搜索”实现智能与效率

换句话说,OceanBase正在用一套覆盖多负载、多模态、混合多云的统一数据底座,把企业里分散在不同系统、不同格式、不同云环境中的数据重新“拉”回一张桌子上;再用弹性底座、原生多租户(单集群多业务隔离)与混合搜索,让这些数据既能被安全管理,又能被AI实时高效地调用。

三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库

这意味着,AI时代的企业不必再为一个应用拼几十个系统,而是只需要一个能同时处理交易、分析、搜索与AI推理的统一数据库内核。就像大会过程中提到的那样:

想开发AI应用,现在只需一个数据库了。

以及动手能力强的童鞋现在就能试试,用三行代码手搓一个AI应用(doge)。

seekdb开源地址:
https://github.com/oceanbase/seekdb

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy