Zleap技术解密：后RAG时代已来，SAG重新定义AI搜索

鹭羽
2025-11-18
11:17:48

来源：量子位

SAG可以成为企业、个人乃至整个Agent领域的底层技术支撑

大家好，我是Jomy，是智跃Zleap的CEO，也是Zleap产品和技术的主要设计者。

此前在报道中，我曾粗略介绍过Zleap产品背后的技术：一个能帮助CEO自动整理、总结海量企业内部信息的智能Agent。今天，我要正式为大家介绍驱动这个Agent的底层技术：SAG。

这个产品发布后获得了不少关注。但最近，在与多位朋友、客户和投资人交流的过程中，我有了新的认知：SAG的潜力远不止服务于管理者的Agent一体机，它可以成为企业、个人乃至整个Agent领域的底层技术支撑，推动AI行业向前迈进一小步。

所以我今天就和大家详细讲解一下，SAG背后的技术原理和应用方向。

SQL驱动

SAG的全称是SQL-Retrieval Augmented Generation，即检索部分主要由SQL驱动。

传统RAG是向量驱动的：将问题转化为向量，在原文的向量空间中模糊匹配语义，找到相似度较高的分块，最后传给LLM回答。这个方案高效，但缺点明显——过于依赖原文相似度，无法进行深度检索。

后来出现了GraphRAG，基于知识图谱的检索。其原理是先用LLM分析原文，生成实体和关系，再进行检索。本质上是让LLM对原文进行深度分析和提取，创造了一个中间层，通过知识图谱将问题和答案关联起来。这个方法效果不错，但缺点也很明显：速度慢、成本高，且增量数据需要重新生成图谱。

我们的SAG在传统RAG和GraphRAG的基础上更进一步。它结合了SQL的精准检索和向量的模糊匹配能力，在检索过程中实时构建数据关系，打破了RAG领域的”不可能三角”——同时实现快、准、全。

自然语言向量

SAG的一个重要环节是最初的数据处理。

与GraphRAG类似，SAG也会创建一个中间层，我称之为”事件“。其核心是将繁杂的信息提炼为一个个原子化的事件，类似人脑将一个复杂的事拆解成多个简单的事。

但与GraphRAG不同的是，SAG不会在数据处理时就生成事件之间的关联，而是在查询时实时计算事件关系，从而解决了增量数据更新的问题。

那么如何将不同事件关联起来，正是SAG的核心所在。背后的奥秘是：在数据处理阶段，SAG不仅只是提取事件，还会为每个事件提取多维度的属性，我称之为”自然语言向量“。

类似于向量用不同的数字在不同维度表达语义，自然语言向量则用不同的属性作为维度，属性的值对应维度的值。不同的事件，维度是相同的，例如时间、地点、行为、人物等。这个过程本质是让LLM把事件中的关键Token进行了结构化+泛化处理。

总之，每个事件都可以用一个自然语言向量来表达其大部分语义。

提取事件和属性这件事只需要很小的模型就能完成，大大降低了算力的成本。而且在SAG中，维度是可以自己定义的，不同的行业根据自己数据类型的不同，可以增加一些专有的维度。

六度分隔理论

那么为什么自然语言向量可以在查询时实时构建不同事件的关系？这个灵感我是来自社会工程学中的”六度分隔理论“。

六度分隔理论简单来说就是：你和任何陌生人之间相隔不超过六个人。比如A认识B，B认识C，A和C可能没有任何交集，但因为A和B有交集，B和C有交集，A就和C产生了联系。

类比到SAG中，人就像事件，交集就像相同的属性。所以理论上，任何事件之间都可以通过中间事件的共同属性产生联系。

而事件和属性在数据处理时就已提取完成，查询时只需在SQL中检索，无需LLM参与，因此实时构建数据关系的计算是极其快速的。

驯化不确定性

大家都知道，SQL是精准匹配，如何应对用户千奇百怪的提问呢？比如当你检索”苹果公司”时，是无法通过SQL关联到”Apple Inc”。为了解决这个问题，我就利用了向量的语义匹配能力。

SAG会将所有属性同时存入向量数据库和SQL数据库。当你搜索”苹果公司”时，向量可以语义匹配到”Apple Inc”，甚至可以匹配到“iPhone”。此时再拿着”苹果公司”、”Apple Inc”和“iPhone”去SQL中查询，就不会有遗漏了。

传统基于向量的检索非常擅长进行语义的模糊匹配，但又有很大的不确定性。SAG恰恰利用这一点，结合了向量和SQL的优势——以SQL为主，驯化了向量的不确定性，做到了鱼和熊掌兼得。

当驯化了不确定性，SQL的优势就凸显出来了。例如我们可以针对某几个属性精准和完整的检索，甚至可以直接对某个属性的事件进行统计。由于SAG的SQL表结构相当简单，LLM的Text-to-SQL能力完全能够胜任。

累积效应

SAG让每一次检索都更精准，这也带来了显著的累积效应。

以往大家觉得RAG的多跳效果一般，本质上是因为”Garbage In, Garbage Out“——首次检索质量不高，再多轮也起不了太大作用。

而SAG显著提升了每一次原子检索的质量，为LLM提供了更多关联事件，多轮推理的效果也会有质的飞跃。

企业的应用

SAG的本质是利用AI将非结构化数据转化为结构化数据，这在企业场景中蕴含着巨大的应用潜力。

首先，作为企业智能决策助手。

就像我们的首款产品Zleap-D1 Agent一体机，SAG能够唤醒企业沉睡的历史数据，实时连接最新业务数据，通过报告、搜索、问答等应用形态，为管理者提供决策辅助和全新的商业洞察。

其次，作为通用数据处理引擎。

SAG可以作为独立的数据处理器，重构企业现有的所有数据。无论是电商推荐、金融风控，还是广告投放，都能从中获益——用更智能的数据显著提升原有算法的效果。

最后，作为低成本的AI转型方案。

SAG能够帮助传统企业跨越信息化阶段，直接迈入AI化时代。SAG通过AI将繁杂的非结构化信息转化为统一的数据格式，为更深层的应用场景奠定了坚实的数据基础，有望加速整个toB应用生态的发展。而且SAG的数据处理是异步进行的，不仅可以使用小模型，还可以利用起夜间的闲置算力，让企业以更低的门槛处理海量历史数据，真正迈入AI时代。

个人的应用

SAG在个人应用方向同样前景广阔。

首先，作为个人知识库的底座。SAG可以让你的笔记、文档、收藏真正变成可检索、可关联的知识体系，而不只是一堆躺在文件夹里的信息。

其次，作为个人AI的记忆中枢。让AI更好的记住你的偏好、习惯、历史对话，真正成为懂你的智能助手。

更重要的是，SAG足够轻量。由于对算力需求极低，经过精简的系统甚至可以完全离线运行在手机上，效果依然出色——你的数据永远在你自己手里。

Agent的应用

对于Agent来说，上下文工程已经成为Agent开发的核心共识，但现有的上下文检索往往过于粗暴。比如Claude Code的grep搜索，只能做正则匹配，缺乏深层次的结构化理解。

而SAG可以成为未来Agent的记忆与数据基座，快速为Agent提供更精准、更优质的上下文。就像前面提到的累积效应——在更好的上下文加持下，原本需要10步才能完成的任务，可能3步就能搞定，大幅提升Agent的运行效率和成功率。

开源

总的来说，SAG是新一代的RAG技术，融合SQL与向量的优势，实现了快速、准确、全面的AI检索，为企业、个人和Agent领域提供了更强大的数据基座。

为了可以让所有企业都可以使用到SAG技术，也希望为行业发展贡献一份力量，我们决定将这个技术开源：

https://github.com/Zleap-AI/SAG

本次由于篇幅问题，其实有的非常多的细节并没有讲，比如事件和属性通过具体什么算法进行动态关联，又比如多轮召回时的动态剪枝策略等等，关于更具体的算法和原理，请查看我们的开源代码。也欢迎有兴趣的企业和高校与我们合作探索。

总结

我们认为，SAG的价值远不止于替代RAG——它更大的意义在于，能以极高效率将各种信息转化为统一的多维知识图谱。设想这样一个未来：SAG通过一个简洁优雅的数据格式，打通所有信息源，让数据不再是孤岛，而是可以互相连接甚至交易的资产。而这些海量的结构化数据，又可以被AI充分检索和利用，推动整个社会生产效率的跃升。

这就是我们智跃Zleap的愿景：让所有信息产生连接，让所有数据成为资产。

为了大家更方便地体验这个技术的能力，我们也为普通用户做了一个产品，可以将公共信息和私人信息聚合在一起，定时生成报告，或进行问答和搜索。

由于产品仍处于Beta阶段，我们实施了邀请码机制。邀请码将通过智跃公众号定期发布，感谢您的关注。

Web：https://app.zleap.com.cn

APP：iOS App Store搜索Zleap

2025 年 11 月
一	二	三	四	五	六	日
	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

Zleap技术解密：后RAG时代已来，SAG重新定义AI搜索

Zleap技术解密：后RAG时代已来，SAG重新定义AI搜索

SQL驱动

自然语言向量

六度分隔理论

驯化不确定性

累积效应

企业的应用

个人的应用

Agent的应用

开源

总结

手把手教你用AI 10分钟生成一个APP！零基础也能搞定

手把手教你用AI 10分钟生成一个APP！零基础也能搞定

文心AIGC

手把手教你用AI 10分钟生成一个APP！零基础也能搞定

手把手教你用AI 10分钟生成一个APP！零基础也能搞定