您的位置：首页 > > 教程攻略 > ai资讯 >腾讯开源了 Agent Memory，让 AI 真正记住你。

腾讯开源了 Agent Memory，让 AI 真正记住你。

来源:互联网 更新时间:2026-06-11 14:23

腾讯开源了一个项目，两个月拿了 4600+ Star。

做的事非常专一：给 AI Agent 装上长期和短期记忆。

装完之后什么效果？评测数据摆在这：针对长期记忆，整体准确率从 47.85% 涨到 76.10%，提升将近 60%。用户事实召回从不到 30% 飙到 79%。基于短期记忆的加持，长任务中最高节省 61% token。

这个项目叫

TencentDB Agent Memory

，腾讯云数据库团队做的，5 月 14 日正式开源的。来看看在 OpenClaw 和 Hermes 中的效果。

01 AI 记忆到底难在哪

你有没有发现，每次打开一个 Agent 新会话，它都像失忆了一样，啥都不记得。你得把相关的上下文或信息重新给它说一遍，它才能干好活。

Memory 的目的就是提高效率。TencentDB Agent Memory 的思路和主流的方案不太一样——它走的是

符号化短期记忆 + 分层长期记忆

这条路。

开源地址：https://github.com/TencentCloud/TencentDB-Agent-Memory

现在主流的解决方案大概有三种，但都有明显短板。

全塞进上下文窗口
：简单粗暴，但窗口有上限，塞多了 token 直接爆掉。
向量数据库做记忆
：比全塞好一些，但只存不提炼，很多对话碎片导致召回率低，精确度差。
让大模型自己做摘要压缩
：压缩不可逆，可能会造成关键细节丢失。

02 腾讯开源项目的核心架构

这个项目最核心的设计，是一套

四层渐进式记忆架构

：L0 到 L3，从底到顶，每一层干的事都不一样。

L0：原始对话。
全量保留，一字不落。兜底用，随时可回查。
L1：原子事实。
自动从对话里提取独立的事实节点，比如“我爱吃火锅”“我用 NextJS”，打标签存起来。
L2：场景聚类。
相关的原子事实按场景聚合。比如用户系统讨论涉及的所有事实——表结构、权限、接口——合成一个场景块，Markdown 格式，人可直接读。
L3：用户画像。
基于下面三层生成稳定的用户画像，沉淀技术偏好、代码风格、常用工具链。

这样既不会因为上下文太长影响推理，也不会丢失关键信息。而且系统保证从顶层到原始证据有完整的回溯路径：L3 里说用户偏好 TypeScript，这个结论可以追溯到 L2 某个场景块，场景块里的每条结论又能追溯到 L1 的原子事实，原子事实最终指向 L0 里你说过的那句话。整条证据链不断裂。

03 短期记忆压缩：巧用 Mermaid 图

四层架构解决长期记忆，但短期上下文也是烧钱大户。AI 排查一个 bug 要调用十几次工具，上下文塞满日志。

解法是

符号化记忆

：把完整日志卸载到外部文件，用 Mermaid 语法画一张紧凑的任务状态图塞进上下文，需要细节时再通过节点 ID 检索。

Mermaid 用极少的 token 把线性摘要列表重组为带状态、依赖关系和可寻址索引的任务拓扑结构图。让 AI 大模型不靠记住什么标签，而是靠从图的拓扑中推理出结构来理解任务全貌。信息密度更高、结构不丢失、细节可逐层找回。

实测 Token 消耗直降超 50%，任务完成率反升 23%。省了钱，活还干得更好。

语义检索（Embedding）擅长模糊匹配，关键词检索（BM25）擅长精确命中。两路各自召回候选结果，RRF 融合排序。语义相关的不会漏，精确匹配的也不会丢。

04 跑出来的数据

说了这么多设计，来看实际跑出来的数据。腾讯用 PersonaMem 基准测试做了评测，对比的是原生 OpenClaw 和接入 Agent Memory 之后的 OpenClaw：

指标	原生 OpenClaw	接入 Agent Memory
总准确率	47.85%	76.10%（+59%）
用户事实召回	29.63%	79.07%（+167%）
偏好跟踪	66.67%	83.45%（+25%）
个性化推荐	46.67%	76.36%（+64%）

用户事实召回这个指标最夸张，从不到 30% 涨到 79%。意思是以前你跟 AI 说过的十件事，它只能想起三件；现在能想起八件。

除了 PersonaMem，项目还跑了几个编程相关的基准测试：

WideSearch 成功率 33%→50%，token 砍 61%；
SWE-bench 通过率 58.4%→64.2%，token 省 33%。

（WideSearch 评估信息任务中的搜索、整合与验证能力；SWE-bench 评估 AI 模型解决真实软件工程问题的能力。）

加了记忆不光记住了更多，做任务效率也变高了，省下的 token 都用在干正事上。

05 怎么用

这个项目现在是作为 OpenClaw 的插件发布的，安装非常简单，一行命令搞定：

openclaw plugins install @tencentdb-agent-memory/memory-tencentdb

装完之后默认使用本地 SQLite + sqlite-vec 作为存储后端，零配置，开箱即用。不需要单独装数据库，不需要连外部服务，数据全在本地。如果你想接外部 Embedding 服务来增强语义检索效果，可以在配置文件里指定。

如果你用的是 Hermes Agent 框架，项目也提供了 Docker 一体化镜像——把 Hermes + Agent Memory 插件 + Gateway 全打包在一个容器里，docker pull 下来就能跑。支持的模型也很灵活。

新的 1.0.0-beta.1 版本给希望自己开发 Agent Memory 适配层的用户提供了快速开始的方法。

06 腾讯云数据库AI能力版图

TencentDB Agent Memory 不是腾讯云凭空搞出来的独立项目。它是 5 月 29 日腾讯云「数据库+AI」发布会的一部分。这场发布会的主题叫“AI 原生·重构数据库新范式”，核心思路是：当 Agent 成为新的生产力单元，数据库的使命就要从存数据演进为支撑智能体感知、记忆、决策与协作的数据底座。

沿着 AI 原生数据库这条线，腾讯云这次一口气发了好几样东西：

DatabaseClaw，腾讯云第一个数据库 Agent
：跟普通的 AI DBA 助手不一样，它不只是回答问题，而是能真的进入生产环境承担运维职责，7×24 小时跑着。自动巡检、异常诊断、慢 SQL 归因——DBA 日常最耗时间的事它都能干。而且构建了四层安全防线：权限隔离、AI 行为护栏、架构安全、全链路审计，让 DBA 敢把生产库权限交给它。
TDSQL Boundless，新一代分布式数据库
：在一套统一的分布式架构上，支持关系型事务处理、向量语义检索与全文搜索等多种数据类型，多种访问模式、多种模型数据在同一个连接、甚至同一个事务中完成，不用再为不同数据类型维护不同的数据库了。
TDSQL-C，云原生数据库全面升级
：这次 TDSQL-C 重构的第三代存储架构 AI Native Storage 主打三个字：稳、灾、省。业务无感的存储组件发布和坏盘替换，最终质变是：极致性价比，TCO 较同类产品下降 200%+；IO 零抖动，全链路无损变更；数据零丢失，3 AZ 金融级强同步、RPO=0。依托第三代存储架构，TDSQL-C 还系统化升级为面向 AI 时代的双引擎云原生数据库，内核采用 PG 与 MySQL 双引擎的云原生计算节点。可一站式对接腾讯云 cloudbase 的 Baas 平台以及 Cursor、FastGPT 等 AI 开发者应用，用 MCP、REST 等协议实现统一接入。

这些产品放在一起看，腾讯云数据库在做的事情是：从底层的数据库引擎，到中间的记忆和运维能力，再到上层的 AI 开发体验——整套 Agent 时代的数据基础设施都在用 AI 原生的思路重构一遍。而 Agent Memory 是其中跟开发者关系最近的一环：它直接解决了“AI 怎么记住你”这个所有人都会遇到的问题。