热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai资讯 >腾讯开源了 Agent Memory,让 AI 真正记住你。

腾讯开源了 Agent Memory,让 AI 真正记住你。

来源:互联网 更新时间:2026-06-11 14:23

腾讯开源了一个项目,两个月拿了 4600+ Star。

做的事非常专一:给 AI Agent 装上长期和短期记忆。

装完之后什么效果?评测数据摆在这:针对长期记忆,整体准确率从 47.85% 涨到 76.10%,提升将近 60%。用户事实召回从不到 30% 飙到 79%。基于短期记忆的加持,长任务中最高节省 61% token。

这个项目叫

TencentDB Agent Memory

,腾讯云数据库团队做的,5 月 14 日正式开源的。来看看在 OpenClaw 和 Hermes 中的效果。

<iframe src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_4539308625571659779"></iframe> <iframe src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_4539307976242905090"></iframe>

01 AI 记忆到底难在哪

你有没有发现,每次打开一个 Agent 新会话,它都像失忆了一样,啥都不记得。你得把相关的上下文或信息重新给它说一遍,它才能干好活。

Memory 的目的就是提高效率。TencentDB Agent Memory 的思路和主流的方案不太一样——它走的是

符号化短期记忆 + 分层长期记忆

这条路。

开源地址:https://github.com/TencentCloud/TencentDB-Agent-Memory

现在主流的解决方案大概有三种,但都有明显短板。

  • 全塞进上下文窗口

    :简单粗暴,但窗口有上限,塞多了 token 直接爆掉。
  • 向量数据库做记忆

    :比全塞好一些,但只存不提炼,很多对话碎片导致召回率低,精确度差。
  • 让大模型自己做摘要压缩

    :压缩不可逆,可能会造成关键细节丢失。

02 腾讯开源项目的核心架构

这个项目最核心的设计,是一套

四层渐进式记忆架构

:L0 到 L3,从底到顶,每一层干的事都不一样。

  • L0:原始对话。

    全量保留,一字不落。兜底用,随时可回查。
  • L1:原子事实。

    自动从对话里提取独立的事实节点,比如“我爱吃火锅”“我用 NextJS”,打标签存起来。
  • L2:场景聚类。

    相关的原子事实按场景聚合。比如用户系统讨论涉及的所有事实——表结构、权限、接口——合成一个场景块,Markdown 格式,人可直接读。
  • L3:用户画像。

    基于下面三层生成稳定的用户画像,沉淀技术偏好、代码风格、常用工具链。

这样既不会因为上下文太长影响推理,也不会丢失关键信息。而且系统保证从顶层到原始证据有完整的回溯路径:L3 里说用户偏好 TypeScript,这个结论可以追溯到 L2 某个场景块,场景块里的每条结论又能追溯到 L1 的原子事实,原子事实最终指向 L0 里你说过的那句话。整条证据链不断裂。

03 短期记忆压缩:巧用 Mermaid 图

四层架构解决长期记忆,但短期上下文也是烧钱大户。AI 排查一个 bug 要调用十几次工具,上下文塞满日志。

解法是

符号化记忆

:把完整日志卸载到外部文件,用 Mermaid 语法画一张紧凑的任务状态图塞进上下文,需要细节时再通过节点 ID 检索。

Mermaid 用极少的 token 把线性摘要列表重组为带状态、依赖关系和可寻址索引的任务拓扑结构图。让 AI 大模型不靠记住什么标签,而是靠从图的拓扑中推理出结构来理解任务全貌。信息密度更高、结构不丢失、细节可逐层找回。

实测 Token 消耗直降超 50%,任务完成率反升 23%。省了钱,活还干得更好。

语义检索(Embedding)擅长模糊匹配,关键词检索(BM25)擅长精确命中。两路各自召回候选结果,RRF 融合排序。语义相关的不会漏,精确匹配的也不会丢。

04 跑出来的数据

说了这么多设计,来看实际跑出来的数据。腾讯用 PersonaMem 基准测试做了评测,对比的是原生 OpenClaw 和接入 Agent Memory 之后的 OpenClaw:

指标原生 OpenClaw接入 Agent Memory
总准确率47.85%76.10%(+59%)
用户事实召回29.63%79.07%(+167%)
偏好跟踪66.67%83.45%(+25%)
个性化推荐46.67%76.36%(+64%)

用户事实召回这个指标最夸张,从不到 30% 涨到 79%。意思是以前你跟 AI 说过的十件事,它只能想起三件;现在能想起八件。

除了 PersonaMem,项目还跑了几个编程相关的基准测试:

  • WideSearch 成功率 33%→50%,token 砍 61%;
  • SWE-bench 通过率 58.4%→64.2%,token 省 33%。

(WideSearch 评估信息任务中的搜索、整合与验证能力;SWE-bench 评估 AI 模型解决真实软件工程问题的能力。)

加了记忆不光记住了更多,做任务效率也变高了,省下的 token 都用在干正事上。

05 怎么用

这个项目现在是作为 OpenClaw 的插件发布的,安装非常简单,一行命令搞定:

openclaw plugins install @tencentdb-agent-memory/memory-tencentdb

装完之后默认使用本地 SQLite + sqlite-vec 作为存储后端,零配置,开箱即用。不需要单独装数据库,不需要连外部服务,数据全在本地。如果你想接外部 Embedding 服务来增强语义检索效果,可以在配置文件里指定。

如果你用的是 Hermes Agent 框架,项目也提供了 Docker 一体化镜像——把 Hermes + Agent Memory 插件 + Gateway 全打包在一个容器里,docker pull 下来就能跑。支持的模型也很灵活。

新的 1.0.0-beta.1 版本给希望自己开发 Agent Memory 适配层的用户提供了快速开始的方法。

06 腾讯云数据库AI能力版图

TencentDB Agent Memory 不是腾讯云凭空搞出来的独立项目。它是 5 月 29 日腾讯云「数据库+AI」发布会的一部分。这场发布会的主题叫“AI 原生·重构数据库新范式”,核心思路是:当 Agent 成为新的生产力单元,数据库的使命就要从存数据演进为支撑智能体感知、记忆、决策与协作的数据底座。

沿着 AI 原生数据库这条线,腾讯云这次一口气发了好几样东西:

  • DatabaseClaw,腾讯云第一个数据库 Agent

    :跟普通的 AI DBA 助手不一样,它不只是回答问题,而是能真的进入生产环境承担运维职责,7×24 小时跑着。自动巡检、异常诊断、慢 SQL 归因——DBA 日常最耗时间的事它都能干。而且构建了四层安全防线:权限隔离、AI 行为护栏、架构安全、全链路审计,让 DBA 敢把生产库权限交给它。
  • TDSQL Boundless,新一代分布式数据库

    :在一套统一的分布式架构上,支持关系型事务处理、向量语义检索与全文搜索等多种数据类型,多种访问模式、多种模型数据在同一个连接、甚至同一个事务中完成,不用再为不同数据类型维护不同的数据库了。
  • TDSQL-C,云原生数据库全面升级

    :这次 TDSQL-C 重构的第三代存储架构 AI Native Storage 主打三个字:稳、灾、省。业务无感的存储组件发布和坏盘替换,最终质变是:极致性价比,TCO 较同类产品下降 200%+;IO 零抖动,全链路无损变更;数据零丢失,3 AZ 金融级强同步、RPO=0。依托第三代存储架构,TDSQL-C 还系统化升级为面向 AI 时代的双引擎云原生数据库,内核采用 PG 与 MySQL 双引擎的云原生计算节点。可一站式对接腾讯云 cloudbase 的 Baas 平台以及 Cursor、FastGPT 等 AI 开发者应用,用 MCP、REST 等协议实现统一接入。

这些产品放在一起看,腾讯云数据库在做的事情是:从底层的数据库引擎,到中间的记忆和运维能力,再到上层的 AI 开发体验——整套 Agent 时代的数据基础设施都在用 AI 原生的思路重构一遍。而 Agent Memory 是其中跟开发者关系最近的一环:它直接解决了“AI 怎么记住你”这个所有人都会遇到的问题。

AI自动绘画大师
AI自动绘画大师

类型:益智休闲

大小:5.72MB

语言:简体中文

平台:互联网

游戏下载

热门手游

相关攻略

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc