腾讯开源 Agent 记忆技术方案，Token 消耗最高降低 61% | AI 瞭望台

腾讯这回把自家Agent的记忆方案开源了，结果挺吓人：Token消耗最高降了61%，任务成功率最高提了51%。这两个数字放在一起，基本等于在说——以前你花10块钱让AI干活，现在4块钱就能搞定，而且干得还更好。

先别急着喊“牛X”，得看清这技术到底解决了什么问题。Agent（智能体）最大的痛点是什么？记性差。你跟它聊几句，它转头就忘，得反复把历史对话塞进上下文。这就像你每次跟同事对接，都得把前三次会议纪要重讲一遍，不累才怪。腾讯的方案说白了，就是给Agent装了个“外挂硬盘”——把关键记忆存起来，需要时精准调取，而不是把整本小说都塞进提示词里。

61%的Token节省不是玄学。做过大模型应用的人都知道，上下文窗口越长，推理成本指数级上升。很多团队做Agent，80%的预算都花在“喂历史”上。腾讯这个开源方案，等于直接砍掉了这部分大头支出。51%的成功率提升更实在——因为Agent现在能记住“上次用户说喜欢简洁回复”，下次就不会再啰嗦了。

不过得泼盆冷水。开源是好事，但别指望拿过来就能用。这套方案需要你自己搭建记忆存储和检索系统，还得跟现有Agent框架做适配。对中小团队来说，学习成本并不低。而且腾讯没有公布具体测试场景——是在客服、代码生成还是游戏NPC里做的测试？不同场景下效果可能天差地别。

但方向是对的。Agent要想真正落地，记忆问题必须解决。腾讯这次把方案开源，等于给行业定了个基线标准。接下来就看谁能在这个基础上，把记忆做得更轻、更准、更便宜。毕竟，让AI记住该记的，忘掉该忘的，这才是智能体该有的样子。

一句话摘要

腾讯开源Agent记忆技术方案，Token消耗最高降低61%，任务成功率最高提升51%。

来源：量子位