AI 新闻
大模型

腾讯开源 Agent 记忆技术方案,Token 消耗最高降低 61%

量子位2026年05月14日 22:21大约 21 小时前3 分钟阅读

腾讯这回把自家Agent的记忆方案开源了,结果挺吓人:Token消耗最高降了61%,任务成功率最高提了51%。这两个数字放在一起,基本等于在说——以前你花10块钱让AI干活,现在4块钱就能搞定,而且干得还更好。

先别急着喊“牛X”,得看清这技术到底解决了什么问题。Agent(智能体)最大的痛点是什么?记性差。你跟它聊几句,它转头就忘,得反复把历史对话塞进上下文。这就像你每次跟同事对接,都得把前三次会议纪要重讲一遍,不累才怪。腾讯的方案说白了,就是给Agent装了个“外挂硬盘”——把关键记忆存起来,需要时精准调取,而不是把整本小说都塞进提示词里。

61%的Token节省不是玄学。做过大模型应用的人都知道,上下文窗口越长,推理成本指数级上升。很多团队做Agent,80%的预算都花在“喂历史”上。腾讯这个开源方案,等于直接砍掉了这部分大头支出。51%的成功率提升更实在——因为Agent现在能记住“上次用户说喜欢简洁回复”,下次就不会再啰嗦了。

不过得泼盆冷水。开源是好事,但别指望拿过来就能用。这套方案需要你自己搭建记忆存储和检索系统,还得跟现有Agent框架做适配。对中小团队来说,学习成本并不低。而且腾讯没有公布具体测试场景——是在客服、代码生成还是游戏NPC里做的测试?不同场景下效果可能天差地别。

但方向是对的。Agent要想真正落地,记忆问题必须解决。腾讯这次把方案开源,等于给行业定了个基线标准。接下来就看谁能在这个基础上,把记忆做得更轻、更准、更便宜。毕竟,让AI记住该记的,忘掉该忘的,这才是智能体该有的样子。

一句话摘要

腾讯开源Agent记忆技术方案,Token消耗最高降低61%,任务成功率最高提升51%。

来源:量子位