agent memory system

交互式LLM代理的记忆分层、生命周期管理与巩固/触发策略

共同点是面向“对话/交互型LLM代理”的记忆生命周期与检索触发机制:通过记忆分层(短/中/长或工作/情景/语义)、层间更新与巩固策略、以及与上下文/子目标/时间因素相结合的检索与生成,从而提升长对话一致性与个性化。部分工作还关注长程对话下的性能评测或反思式记忆管理。

记忆存储与检索底座:向量数据库、持久化系统与记忆数据结构/框架

共同点是把“外部/持久化记忆存储与检索”作为系统基础设施或方法论核心:包括向量数据库与RAG协同、向量存储的更新/遗忘机制、以及为代理提供原生持久数据库或记忆数据结构(如图/内嵌数据库/记忆fabric)。另外,部分综述/框架讨论了记忆类型分离与长期管理的开放问题,偏工程与机制层面的可实现性。

记忆检索增强与相关性建模(检索模块/注意力/过滤)

共同点是围绕“记忆检索质量”的建模与优化:通过更好的检索打分/注意力分配、记忆增强与过滤(减少无关记忆)、或用检索模块来提升生成代理的适应性与行为一致性。同时,这些工作也与长对话场景中的检索有效性相关。

情景记忆(Episodic Memory)的表示、触发与应用

共同点是将“情景记忆(episodic memory)”作为关键记忆类型来研究其表示、触发与应用:包括基于时间丰富域的符号化/结构化情景记忆、从短时情景缓存到长期存储的流程、以及面向情感交互或类人行为的能力。

长时程任务中的记忆利用:跨时序依赖建模与认知闭环

共同点是面向“长时程/长视野决策”的跨时序依赖:通过注意力/Transformer式记忆策略、在认知循环中显式接入长期记忆检索以形成决策逻辑、或讨论长期记忆对长任务执行与一致性的影响。整体更偏跨时间的记忆利用方式。

记忆系统的隐私与安全风险(记忆泄露与防护需求)

共同点是从安全与风险角度讨论记忆系统:关注代理把用户交互写入记忆后可能发生的隐私泄露,并提出针对记忆的提取攻击与影响因素分析;同时与长程记忆带来的可恢复性/可提取性相关。

  • Unveiling Privacy Risks in LLM Agent MemoryBo Wang, Weiyi He, Shenglai Zeng, Zhen Xiang, Yue Xing, Jiliang Tang, Pengfei He, 2025, Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)
  • Evaluating Very Long-Term Conversational Memory of LLM AgentsAdyasha Maharana, Dong-Ho Lee, Sergey Tulyakov, Mohit Bansal, Francesco Barbieri, Yuwei Fang, 2024, Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)

代理记忆的系统架构、综述与工程化落地(生产/领域应用)

共同点是更偏整体架构与应用落地/工程模式:包括对LLM代理四要素(感知-规划-记忆-行动)的理论综述与记忆管理综述、以及将记忆能力嵌入生产系统(多智能体Web系统、领域运维记忆架构)与基于向量存储的长期机制验证。整体关注系统性与可落地性。

具身/多智能体与实时约束下的记忆-推理耦合与性能优化

共同点是偏“多智能体/具身/实时环境”的部署与性能权衡:在部分可观测、长周期控制、或生产级低延迟约束下,长期记忆如何与策略/推理循环耦合,同时保证吞吐与响应速度。

agent memory system

以上文献可归纳为:围绕“长期记忆如何写入、分层管理、触发检索并支持长程一致决策”,构建记忆底座(向量库/持久数据库/数据结构/记忆fabric/MemoryOS等);进一步通过检索增强(相关性建模、过滤、注意力/巩固量化)提升记忆可用性;在模型层面研究情景记忆与长时程跨时序依赖的利用(episodic/场景记忆、认知闭环);同时从风险侧关注记忆带来的隐私泄露;最后结合综述与工程化研究,覆盖从理论框架到生产系统与具身/多智能体场景的落地路径。

41 篇文献,8 个研究方向
交互式LLM代理的记忆分层、生命周期管理与巩固/触发策略
共同点是面向“对话/交互型LLM代理”的记忆生命周期与检索触发机制:通过记忆分层(短/中/长或工作/情景/语义)、层间更新与巩固策略、以及与上下文/子目标/时间因素相结合的检索与生成,从而提升长对话一致性与个性化。部分工作还关注长程对话下的性能评测或反思式记忆管理。相关文献: Jie Kang et. al, 2025 等 7 篇文献
记忆存储与检索底座:向量数据库、持久化系统与记忆数据结构/框架
共同点是把“外部/持久化记忆存储与检索”作为系统基础设施或方法论核心:包括向量数据库与RAG协同、向量存储的更新/遗忘机制、以及为代理提供原生持久数据库或记忆数据结构(如图/内嵌数据库/记忆fabric)。另外,部分综述/框架讨论了记忆类型分离与长期管理的开放问题,偏工程与机制层面的可实现性。相关文献: Toni Taipalus et. al, 2025 等 8 篇文献
记忆检索增强与相关性建模(检索模块/注意力/过滤)
共同点是围绕“记忆检索质量”的建模与优化:通过更好的检索打分/注意力分配、记忆增强与过滤(减少无关记忆)、或用检索模块来提升生成代理的适应性与行为一致性。同时,这些工作也与长对话场景中的检索有效性相关。相关文献: Chuanyang Hong et. al, 2025 等 4 篇文献
情景记忆(Episodic Memory)的表示、触发与应用
共同点是将“情景记忆(episodic memory)”作为关键记忆类型来研究其表示、触发与应用:包括基于时间丰富域的符号化/结构化情景记忆、从短时情景缓存到长期存储的流程、以及面向情感交互或类人行为的能力。相关文献: Markos Sigalas et. al, 2017 等 7 篇文献
长时程任务中的记忆利用:跨时序依赖建模与认知闭环
共同点是面向“长时程/长视野决策”的跨时序依赖:通过注意力/Transformer式记忆策略、在认知循环中显式接入长期记忆检索以形成决策逻辑、或讨论长期记忆对长任务执行与一致性的影响。整体更偏跨时间的记忆利用方式。相关文献: Zerrin Kasap et. al, 2010 等 4 篇文献
记忆系统的隐私与安全风险(记忆泄露与防护需求)
共同点是从安全与风险角度讨论记忆系统:关注代理把用户交互写入记忆后可能发生的隐私泄露,并提出针对记忆的提取攻击与影响因素分析;同时与长程记忆带来的可恢复性/可提取性相关。相关文献: Bo Wang et. al, 2025 等 2 篇文献
代理记忆的系统架构、综述与工程化落地(生产/领域应用)
共同点是更偏整体架构与应用落地/工程模式:包括对LLM代理四要素(感知-规划-记忆-行动)的理论综述与记忆管理综述、以及将记忆能力嵌入生产系统(多智能体Web系统、领域运维记忆架构)与基于向量存储的长期机制验证。整体关注系统性与可落地性。相关文献: A Tiwari et. al, 2025 等 6 篇文献
具身/多智能体与实时约束下的记忆-推理耦合与性能优化
共同点是偏“多智能体/具身/实时环境”的部署与性能权衡:在部分可观测、长周期控制、或生产级低延迟约束下,长期记忆如何与策略/推理循环耦合,同时保证吞吐与响应速度。相关文献: Kuan Fang et. al, 2019 等 3 篇文献