具备反事实因果推理能力的自主智能体

最终分组结果揭示了具备反事实因果推理能力的自主智能体正经历从“感知驱动”向“认知驱动”的范式转变。研究图谱由底层的因果发现算法（理论基石）、中层的LLM逻辑增强与强化学习优化（算法核心），以及上层的行业垂直应用与安全审计框架（实践闭环）组成。特别地，反事实推理不仅提升了智能体在复杂环境（如自动驾驶、多智能体协作）中的稳健性，更通过提供可解释性的“因果证据链”，解决了AI系统在高风险领域部署时的信任与合规难题。

共 171 篇文献，7 个研究方向

因果发现、表示学习与反事实推断的理论基础

该组文献奠定了自主智能体的数学与逻辑基石。研究重点包括：因果结构的可辨识性、因果发现算法（如CORE、DODO、UNCLE）、因果熵的数学属性、结构因果模型（SCM）的动态扩展、以及跨域因果不变性的学习方法。这些理论为智能体从统计相关性转向因果建模提供了支撑。相关文献: Francisco N. F. Q. Simoes et. al, 2024 等 22 篇文献

大语言模型（LLM）驱动的因果智能体与逻辑增强

聚焦于如何利用LLM作为认知核心，通过反事实微调、因果思维链（Causal CoT）、以及执行代码/数学反事实来增强智能体的推理忠实度。探讨了如何消除LLM的幻觉、提升逻辑稳健性，并开发了针对性的因果能力评估基准（如CounterBench）。相关文献: Kairong Han et. al, 2024 等 33 篇文献

因果增强的强化学习与样本效率优化

研究如何将因果图融入强化学习框架，利用因果容量引导探索、通过反事实策略评估优化决策、解决稀疏奖励问题。强调在复杂或非平稳环境下，通过识别因果动力学来提升策略的泛化性和样本效率。相关文献: Oliver Schulte et. al, 2024 等 31 篇文献

多智能体协作、公平性与社会性博弈

探讨多智能体系统（MAS）中的因果关系。关键点在于：反事实信用分配（归因）、因果通讯机制、以及在博弈论（如囚徒困境、星际争霸）中的演化稳定性。同时涵盖了反事实公平性约束在群体决策中的应用。相关文献: Ningke Xie et. al, 2025 等 25 篇文献

具身智能与自动驾驶的因果感知、安全与导航

将因果推理应用于物理世界智能体。利用因果干预消除感知偏见、进行长周期轨迹预测、并提升自动驾驶系统在极端工况下的防御与安全性。研究如何通过反事实模拟识别潜在风险点并实现鲁棒导航。相关文献: Xiaoyu Hu et. al, 2025 等 22 篇文献

可解释性、故障归因与安全审计框架

关注智能体决策的透明度与可信度。通过SCM和反事实“what-if”分析，为人类提供对比性解释，并对系统安全违规或故障进行因果溯源。涵盖了实时审计工具和满足法律问责需求的框架。相关文献: B'alint Gyevn'ar et. al, 2025 等 19 篇文献

行业垂直领域应用与生成式反事实仿真

展示因果智能体在医疗、金融、工业制造、电信及能源等领域的落地。利用扩散模型等生成式AI创建高质量的反事实数据用于模型训练，解决特定场景下的预测归因与自愈控制问题。相关文献: Mohana S J et. al, 2025 等 19 篇文献

总计223篇相关文献

A Counterfactual Reasoning-based Trajectory Prediction Model for Multiple Agents

基于反事实推理的多个智能体轨迹预测模型

Zhiwu Huang, Xinshu Yang, Heng Li 等, 2024-IECON 2024 - 50th Annual Conference of the IEEE Industrial Electronics Society

Accurate trajectory prediction is crucial in autonomous driving to ensure safe and efficient navigation, yet effectively modeling complex interactions among multiple agents remains a significant challenge. Many existing methods still suffer from over-reliance on HD maps, high computational cost, and a lack of interpretability in interaction reasoning. In response, the proposed model innovatively incorporates counterfactual reasoning into social interaction modeling to tackle the challenges of interaction-aware multi-agent trajectory prediction, prioritizing both accuracy and efficiency. In light of the spatiotemporal interaction mechanism and the inherent human cognition governing agents’ motion, the approach simultaneously generates multi-modal trajectories for all agents in a scenario, providing a novel perspective for modeling social interactions through causal reasoning. The results demonstrate that our map-free, lightweight trajectory prediction model rivals the performance of state-of-the-art methods and shows notable improvements over various baselines on publicly available real-world datasets.