群体agent的论文 互相博弈反思

大语言模型(LLM)驱动的战略博弈与认知反思机制

该组论文探讨了利用LLM作为智能体核心,通过心智理论(ToM)、自我反思、递归推理、人格建模以及显式辩论来处理复杂博弈任务。研究强调了LLM在开放环境中的社会推理、法律制定、对抗性演化(红蓝对抗)以及在特定策略游戏(如外交博弈、谋杀之谜)中的战略决策能力。

分布式纳什均衡(NE)寻优算法与多智能体控制理论

这组文献专注于在分布式、约束环境或切换拓扑下寻找纳什均衡的严谨数学方法。研究涵盖了多集群博弈、高阶非线性系统、二阶动力学以及抗攻击(如DoS)的鲁棒性分析,提供了关于算法收敛性、稳定性和同步控制的理论证明。

资源分配、能源管理与机制设计中的博弈优化

该组论文将博弈论应用于实际资源调度,包括微电网能源管理、边缘计算任务卸载、V2X通信、卫星网络及区块链。主要利用Stackelberg博弈、联盟博弈和Walrasian机制,旨在平衡各方的经济利益、系统效率与公平性。

群体联盟形成与动态分组博弈机制

侧重于研究Agent如何自主形成联盟或分组以最大化效用。涉及Hedonic博弈、重叠联盟形成(OCF)以及在众包、D2D网络、NOMA通信和无人机数据采集等场景下的稳定分组策略与激励兼容设计。

多智能体强化学习(MARL)中的学习动力学与策略博弈

探讨MARL与博弈论的深度融合,包括自对弈(Self-play)、奖励重新分配、风险感知决策、贝叶斯学习下的信念收敛,以及通过博弈理论解决MARL中的非平稳性、可扩展性和探索-利用平衡问题。

演化博弈理论(EGT)与群体行为涌现分析

利用演化博弈分析大规模群体在长期互动中的策略演化。研究包括合作行为的涌现、社会媒体治理、语言竞争、疫苗接种决策以及在复杂网络上的创新扩散。同时探讨了行为经济学因素(如损失厌恶)对演化稳定性的影响。

社会博弈、人机协作与网络安全防御

探讨博弈中的社会属性与对抗性防御。包括人机交互中的信任动态、社会权力的最大化、投票操纵、以及在恶意攻击下的防御博弈(如FlipIt模型、Byzantine模型)。旨在通过博弈建模提升社会公共利益与系统安全性。

特定工程领域与大规模系统的博弈建模

涵盖了均值场博弈(MFG)以应对大规模系统的维度灾难,以及在无人机集群控制、自动驾驶、F1赛车、暖通空调优化等特定工业场景下的博弈应用。这些研究通常结合了模型预测控制(MPC)与多目标优化。

群体agent的论文 互相博弈反思

合并后的分组全面覆盖了群体智能体博弈与反思的研究前沿。研究版图呈现出明显的层次化特征:底层以分布式控制理论和纳什均衡寻优为数学基础;中层通过多智能体强化学习和演化博弈动力学实现策略的自适应演进与群体行为涌现;高层则引入大语言模型(LLM)赋予智能体心智理论、战略反思与社会推理能力。同时,这些理论在能源管理、网络安全、人机协作及大规模工业调度等实际场景中得到了广泛应用,体现了从“理性计算”向“认知反思”与“社会协同”跨越的发展趋势。

170 篇文献,8 个研究方向
大语言模型(LLM)驱动的战略博弈与认知反思机制
该组论文探讨了利用LLM作为智能体核心,通过心智理论(ToM)、自我反思、递归推理、人格建模以及显式辩论来处理复杂博弈任务。研究强调了LLM在开放环境中的社会推理、法律制定、对抗性演化(红蓝对抗)以及在特定策略游戏(如外交博弈、谋杀之谜)中的战略决策能力。相关文献: Philip Lippmann et. al, 2024 等 24 篇文献
分布式纳什均衡(NE)寻优算法与多智能体控制理论
这组文献专注于在分布式、约束环境或切换拓扑下寻找纳什均衡的严谨数学方法。研究涵盖了多集群博弈、高阶非线性系统、二阶动力学以及抗攻击(如DoS)的鲁棒性分析,提供了关于算法收敛性、稳定性和同步控制的理论证明。相关文献: X. Nian et. al, 2021 等 29 篇文献
资源分配、能源管理与机制设计中的博弈优化
该组论文将博弈论应用于实际资源调度,包括微电网能源管理、边缘计算任务卸载、V2X通信、卫星网络及区块链。主要利用Stackelberg博弈、联盟博弈和Walrasian机制,旨在平衡各方的经济利益、系统效率与公平性。相关文献: Xingwei Dong et. al, 2020 等 24 篇文献
群体联盟形成与动态分组博弈机制
侧重于研究Agent如何自主形成联盟或分组以最大化效用。涉及Hedonic博弈、重叠联盟形成(OCF)以及在众包、D2D网络、NOMA通信和无人机数据采集等场景下的稳定分组策略与激励兼容设计。相关文献: Liang Wang et. al, 2025 等 17 篇文献
多智能体强化学习(MARL)中的学习动力学与策略博弈
探讨MARL与博弈论的深度融合,包括自对弈(Self-play)、奖励重新分配、风险感知决策、贝叶斯学习下的信念收敛,以及通过博弈理论解决MARL中的非平稳性、可扩展性和探索-利用平衡问题。相关文献: Stefanos Leonardos et. al, 2020 等 22 篇文献
演化博弈理论(EGT)与群体行为涌现分析
利用演化博弈分析大规模群体在长期互动中的策略演化。研究包括合作行为的涌现、社会媒体治理、语言竞争、疫苗接种决策以及在复杂网络上的创新扩散。同时探讨了行为经济学因素(如损失厌恶)对演化稳定性的影响。相关文献: H. Anh et. al, 2022 等 19 篇文献
社会博弈、人机协作与网络安全防御
探讨博弈中的社会属性与对抗性防御。包括人机交互中的信任动态、社会权力的最大化、投票操纵、以及在恶意攻击下的防御博弈(如FlipIt模型、Byzantine模型)。旨在通过博弈建模提升社会公共利益与系统安全性。相关文献: Ariel Rosenfeld et. al, 2018 等 20 篇文献
特定工程领域与大规模系统的博弈建模
涵盖了均值场博弈(MFG)以应对大规模系统的维度灾难,以及在无人机集群控制、自动驾驶、F1赛车、暖通空调优化等特定工业场景下的博弈应用。这些研究通常结合了模型预测控制(MPC)与多目标优化。相关文献: Shawon Dey et. al, 2024 等 15 篇文献