Agent Efficiency

多智能体协同架构与路由优化策略

该组聚焦于通过多智能体协作、动态任务路由、异构模型配置及强化学习驱动的交互策略，提升复杂任务处理中的整体计算效能与协同协同效率。

MATA: Multi-Agent Framework for Reliable and Flexible Table Question Answering（Sieun Hyeon, Jusang Oh, Sunghwan Cho, Jaeyoung Do, 2026, arXiv.org）
Orchestrating Intelligence: Confidence-Aware Routing for Efficient Multi-Agent Collaboration across Multi-Scale Models（Jingbo Wang, Sendong Zhao, Jiatong Liu, Hao Wang, Wanting Li, Bing Qin, Ting Liu, 2026, arXiv.org）
PRISMA: Reinforcement Learning Guided Two-Stage Policy Optimization in Multi-Agent Architecture for Open-Domain Multi-Hop Question Answering（Yu Liu, Wenxiao Zhang, Cong Cao, Wenxuan Lu, Fangfang Yuan, Diandian Guo, Kun Peng, Qiang Sun, Kaiyan Zhang, Yanbing Liu, Jin B.Hong, Bowen Zhou, Zhiyuan Ma, 2026, arXiv.org）
Towards Efficient Agents: A Co-Design of Inference Architecture and System（Weizhe Lin, Hui-Ling Zhen, Shuai Yang, Xian Wang, Renxi Liu, Hanting Chen, Wang Zhang, Chuansai Zhou, Yiming Li, Chen Chen, Xing Li, Zhiyuan Yang, Xiaosong Li, Xianzhi Yu, Zhenhua Dong, Ming-Hu Yuan, Yunhe Wang, 2025, arXiv.org）
Why Keep Your Doubts to Yourself? Trading Visual Uncertainties in Multi-Agent Bandit Systems（Jusheng Zhang, Yijia Fan, Kaitong Cai, Jing Yang, Jiawei Yao, Jian Wang, Guanlong Qu, Ziliang Chen, Keze Wang, 2026, arXiv.org）
ConSensus: Multi-Agent Collaboration for Multimodal Sensing（Hyungjun Yoon, Mohammad Malekzadeh, Sungjin Lee, F. Kawsar, Lorena Qendro, 2026, arXiv.org）
ODAR: Principled Adaptive Routing for LLM Reasoning via Active Inference（Siyuan Ma, Bofei Gao, Xiaojun Jia, Simeng Qin, Tianlin Li, Ke Ma, Xiaoshuang Jia, Wenqi Ren, Yang Liu, 2026, arXiv.org）
Budget-Aware Agentic Routing via Boundary-Guided Training（Caiqi Zhang, Menglin Xia, Xuchao Zhang, Daniel Madrigal, Ankur Mallick, Samuel Kessler, Victor Ruehle, Saravan Rajmohan, 2026, arXiv.org）
Dual Latent Memory for Visual Multi-agent System（Xinlei Yu, Chengming Xu, Zhangquan Chen, Bo Yin, Cheng Yang, Yongbo He, Yihao Hu, Jiangning Zhang, Cheng Tan, Xiaobin Hu, Shuicheng Yan, 2026, arXiv.org）
WhisperNet: A Scalable Solution for Bandwidth-Efficient Collaboration（Gonglong Chen, Chaokun Zhang, Xinyan Zhao, 2026, arXiv.org）
SC-MAS: Constructing Cost-Efficient Multi-Agent Systems with Edge-Level Heterogeneous Collaboration（Di Zhao, Longhui Ma, Siwei Wang, Miao Wang, Yibo Kong, 2026, arXiv.org）
AgentDropout: Dynamic Agent Elimination for Token-Efficient and High-Performance LLM-Based Multi-Agent Collaboration（Zhexuan Wang, Yutong Wang, Xuebo Liu, Liang Ding, Miao Zhang, Jie Liu, Min Zhang, 2025, Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)）
Matrix: Peer-to-Peer Multi-Agent Synthetic Data Generation Framework（Dong Wang, Yang Li, Ansong Ni, Ching-Feng Yeh, Youssef Emad, Xinjie Lei, Liam Robbins, Karthik Padthe, Hu Xu, Xian Li, Asli Celikyilmaz, Ramya Raghavendra, Lifei Huang, Carole-Jean Wu, Shang-Wen Li, 2025, arXiv.org）
Multi-Agent Deep Research: Training Multi-Agent Systems with M-GRPO（Haoyang Hong, Jiajun Yin, Yuan Wang, Jingnan Liu, Zhe Chen, Ailing Yu, Ji Li, Zhiling Ye, Hansong Xiao, Yefei Chen, Hualei Zhou, Yun Yue, Minghui Yang, Chunxiao Guo, Junwei Liu, Peng Wei, Jinjie Gu, 2025, arXiv.org）
A Joint Optimization Framework for Enhancing Efficiency of Tool Utilization in LLM Agents（Bin Wu, E. Meij, Emine Yilmaz, 2025, Findings of the Association for Computational Linguistics: ACL 2025）
Designing a self-optimizing cloud-native autonomous finance system for SMEs using multi-agent reinforcement learning（Prince Enyiorji, 2025, International Journal of Financial Management and Economics）
MARTI-MARS2: Scaling Multi-Agent Self-Search via Reinforcement Learning for Code Generation（Shijie Wang, Pengfei Li, Yikun Fu, Kaifeng Liu, Fangyuan Li, Yang Liu, Xiaowei Sun, Zonglin Li, Siyao Zhao, Jian Zhao, Kai Tian, Dong Li, Junqi Gao, Yutong Zhang, Yiqun Chen, Yuqiang Li, Zoe Li, Weinan Zhang, Peng Ye, Shuyue Hu, Lei Bai, Bowen Zhou, Kaiyan Zhang, Biqing Qi, 2026, arXiv.org）
Adaptive Confidence Gating in Multi-Agent Collaboration for Efficient and Optimized Code Generation（Haojie Zhang, Yuzhe Li, Zhenqiang Liu, Chenyang Liu, Shenyang Zhang, Yi Zhou, 2026, arXiv.org）
Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System（Wei Chen, Jiarui Yuan, Qian Chen, Cheng Yang, Zhiyuan Liu, Maosong Sun, 2025, Findings of the Association for Computational Linguistics: ACL 2025）
Enhancing collaboration in multi-agent reinforcement learning with correlated trajectories（Siying Wang, Hongfei Du, Yang Zhou, Zhitong Zhao, Ruoning Zhang, Wenyu Chen, 2024, Knowledge-Based Systems）
Hierarchical Lead Critic based Multi-Agent Reinforcement Learning（David Eckel, H. Meess, 2026, arXiv.org）
A Multi-Agent Reinforcement Learning System for Autonomous Optimization of Web Infrastructure and Services（Raju Dandigam, 2023, International Journal of AI, BigData, Computational and Management Studies）
Leveraging Adaptive Group Negotiation for Heterogeneous Multi-Robot Collaboration with Large Language Models（Siqi Song, Xuanbing Xie, Zonglin Li, Yuqiang Li, Shijie Wang, Biqing Qi, 2025, arXiv.org）
Efficient Multi-agent Collaboration Learning via Posterior Mamba（Zhaohan Feng, Wei Xiao, Lei Yuan, Yanjie Dong, Gang Wang, Victor C. M. Leung, 2026, IEEE Transactions on Big Data）
Efficient Multi-Agent Collaboration with Tool Use for Online Planning in Complex Table Question Answering（Wei Zhou, Mohsen Mesgar, Annemarie Friedrich, Heike Adel, 2025, Findings of the Association for Computational Linguistics: NAACL 2025）

推理机制、长程规划与记忆管理优化

该组探讨如何在长序列任务中平衡推理精度与资源消耗，通过记忆压缩、元认知、树搜索及状态回滚机制优化智能体的决策质量与上下文利用效率。

DeepAgent: A General Reasoning Agent with Scalable Toolsets（Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, Guanting Dong, Jiajie Jin, Yinuo Wang, Hao Wang, Yutao Zhu, Ji-Rong Wen, Yuan Lu, Zhicheng Dou, 2025, Proceedings of the ACM Web Conference 2026）
COMPASS: Enhancing Agent Long-Horizon Reasoning with Evolving Context（Guangya Wan, Mingyang Ling, Xiaoqi Ren, Rujun Han, Sheng Li, Zizhao Zhang, 2025, arXiv.org）
MemoBrain: Executive Memory as an Agentic Brain for Reasoning（Hongjin Qian, Zhao Cao, Zheng Liu, 2026, arXiv.org）
Towards Autonomous Memory Agents（Xinle Wu, Rui Zhang, Mustafa Hussain, Yaojie Lu, 2026, arXiv.org）
DeltaKV: Residual-Based KV Cache Compression via Long-Range Similarity（Jitai Hao, Qiang Huang, Yaowei Wang, Min Zhang, Jun Yu, 2026, arXiv.org）
Anatomy of Agentic Memory: Taxonomy and Empirical Analysis of Evaluation and System Limitations（Dongming Jiang, Yi Li, Songtao Wei, Jinxin Yang, Ayushi Kishore, Alysa Zhao, Dingyi Kang, Xue Hu, Feng Chen, Qiannan Li, Bingzhe Li, 2026, arXiv.org）
Active Context Compression: Autonomous Memory Management in LLM Agents（Nikhil Verma, 2026, arXiv.org）
Agents Learn Their Runtime: Interpreter Persistence as Training-Time Semantics（Victor May, Aaditya Salgarkar, Yishan Wang, Diganta Misra, Huu Nguyen, 2026, arXiv.org）
Textual Equilibrium Propagation for Deep Compound AI Systems（Minghui Chen, Wenlong Deng, James Zou, Han Yu, Xiaoxiao Li, 2026, arXiv.org）
Position: Introspective Experience from Conversational Environments as a Path to Better Learning（C. Musat, Jackson Tolins, Diego Antognini, Jingling Li, Martin Klissarov, Tom Duerig, 2026, arXiv.org）
Learning to Retrieve Navigable Candidates for Efficient Vision-and-Language Navigation（Shutian Gu, Chengkai Huang, Ruoyu Wang, Lina Yao, 2026, arXiv.org）
A Minimal Agent for Automated Theorem Proving（Borja Requena Pozo, A. Letson, Krystian Nowakowski, Izan Beltran Ferreiro, Leopoldo Sarra, 2026, arXiv.org）
Search More, Think Less: Rethinking Long-Horizon Agentic Search for Efficiency and Generalization（Qianben Chen, Tianrui Qin, King Zhu, Qiexiang Wang, Cheng Yu, Shunmiao Xu, Jiaqi Wu, Jiayu Zhang, Xinpeng Liu, Xin Gui, Jingyi Cao, Piaohong Wang, Dingfeng Shi, He Zhu, Tiannan Wang, Yuqing Wang, Maojia Song, Tianyu Zheng, Ge Zhang, Jian Yang, Jiaheng Liu, Minghao Liu, Y. Jiang, Wangchunshu Zhou, 2026, arXiv.org）
MedCoG: Maximizing LLM Inference Density in Medical Reasoning via Meta-Cognitive Regulation（Yu Zhao, Hao Guan, Yongcheng Jing, Ying Zhang, Dacheng Tao, 2026, arXiv.org）
MARS: Modular Agent with Reflective Search for Automated AI Research（Jiefeng Chen, Bhavana Dalvi, Jaehyun Nam, Rui Meng, Tomas Pfister, Jinsung Yoon, 2026, arXiv.org）
Learning from the Irrecoverable: Error-Localized Policy Optimization for Tool-Integrated LLM Reasoning（Qiao Liang, Yuke Zhu, Chao Ge, Lei Yang, Ying Shen, Boyuan Zheng, Sheng Guo, 2026, arXiv.org）
FloCA: Towards Faithful and Logically Consistent Flowchart Reasoning（Jinzi Zou, Bo Wang, Liang Li, Shuo Zhang, Nuo Xu, Jun Zhao, 2026, arXiv.org）
α3-Bench: A Unified Benchmark of Safety, Robustness, and Efficiency for LLM-Based UAV Agents over 6G Networks（M. Ferrag, Abderrahmane Lakas, M. Debbah, 2026, arXiv.org）
MADE: Benchmark Environments for Closed-Loop Materials Discovery（Shreshth A. Malik, T. Doherty, P. Tigas, Muhammed Razzak, Stephen J. Roberts, Aron Walsh, Y. Gal, 2026, arXiv.org）
EvoConfig: Self-Evolving Multi-Agent Systems for Efficient Autonomous Environment Configuration（Xin Guo, Jiayi Kuang, Li Pan, Yinghui Li, Y. Li, Hai-Tao Zheng, Ying Shen, Di Yin, Xing Sun, 2026, arXiv.org）
HiMAC: Hierarchical Macro-Micro Learning for Long-Horizon LLM Agents（Hongbo Jin, Rong Zhu, Jiayu Ding, Wenhao Zhang, Ge Li, 2026, arXiv.org）
CodeAgents: A Token-Efficient Framework for Codified Multi-Agent Reasoning in LLMs（Bruce Yang, Xinfeng He, Huan Gao, Yifan Cao, Xiaofan Li, D. Hsu, 2025, arXiv.org）
Enhancing Vision-Language Navigation with Multimodal Event Knowledge from Real-World Indoor Tour Videos（Hao Xu, Tian Li, Wenbo Chen, Yi Liu, Xingxing Zuo, Yaoxian Song, Haoang Li, 2026, arXiv.org）
DeepXiv-SDK: An Agentic Data Interface for Scientific Literature（Hongjin Qian, Ziyi Xia, Ze Liu, Jianlyu Chen, Kun Luo, Minghao Qin, Chao Li, Lei Xiong, Junwei Lan, Sen Wang, Zhengyang Liang, Yingxia Shao, Defu Lian, Zheng Liu, 2026, arXiv.org）
ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning（Yandan Yang, Shuang Zeng, Tong Lin, Xinyuan Chang, Dekang Qi, Junjin Xiao, Haoyu Liu, Ronghan Chen, Yuzhi Chen, Dongjie Huo, Feng Xiong, Xing Wei, Zhiheng Ma, Mu Xu, 2026, arXiv.org）
Spatio-Temporal Token Pruning for Efficient High-Resolution GUI Agents（Zhou Xu, Bowen Zhou, Qi Wang, Shuwen Feng, Jingyu Xiao, 2026, arXiv.org）
Can Large Language Models Implement Agent-Based Models? An ODD-based Replication Study（Nuno Fachada, Daniel Fernandes, Carlos M. Fernandes, J. Matos-Carvalho, 2026, arXiv.org）
WebAnchor: Anchoring Agent Planning to Stabilize Long-Horizon Web Reasoning（Xinmiao Yu, Liwen Zhang, Xiaocheng Feng, Yong Jiang, Bing Qin, Pengjun Xie, Jingren Zhou, 2026, arXiv.org）
PyVision-RL: Forging Open Agentic Vision Models via RL（Shitian Zhao, Shaoheng Lin, Ming Li, Haoquan Zhang, Wenshuo Peng, Kaipeng Zhang, Chen Wei, 2026, arXiv.org）
Analyzing and Internalizing Complex Policy Documents for LLM Agents（Jiateng Liu, Zhenhailong Wang, Xiaojiang Huang, Yingjie Li, Xing Fan, Xiang Li, Chenlei Guo, Ruhi Sarikaya, Heng Ji, 2025, arXiv.org）
Mobile-Agent-v3.5: Multi-platform Fundamental GUI Agents（Haiyang Xu, Xi Zhang, Hao Liu, Junyang Wang, Zhao-Jing Zhu, Sheng Zhou, Xuhao Hu, Feiyu Gao, Junjie Cao, Zihua Wang, Zhiyu Chen, Jitong Liao, Qianyun Zheng, Jiahui Zeng, Ze Xu, Shuai Bai, Junyang Lin, Jingren Zhou, Ming Yan, 2026, arXiv.org）
Towards Efficient LLM Grounding for Embodied Multi-Agent Collaboration（Yang Zhang, Shixin Yang, Chenjia Bai, Fei Wu, Xiu Li, Zhen Wang, Xuelong Li, 2025, Findings of the Association for Computational Linguistics: ACL 2025）
Towards Selection as Power: Bounding Decision Authority in Autonomous Agents（Jose Manuel de la Chica Rodriguez, Juan Manuel Vera-Diaz, 2026, arXiv.org）
Dr. MAS: Stable Reinforcement Learning for Multi-Agent LLM Systems（Lang Feng, Longtao Zheng, Shuo He, Fuxiang Zhang, Bo An, 2026, arXiv.org）
GroupGPT: A Token-efficient and Privacy-preserving Agentic Framework for Multi-User Chat Assistant（Zhuokang Shen, Yifan Wang, Hanyuan Chen, Wenxuan Huang, Yunhang Shen, Shaohui Lin, 2026, arXiv.org）
AgentBuilder: Automating agent creation via large language model-driven systems（Wang-Rei Tang, Heng Zhang, Jianuo Huang, Shao-Zhao Wang, Feifan Yu, Huiyu Yang, Yu Wang, 2025, Neurocomputing）
Meta-reasoning in autonomous agents: performance gains across benchmarks and models（Wrick Talukdar, Anjanava Biswas, Gowtham Shankar, Varun Shinde, Gaurav Parekh, 2026, Academia AI and Applications）
From Verbatim to Gist: Distilling Pyramidal Multimodal Memory via Semantic Information Bottleneck for Long-Horizon Video Agents（Niu Lian, Yuting Wang, Hanshu Yao, Jinpeng Wang, Bin Chen, Yaowei Wang, Min Zhang, Shu-Tao Xia, 2026, arXiv.org）

工具调用工程、执行引擎与工作流系统优化

该组关注智能体在实际应用中的工具编排、代码生成执行以及系统框架（如FaaS、MCP协议）的工程化实现，以降低运行时延迟和算力消耗。

EZBlender: Efficient 3D Editing with Plan-and-ReAct Agent（Hao Wang, Wenhui Zhu, Shao Tang, Zhipeng Wang, Xuanzhao Dong, Xin Li, Xiwen Chen, Ashish Bastola, Xinhao Huang, Yalin Wang, Abolfazl Razi, 2026, arXiv.org）
Rethinking the Role of Entropy in Optimizing Tool-Use Behaviors for Large Language Model Agents（Zeping Li, Hongru Wang, Yiwen Zhao, Guanhua Chen, Yixia Li, Keyang Chen, Yixin Cao, Guangnan Ye, Hongfeng Chai, Zhenfei Yin, 2026, arXiv.org）
Optimizing Agentic Workflows using Meta-tools（Sami Abuzakuk, Anne-Marie Kermarrec, Rishi Sharma, Rasmus Moorits Veski, M. Vos, 2026, arXiv.org）
AutoTool: Efficient Tool Selection for Large Language Model Agents（Jingyi Jia, Qinbin Li, 2026, Proceedings of the AAAI Conference on Artificial Intelligence）
LLM Agents Making Agent Tools（Georg Wölflein, Dyke Ferber, Daniel Truhn, Ognjen Arandjelović, Jakob Nikolas Kather, 2025, Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)）
Alita-G: Self-Evolving Generative Agent for Agent Generation（Jiahao Qiu, Xuan Qi, Hongru Wang, Xinzhe Juan, Yiming Wang, Zelin Zhao, Jiayi Geng, Jiacheng Guo, Peihang Li, Jingzhe Shi, Shilong Liu, Mengdi Wang, 2025, arXiv.org）
Nemotron 3 Nano: Open, Efficient Mixture-of-Experts Hybrid Mamba-Transformer Model for Agentic Reasoning（Nvidia Aaron Blakeman, Aaron Grattafiori, Aarti Basant, Abhibha Gupta, Abhinav Khattar, Adi Renduchintala, Aditya Vavre, Akanksha Shukla, A. Bercovich, Aleksander Ficek, Aleksandr Shaposhnikov, Alex Kondratenko, A. Bukharin, Alexandre Milesi, Ali Taghibakhshi, Alisa Liu, Amelia Barton, Ameya Mahabaleshwarkar, Amir Klein, Amit Zuker, Amnon Geifman, Amy Shen, Anahita Bhiwandiwalla, Andrew Tao, Ann Guan, Anubhav Mandarwal, Arham Mehta, Ashwath Aithal, A. Poojary, A. Ahamed, Asma Kuriparambil Thekkumpate, Ayush Dattagupta, Banghua Zhu, Bardiya Sadeghi, B. Simkin, Ben Lanir, Benedikt Schifferer, Besmira Nushi, Bilal Kartal, B. Rouhani, Boris Ginsburg, Brandon Norick, B. Soubasis, B. Kisačanin, Brian Yu, Bryan Catanzaro, Carlo del Mundo, Chantal Hwang, Charles Wang, Cheng-Ping Hsieh, Chenghao Zhang, Chenhan Yu, Chetan Mungekar, Chintan Patel, Chris Alexiuk, Christopher Parisien, Collin Neale, Damon Mosk-Aoyama, Dan Su, Dane S. Corneil, Daniel Afrimi, Daniel Rohrer, Daniel Serebrenik, Daria Gitman, Daria Levy, Darko Stosic, David Mosallanezhad, Deepak Narayanan, Dhruv Nathawani, Dima Rekesh, Dina Yared, Divyanshu Kakwani, Dong Ahn, Duncan Riach, Dusan Stosic, E. Minasyan, Edward Lin, E. Long, E. Long, Elena Lantz, Ellie Evans, Elliott Ning, Eric Chung, Eric Harper, Eric W. Tramel, Erick Galinkin, Erik Pounds, Evan Briones, E. Bakhturina, Faisal Ladhak, Fay Wang, Fei Jia, Felipe Soares, Feng Chen, Ferenc Galkó, Frankie Siino, Galila Agam, Ganesh Ajjanagadde, Gantavya Bhatt, G. Prasad, George Armstrong, Gerald Shen, G. Batmaz, Grigor Nalbandyan, Haifeng Qian, Harsh Sharma, Hayley Ross, Helen Ngo, Herman Sahota, Hexin Wang, Himanshu Soni, Hiren Upadhyay, Huizi Mao, Huy C Nguyen, Huy Q Nguyen, Iain Cunningham, Ido Shahaf, Igor Gitman, I. Loshchilov, Ivan Moshkov, Izzy Putterman, Jan Kautz, Jane Scowcroft, J. Casper, Jatin Mitra, Jeffrey Glick, Jenny Chen, Jesse Oliver, Jian Zhang, Jiaqi Zeng, Jie Lou, Jimmy Zhang, Jining Huang, Joey Conway, J. Guman, John Kamalu, Johnny Greco, J. Cohen, Joseph Jennings, Joyjit Daw, J. V. Vialard, Junkeun Yi, Jupinder Parmar, Kai Xu, Kan Zhu, Kari Briski, K. Cheung, K. Luna, Keshav Santhanam, Kevin J. Shih, Kezhi Kong, Khushi Bhardwaj, Krishna C. Puvvada, Krzysztof Pawelec, Kumar Anik, Lawrence C. McAfee, Laya Sleiman, Leon Derczynski, Li Ding, Lucas Liebenwein, Luis Vega, Maanu Grover, Maarten Van Segbroeck, Maer Rodrigues de Melo, Makesh Narsimhan Sreedhar, Manoj Kilaru, Maor Ashkenazi, Marc Romeijn, Mark Cai, Markus Kliegl, Maryam Moosaei, Matvei Novikov, Mehrzad Samadi, Melissa Corpuz, Mengru Wang, Meredith Price, Michael Boone, Michael Evans, Miguel Martínez, Mike Chrzanowski, M. Shoeybi, M. Patwary, Nabin Mulepati, Natalie Hereth, Nave Assaf, N. Habibi, Neta Zmora, Netanel Haber, Nicola Sessions, Nidhi Bhatia, Nikhil Jukar, Nikki Pope, Nikolai Ludwig, Nima Tajbakhsh, Nirmal Juluru, Oleksii Hrinchuk, Oleksii Kuchaiev, Olivier Delalleau, O. Olabiyi, Omer Ullman Argov, Ouye Xie, Parth Chadha, Pasha Shamis, Pavlo Molchanov, Pawel Morkisz, Peter Dykas, Peter Jin, Pinky Xu, Piotr Januszewski, P. Thombre, Prasoon Varshney, Pritam Gundecha, Qing Miao, Rabeeh Karimi Mahabadi, Ran El-Yaniv, Ran Zilberstein, Rasoul Shafipour, Rich Harang, Rick Izzo, Rima Shahbazyan, Rishabh Garg, Ritika Borkar, Ritu Gala, Riyad Islam, R. Waleffe, Rohit S. Watve, Roi Koren, Ruoxi Zhang, Russell J. Hewett, R. Prenger, Ryan Timbrook, Sadegh Mahdavi, Sahil Modi, Samuel Kriman, Sanjay Kariyappa, S. Satheesh, Saori Kaji, Satish Pasumarthi, Sean Narentharen, Sean Narenthiran, Seonmyeong Bak, Sergey Kashirsky, Seth Poulos, Shahar Mor, Shanmugam Ramasamy, Shantanu Acharya, Shaona Ghosh, Sharath Turuvekere Sreenivas, S. Thomas, Shiqing Fan, Shreya Gopal, Shrimai Prabhumoye, Shubham Pachori, Shubham Toshniwal, Shuoyang Ding, Siddharth Singh, Simeng Sun, Smita Ithape, Somshubra Majumdar, Soumye Singhal, Stefania Alborghetti, Stephen Ge, Sugam Devare, Sumeet Kumar Barua, Suseella Panguluri, Suyog Gupta, S. Priyadarshi, Syeda Nahida Akter, Tan Bui, Teodor-Dumitru Ene, Terry Kong, Thanh Do, Tijmen Blankevoort, Tom Balough, Tomer Asida, Tomer Bar Natan, T. Konuk, Twinkle Vashishth, Udi Karpas, Ushnish De, Vahid Noorozi, V. Noroozi, V. Srinivasan, V. Elango, V. Korthikanti, V. Kurin, Vitaly Lavrukhin, Wanli Jiang, W. Ahmad, Wei Du, Wei Ping, Wenfei Zhou, Will Jennings, William Zhang, Wojciech Prazuch, Xiaowei Ren, Yashaswi Karnati, Yejin Choi, Yev Meyer, Yi-Fu Wu, Yian Zhang, Ying Lin, Yonatan Geifman, Yonggan Fu, Yoshi Subara, Yoshi Suhara, Yubo Gao, Zach Moshe, Zhen Dong, Zihan Liu, Zijia Chen, Zijie Yan, 2025, arXiv.org）
ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System（Hao Kang, Ziyang Li, Xinyu Yang, Weili Xu, Yinfang Chen, Junxiong Wang, Beidi Chen, Tushar Krishna, Chenfeng Xu, Simran Arora, 2026, arXiv.org）
WirelessAgent++: Automated Agentic Workflow Design and Benchmarking for Wireless Networks（Jingwen Tong, Zijian Li, Fangyu Liu, Wei Guo, Jun Zhang, 2026, arXiv.org）
A novel agent based autonomous and service composition framework for cost optimization of resource provisioning in cloud computing（Aarti Singh, Dimple Juneja, M. Malhotra, 2017, Journal of King Saud University - Computer and Information Sciences）
Query Optimization Beyond Data Systems: The Case for Multi-Agent Systems（Zoi Kaoudi, Ioana C. Giurgiu, 2025, arXiv.org）
From Tool Orchestration to Code Execution: A Study of MCP Design Choices（Yuval Felendler, P. Gandhi, I. Habler, Y. Elovici, A. Shabtai, 2026, arXiv.org）
Tool-R1: Sample-Efficient Reinforcement Learning for Agentic Tool Use（Yabo Zhang, Yihan Zeng, Qingyun Li, Zhe Hu, Kavin Han, Wangmeng Zuo, 2025, arXiv.org）
SkillCraft: Can LLM Agents Learn to Use Tools Skillfully?（Shiqi Chen, Jingze Gai, Ruochen Zhou, Jinghan Zhang, Tongyao Zhu, Junlong Li, Kangrui Wang, Zihan Wang, Zhengyu Chen, Klara Kaleb, Ning Miao, Siyang Gao, Cong Lu, Manling Li, Junxian He, Yee Whye Teh, 2026, arXiv.org）
EASYTOOL: Enhancing LLM-based Agents with Concise Tool Instruction（Siyu Yuan, Kaitao Song, Jiangjie Chen, Xu Tan, Yongliang Shen, Kan Ren, Dongsheng Li, Deqing Yang, 2025, Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers)）
ActionEngine: From Reactive to Programmatic GUI Agents via State Machine Memory（Hongbin Zhong, Fazle Faisal, Luis França, Tanakorn Leesatapornwongsa, Adriana Szekeres, Kexin Rong, Suman Nath, 2026, arXiv.org）
Optimizing FaaS Platforms for MCP-enabled Agentic Workflows（Varad Kulkarni, Vaibhav Jha, N. Reddy, Anand Eswaran, Praveen Jayachandran, Yogesh L. Simmhan, 2026, arXiv.org）
AvaTaR: Optimizing LLM Agents for Tool Usage via Contrastive Reasoning（Shirley Wu, Shiyu Zhao, Qian Huang, Kexin Huang, Michihiro Yasunaga, V. Ioannidis, Karthik Subbian, J. Leskovec, James Zou, 2024, Advances in Neural Information Processing Systems 37）
Toward Super Agent System with Hybrid AI Routers（Yuhang Yao, Haixin Wang, Yibo Chen, Jiawen Wang, M. Ren, Bosheng Ding, A. Avestimehr, Chaoyang He, 2025, arXiv.org）
SciDataCopilot: An Agentic Data Preparation Framework for AGI-driven Scientific Discovery（J. Rao, Y. Qiu, Jiahui Zhang, Juntao Deng, Shangquan Sun, Fenghua Ling, Hao Chen, Na Dong, Zhangyang Gao, Siqi Sun, Yuqiang Li, Dongzhan Zhou, Guangyu Wang, Lijun Wu, Conghui He, Xuhong Wang, Jinghao Shao, Xiang Liu, Yu Zhu, Mianxin Liu, Qihao Zheng, Yinghui Zhang, Jiamin Wu, Xiaosong Wang, Shixiang Tang, Wenlong Zhang, Bo Zhang, Wanli Ouyang, Runkai Zhao, Chun-dong Song, Lei Bai, Chi Zhang, 2026, arXiv.org）
AgentTune: An Agent-Based Large Language Model Framework for Database Knob Tuning（Yiyan Li, Haoyang Li, Jing Zhang, Renata Borovica-Gajic, Shuai Wang, Tieying Zhang, Jianjun Chen, Rui Shi, Cuiping Li, Hong Chen, 2025, Proceedings of the ACM on Management of Data）
TopoMAS: Large Language Model Driven Topological Materials Multi‐Agent System（Baohua Zhang, Xin Li, Huangchao Xu, Zhong Jin, Quansheng Wu, Ce Li, 2025, Materials Genome Engineering Advances）
Understanding Multi-Agent LLM Frameworks: A Unified Benchmark and Experimental Analysis（Abdelghny Orogat, Ana Rostam, Essam Mansour, 2026, arXiv.org）
FastCode: Fast and Cost-Efficient Code Understanding and Reasoning（Zhonghang Li, Zongwei Li, Yuxuan Chen, Hange Shi, Jiawei Li, Jierun Chen, H. Bai, Chao Huang, 2026, arXiv.org）
EcoptiAI: E-Commerce Process Optimization and Operational Cost Minimization Through Task Automation Using Agentic AI（Olivia-Roxana Alecsoiu, Nuruzzaman Faruqui, A. Panagoret, Ceauşescu Aurelian Ionuţ, D. Panagoret, Rares-Vladimir Nitu, M. Mutu, 2025, IEEE Access）
Lemon Agent Technical Report（Haipeng Jiang, K. Ren, Zimo Yin, Zhe Sun, Xin Gan, Guangyi Lv, Ming He, Peng Wang, Conglin Yin, Hong Pan, Changwen Zhang, Shan Tong, Zhen Xu, Zeping Chen, Y. Huangfu, Yanzhi Xu, Xing Su, Qi Feng, Dong An, Jianpin Fan, 2026, arXiv.org）
COCO: Cognitive Operating System with Continuous Oversight for Multi-Agent Workflow Reliability（Churong Liang, Jinling Gan, Kairan Hong, Qiushi Tian, Zongze Wu, Runnan Li, 2025, arXiv.org）
EvoAgentX: An Automated Framework for Evolving Agentic Workflows（Yingxu Wang, Siwei Liu, Jinyuan Fang, Zaiqiao Meng, 2025, Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing: System Demonstrations）

系统性能评估、成本管控与领域适配方法

该组致力于建立agent性能评价标准与成本量化体系，研究如何通过数据合成、领域适配与实验基准来提升智能体开发效率及部署可靠性。

Taming Scylla: Understanding the multi-headed agentic daemon of the coding seas（Micah Villmow, 2026, arXiv.org）
When Agents Fail to Act: A Diagnostic Framework for Tool Invocation Reliability in Multi-Agent LLM Systems（Donghao Huang, Gauri Malwe, Zhaoxia Wang, 2026, arXiv.org）
DeepPlanning: Benchmarking Long-Horizon Agentic Planning with Verifiable Constraints（Yinger Zhang, Shutong Jiang, Renhao Li, Jianhong Tu, Yang Su, Lianghao Deng, Xudong Guo, Chenxu Lv, Junyang Lin, 2026, arXiv.org）
Benchmarking Agents in Insurance Underwriting Environments（A. Dsouza, R. Ramakrishnan, Charles Dickens, Bhavishya Pohani, Christopher M Glaze, 2026, arXiv.org）
Tokenomics: Quantifying Where Tokens Are Used in Agentic Software Engineering（M. Salim, Jasmine Latendresse, S. Khatoonabadi, Emad Shihab, 2026, arXiv.org）
EvoRoute: Experience-Driven Self-Routing LLM Agent Systems（Guibin Zhang, Haiyang Yu, Kai Yang, Bingli Wu, Fei Huang, Yongbin Li, Shuicheng Yan, 2026, arXiv.org）
Web Agent Agentic Reinforcement Learning Decision Model Under Multi-Cost and Failure Risk Constraints（Qianli Ma, Limengxi Yue, Shuyang Xu, Yanpei Shi, Hongrui Liu, 2026, Proceedings of the 2026 5th International Conference on Big Data, Information and Computer Network）
WebLeaper: Empowering Efficiency and Efficacy in WebAgent via Enabling Info-Rich Seeking（Zhengwei Tao, Haiyang Shen, Baixuan Li, Wenbiao Yin, Jialong Wu, Kuan Li, Zhongwang Zhang, Huifeng Yin, Rui Ye, Liwen Zhang, Xinyu Wang, Pengjun Xie, Jingren Zhou, Yong Jiang, 2025, arXiv.org）
Nanbeige4.1-3B: A Small General Model that Reasons, Aligns, and Acts（Cheng Yang, Guangyue Peng, Jiaying Zhu, Ran Le, Ruixiang Feng, Tao Zhang, Xiyun Xu, Yang Song, Yiming Jia, Yuntao Wen, Yun Xu, Zekai Wang, Zhenwei An, Zhicong Sun, Zongchao Chen, 2026, arXiv.org）
Mobility-Aware Cache Framework for Scalable LLM-Based Human Mobility Simulation（Hua Yan, Heng Tan, Yingxue Zhang, Yu Yang, 2026, arXiv.org）
Architecting AgentOS: From Token-Level Context to Emergent System-Level Intelligence（Chengyou Li, Xiaodong Liu, Xiangbao Meng, Xinyu Zhao, 2026, arXiv.org）
Autonomous Multi-Agent AI for High-Throughput Polymer Informatics: From Property Prediction to Generative Design Across Synthetic and Bio-Polymers（Mahule Roy, Adib Bazgir, Arthur da Silva Sousa Santos, Yuwen Zhang, 2026, arXiv.org）
NeuDiff Agent: A Governed AI Workflow for Single-Crystal Neutron Crystallography（Zhongcan Xiao, Leyi Zhang, Guannan Zhang, Xiaoping Wang, 2026, arXiv.org）
BRAID: Bounded Reasoning for Autonomous Inference and Decisions（Armaugan Amcalar, Eyup Cinar, 2025, arXiv.org）
K-Dense Analyst: Towards Fully Automated Scientific Analysis（Orion Li, Vinayak Agarwal, Summer Zhou, Ashwin Gopinath, T. Kassis, 2025, arXiv.org）
AWE: Adaptive Agents for Dynamic Web Penetration Testing（A. Jaswal, A. Baghel, 2026, arXiv.org）
Diffusion Probe: Generated Image Result Prediction Using CNN Probes（Benlei Cui, Bukun Huang, Zhizeng Ye, Xuemei Dong, Tuo Chen, Hui Xue, Dingkang Yang, Longtao Huang, Jingqun Tang, Haiwen Hong, 2026, arXiv.org）
EpidemIQs: Prompt-to-Paper LLM Agents for Epidemic Modeling and Analysis（Mohammad Hossein Samaei, F. Sahneh, L. Cohnstaedt, Caterina M. Scoglio, 2025, arXiv.org）
SoDA: An Efficient Interaction Paradigm for the Agentic Web（Zicai Cui, Zhouyuan Jian, Weiwen Liu, Weinan Zhang, 2025, arXiv.org）
Regret-Guided Search Control for Efficient Learning in AlphaZero（Yun-Jui Tsai, Wei-Yu Chen, Yan-Ru Ju, Yuanlin Chang, Tianle Wu, 2026, arXiv.org）
RollArt: Scaling Agentic RL Training via Disaggregated Infrastructure（Wei Gao, Yuheng Zhao, Tianyuan Wu, Shaopan Xiong, Weixun Wang, Dakai An, Lunxi Cao, Dilxat Muhtar, Zichen Liu, Haizhou Zhao, Ju Huang, Siran Yang, Yongbin Li, Wenbo Su, Jiamang Wang, Lin Qu, Bo Zheng, Wei Wang, 2025, arXiv.org）
Stop Wasting Your Tokens: Towards Efficient Runtime Multi-Agent Systems（Fulin Lin, Shaowen Chen, Ruishan Fang, Hongwei Wang, Tao Lin, 2025, arXiv.org）
Divide, Optimize, Merge: Fine-Grained LLM Agent Optimization at Scale（Jiale Liu, Yifan Zeng, Shaokun Zhang, Chi Zhang, Malte Højmark-Bertelsen, Marie Normann Gadeberg, Huazheng Wang, Qingyun Wu, 2025, arXiv.org）
IDSelect: A RL-Based Cost-Aware Selection Agent for Video-based Multi-Modal Person Recognition（Yuyang Ji, Yixuan Shen, Kien Nguyen, Lifeng Zhou, Feng Liu, 2026, arXiv.org）
ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas（Xiaoyu Tian, Haotian Wang, Shuaiting Chen, Hao Zhou, Kai Yu, Yudi Zhang, Jade Ouyang, Jun Yin, Jiong Chen, B. Guo, Lei M. Zhang, Junjie Tao, Yu Song, Ming Cui, Chengwei Liu, 2026, arXiv.org）
Adaptive Correlation-Weighted Intrinsic Rewards for Reinforcement Learning（Viet Nguyen, Phuong Nguyen, 2026, arXiv.org）
Agent Drift: Quantifying Behavioral Degradation in Multi-Agent LLM Systems Over Extended Interactions（A. Rath, 2026, arXiv.org）
Learning to Share: Selective Memory for Efficient Parallel Agentic Systems（Joseph Fioresi, P. Kulkarni, Ashmal Vayani, Song Wang, Mubarak Shah, 2026, arXiv.org）
Exploring Shared Large Language Models: Early Insights into Scalability and Efficiency in AI Assistant and Agent Deployment（Arvid Kok, Antonio Carvalho, Michael Street, 2025, 2025 International Conference on Military Communication and Information Systems (ICMCIS)）
AI IDEs or Autonomous Agents? Measuring the Impact of Coding Agents on Software Development（Shyam Agarwal, Hao He, Bogdan Vasilescu, 2026, arXiv.org）
MCP-Atlas: A Large-Scale Benchmark for Tool-Use Competency with Real MCP Servers（Chaithanya Bandi, Ben Hertzberg, Geobio Boo, Tejas Polakam, Jeff Da, Sami Hassaan, Manasi Sharma, Andrew Park, Ernesto Hernandez, Dan Rambado, Ivan Salazar, Rafael M. O. Cruz, Chetan Rane, Benno Levin, Brad Kenstler, Bing Liu, 2026, arXiv.org）
OAgents: An Empirical Study of Building Effective Agents（He Zhu, Tianrui Qin, K. J. Zhu, Heyuan Huang, Yeyi Guan, Jinxiang Xia, Hanhao Li, Yi Yao, Ningning Wang, Pai Liu, Tianhao Peng, Xin Gui, Xiaowan Li, Yuhui Liu, Xiangru Tang, Jian Yang, Ge Zhang, Xitong Gao, Yuchen Eleanor Jiang, Changwang Zhang, Jun Wang, Jiaheng Liu, Wangchunshu Zhou, 2025, Findings of the Association for Computational Linguistics: EMNLP 2025）
Unlocking Implicit Experience: Synthesizing Tool-Use Trajectories from Text（Zhihao Xu, Rumei Li, Jiahuan Li, Rongxiang Weng, Jingang Wang, Xunliang Cai, Xiting Wang, 2026, arXiv.org）
Efficient Agents: Building Effective Agents While Reducing Cost（Ningning Wang, Xavier Hu, Pai Liu, He Zhu, Yue Hou, Heyuan Huang, Shengyu Zhang, Jian Yang, Jiaheng Liu, Ge Zhang, Changwang Zhang, Jun Wang, Y. Jiang, Wangchunshu Zhou, 2025, arXiv.org）

Agent Efficiency

Agent Efficiency 的研究已构建出一套从底层架构优化、决策逻辑算法到高层任务调度与评估管控的完整体系。目前的科研焦点已从单一模型prompt优化升级为全生命周期的效能提升，涵盖了多智能体协作、长程推理记忆管理、工程化执行框架以及针对成本与可靠性的量化评估，旨在实现高性能、低成本且自主化的智能体系统设计。

共 125 篇文献，4 个研究方向

多智能体协同架构与路由优化策略

该组聚焦于通过多智能体协作、动态任务路由、异构模型配置及强化学习驱动的交互策略，提升复杂任务处理中的整体计算效能与协同协同效率。相关文献: Sieun Hyeon et. al, 2026 等 25 篇文献

推理机制、长程规划与记忆管理优化

该组探讨如何在长序列任务中平衡推理精度与资源消耗，通过记忆压缩、元认知、树搜索及状态回滚机制优化智能体的决策质量与上下文利用效率。相关文献: Xiaoxi Li et. al, 2025 等 38 篇文献

工具调用工程、执行引擎与工作流系统优化

该组关注智能体在实际应用中的工具编排、代码生成执行以及系统框架（如FaaS、MCP协议）的工程化实现，以降低运行时延迟和算力消耗。相关文献: Hao Wang et. al, 2026 等 28 篇文献

系统性能评估、成本管控与领域适配方法

该组致力于建立agent性能评价标准与成本量化体系，研究如何通过数据合成、领域适配与实验基准来提升智能体开发效率及部署可靠性。相关文献: Micah Villmow et. al, 2026 等 34 篇文献

总计126篇相关文献

Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System

Optima：基于LLM的多智能体系统有效性和效率优化

doi.org-Wei Chen, Jiarui Yuan, Qian Chen 等, 2025-Findings of the Association for Computational Linguistics: ACL 2025

Large Language Model (LLM) based multiagent systems (MAS) show remarkable potential in collaborative problem-solving, yet they still face critical challenges: low communication efficiency, poor scalability, and a lack of effective parameter-updating optimization methods.We present OPTIMA, a novel framework that addresses these issues by significantly enhancing both communication efficiency and task effectiveness in LLM-based MAS through training.OPTIMA employs an iterative generate, rank, select, and train paradigm with a reward function balancing task performance, token efficiency, and communication readability.We explore various algorithms, including Supervised Fine-Tuning, Direct Preference Optimization, and their hybrid approaches, providing insights into their effectiveness-efficiency trade-offs.We integrate Monte Carlo Tree Search-inspired techniques for DPO data generation, treating conversation turns as tree nodes to explore diverse interaction paths.Evaluated on common multi-agent tasks, including information-asymmetric question answering and complex reasoning, OPTIMA shows consistent and substantial improvements over single-agent baselines and vanilla MAS based on Llama 3 8B / 3.2 3B, achieving up to 2.8x performance gain with less than 10% tokens on tasks requiring heavy information exchange.Moreover, OPTIMA's efficiency gains enable more effective compute utilization during inference, leading to improved inferencetime scaling laws.By addressing fundamental challenges in LLM-based MAS, OPTIMA shows the potential towards scalable, efficient, and effective MAS.Our code is available at https://github.com/thunlp/Optima.