多智能体系统 LLM框架 性能评估 记忆行为
摘要

多智能体LLM框架被广泛用于加速基于大语言模型的智能体系统开发。这些框架通过特定的架构结构来规范智能体之间的交互、信息存储和任务协调。然而,其对系统性能的影响尚不明确。本文提出了一种架构分类法,并开发了MAFBench统一评估套件,以在标准化执行流程下对多个能力进行联合评估。实验结果表明,框架级别的设计选择可能显著影响延迟、规划准确性和协调成功率。最后,作者将研究结果转化为具体的架构设计原则和框架选择指南,并提出了未来的研究方向。

AI 推荐理由

论文涉及多智能体LLM框架中的记忆行为评估,是关键部分但非唯一主题。

论文信息
作者 Abdelghny Orogat, Ana Rostam, Essam Mansour
发布日期 2026-02-03
arXiv ID 2602.03128
相关性评分 7/10 (相关)