Multi-agent frameworks — 多智能体框架

From Systems analysis wiki
Jump to navigation Jump to search

基于LLM的多智能体框架是一种软件平台,它允许多个基于大型语言模型 (LLM)构建的自主AI智能体相互协作,共同解决复杂问题[1]。这类系统强调智能体配置的多样性、它们之间的通信以及集体决策。该方法利用群体的“集体智能”,其中每个智能体扮演一个专门的角色,它们之间的消息交换模仿了人类的协同工作。

这使得模拟复杂的现实世界场景和解决超出单个智能体能力范围的任务成为可能。多智能体LLM系统已在软件开发、社会模拟、经济博弈和政治辩论建模等领域展现出成功的应用成果[1]

关键框架与方法

多智能体系统的发展催生了一系列开源框架,简化了其创建和研究过程。

MetaGPT (2023)

这是最早的开源框架之一,专注于“流水线”(assembly line)式的协同工作。MetaGPT在系统中引入了标准操作程序(SOPs),并为每个智能体分配特定角色(如产品经理、工程师、测试员)。这种方法可以将复杂任务分解为子任务,并分配给专门的智能体,从而减少混乱和幻觉的风险[2]

CAMEL (2023)

CAMELCommunicative Agents for "Mind" Exploration)框架专注于通过对话实现智能体的自主交互。它提出了一种inception prompting方法,用于协调LLM智能体之间的对话,引导它们达成共同目标。每个智能体都被赋予一个角色和背景,然后它们通过自然语言进行交流,逐步形成联合解决方案。在需要无需人类直接干预的协作场景中,CAMEL表现出色[1]

AutoGen (2023)

这是由微软研究人员开发的一个通用且可定制的框架,旨在通过多个LLM的交流来构建复杂的应用程序。AutoGen允许使用代码和自然语言来编程智能体的交互逻辑。它支持与外部工具和API的集成,使其适用于从软件开发到创建对话系统的广泛任务[1]

AgentVerse (2023)

这是一个由OpenBMB社区开发的开放平台,用于研究智能体的动态协作和涌现行为。AgentVerse提供两种工作模式:

  1. 任务解决 (task-solving): 多个LLM智能体组成团队,共同完成一项复杂任务(例如,协同软件开发)。
  2. 环境模拟 (simulation): 允许用户设置一个虚拟环境,并观察智能体之间的互动(例如,模拟教室或囚徒困境)。

该平台强调了标准化环境和通信协议对于受控交流的重要性[3]

CrewAI (2024)

该框架专注于将LLM智能体集成到业务流程和数据分析中。CrewAI实现了“基于AI的智能体工作流”(AI-Based Agents Workflow, AgWf)的概念,其中智能体按照文本指令执行步骤,并可以使用外部工具(Python类/函数)。这使得复杂的分析场景得以自动化,将LLM的灵活性与确定性代码相结合[2]

LangGraph (2024)

这是一个实验性框架,使用图结构来表示与LLM对话中的状态和上下文。LangGraph的一个关键特性是支持循环工作流。这使得智能体能够通过共享的知识图交换数据,迭代地搜索信息,评估其可靠性并修正答案,这在基于增强知识库的信息检索(QA)任务中尤其有用[2]

其他项目

实验性项目AutoGPTAgentGPT也引起了广泛关注,它们展示了完全自主AI智能体的潜力,这些智能体能够独立设定目标、进行网络搜索、运行代码和管理文件。尽管这些项目未经科学同行评审,但它们凸显了规划、记忆和工具等组件对于构建真正自主智能体的重要性[4]

多智能体系统的应用

  • 软件开发自动化: LLM智能体团队扮演经理、程序员和测试员的角色,共同规划和实施软件项目。ChatDev的研究表明,一个由四个智能体组成的团队能够在几分钟内创建一个简单的应用程序,并在从任务定义到测试的各个阶段进行对话[2]
  • 智能助手: 诸如Microsoft 365 Copilot和IBM Watsonx Orchestrate等企业产品使用多个智能体来执行复杂任务,其中一个智能体处理请求,另一个从数据库中提取事实,第三个则撰写报告。
  • 科学研究: 智能体被用于生成和批判假设。在Guided DebateSelf-Refine等方法中,一个智能体提出解决方案,另一个对其进行评估和修正,这有助于减少错误数量[4]
  • 社会建模与虚拟世界: 在具有里程碑意义的Generative Agents项目中,数十个拥有个性和记忆的LLM智能体模拟了一个虚拟小镇的生活,展示了逼真的社会互动。这类模拟可在游戏(用于创建逼真的NPC)、教育和社会科学领域找到应用[4]

挑战与前景

尽管取得了成功,多智能体系统仍面临一系列严峻挑战:

  • 幻觉与级联错误: 一个智能体犯的错误可能会通过链式反应传递给其他智能体,后者会将其作为推理的基础,从而导致整个团队的工作出现偏差[1]
  • 可扩展性与资源密集性: 每个基于LLM的智能体都需要大量的计算资源。确保数十个智能体同时运行是一项复杂的技术挑战[1]
  • 协调与管理: 随着智能体数量的增加,出现混乱的风险也随之增大。需要精密的“编排”机制来管理它们的互动。
  • 评估与测试: 目前缺乏公认的基准来客观比较不同的多智能体框架。

未来,预计将出现更高效、更安全的多模态系统,智能体不仅可以交换文本,还可以交换图像和其他数据。引入强化学习可以教会智能体团队随着时间的推移更好地协调,从而实现“集体智能”的效果。最终,多智能体框架是朝着创建更灵活、更强大的AI系统迈出的一步,在这些系统中,众多专业化的“心智”协同工作。

链接

参考文献

  • Yao, S. et al. (2022). ReAct: Synergizing Reasoning and Acting in Language Models. arXiv:2210.03629.
  • Hong, S. et al. (2023). MetaGPT: Meta Programming for a Multi-Agent Collaborative Framework. arXiv:2308.00352.
  • Li, G. et al. (2023). CAMEL: Communicative Agents for "Mind" Exploration of Large Language Model Society. arXiv:2303.17760.
  • Wu, Q. et al. (2023). AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation. arXiv:2308.08155.
  • Liu, X. et al. (2023). AgentBench: Evaluating LLMs as Agents. arXiv:2308.03688.
  • Yao, S. et al. (2023). Tree of Thoughts: Deliberate Problem Solving with Large Language Models. arXiv:2305.10601.
  • Shinn, N. et al. (2023). Reflexion: Language Agents with Verbal Reinforcement Learning. arXiv:2303.11366.
  • Chen, W. et al. (2023). AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors. arXiv:2308.10848.
  • Park, J. S. et al. (2023). Generative Agents: Interactive Simulacra of Human Behavior. arXiv:2304.03442.
  • Guo, T. et al. (2024). Large Language Model Based Multi-Agents: A Survey of Progress and Challenges. arXiv:2402.01680.
  • Chen, Q. et al. (2024). ChatDev: Communicative Agents for Software Development. arXiv:2307.07924.
  • Duan, Z.; Wang, J. (2024). Exploration of LLM Multi-Agent Application Implementation Based on LangGraph + CrewAI. arXiv:2411.18241.
  • Aratchige, R. M.; Ilmini, W. M. K. S. (2025). LLMs Working in Harmony: A Survey on the Technological Aspects of Building Effective LLM-Based Multi-Agent Systems. arXiv:2504.01963.

注释

  1. 1.0 1.1 1.2 1.3 1.4 1.5 Wang, L., et al. «Large Language Model based Multi-Agents: A Survey of Progress and Challenges». arXiv:2402.01680 [cs.AI], 1 февр. 2024 г. [1]
  2. 2.0 2.1 2.2 2.3 Yu, H., et al. «LLMs Working in Harmony: A Survey on the Technological Aspects of Building Effective LLM-Based Multi Agent Systems». arXiv:2504.01963 [cs.CL], 2 апр. 2025 г. [2]
  3. «GitHub - OpenBMB/AgentVerse». GitHub. [3]
  4. 4.0 4.1 4.2 «Building Your First LLM Agent Application». NVIDIA Technical Blog. [4]

Category:AI tools