Multi-agent frameworks — أطر العمل متعددة الوكلاء
أطر العمل متعددة الوكلاء القائمة على LLM هي منصات برمجية تتيح لعدة وكلاء ذكاء اصطناعي مستقلين، مبنيين على نماذج اللغة الكبيرة (LLM)، التفاعل مع بعضهم البعض لحل المهام المعقدة بشكل مشترك[1]. في مثل هذه الأنظمة، يتم التركيز على تنوع ملفات تعريف الوكلاء، وتواصلهم، واتخاذ القرارات الجماعية. يستخدم هذا النهج "الذكاء الجماعي" للمجموعة، حيث يؤدي كل وكيل دورًا متخصصًا، ويحاكي تبادل الرسائل بينهم العمل التعاوني بين البشر.
يسمح هذا بنمذجة سيناريوهات معقدة من العالم الحقيقي وحل المشكلات التي تتجاوز قدرات وكيل ذكاء اصطناعي واحد. وقد أظهرت الأنظمة متعددة الوكلاء القائمة على LLM بالفعل نتائج ناجحة في مجالات مثل تطوير البرمجيات، والمحاكاة الاجتماعية، والألعاب الاقتصادية، ونمذجة النقاشات السياسية[1].
الأطر والمناهج الرئيسية
أدى تطور الأنظمة متعددة الوكلاء إلى ظهور عدد من أطر العمل مفتوحة المصدر التي تسهل إنشاءها والبحث فيها.
MetaGPT (2023)
أحد أول أطر العمل المفتوحة المصدر، ويركز على العمل التعاوني وفق مبدأ "خط التجميع" (assembly line). يطبق MetaGPT إجراءات التشغيل القياسية (SOPs) في النظام ويعيّن لكل وكيل دورًا محددًا (مثل مدير المنتج، مهندس، مختبِر). يسمح هذا النهج بتجزئة المهام المعقدة إلى مهام فرعية، وتوزيعها بين وكلاء متخصصين، مما يقلل من العشوائية وخطر الهلوسة[2].
CAMEL (2023)
يركز إطار العمل CAMEL (Communicative Agents for "Mind" Exploration) على التفاعل المستقل بين الوكلاء عبر الحوار. يقترح منهجية inception prompting لتنسيق المحادثة بين وكلاء LLM، وتوجيههم نحو هدف مشترك. يُمنح كل وكيل دورًا وسياقًا، وبعد ذلك يتواصل الوكلاء بلغة طبيعية، ويصلون تدريجيًا إلى حل مشترك. أثبت CAMEL فعاليته في السيناريوهات التي تتطلب التعاون دون تدخل بشري مباشر[1].
AutoGen (2023)
إطار عمل متعدد الاستخدامات وقابل للتخصيص من باحثي مايكروسوفت، مصمم لإنشاء تطبيقات معقدة تعتمد على التواصل بين عدة LLM. يسمح AutoGen ببرمجة منطق تفاعل الوكلاء باستخدام كل من الشيفرة البرمجية واللغة الطبيعية. يدعم التكامل مع الأدوات الخارجية وواجهات برمجة التطبيقات (API)، مما يجعله مناسبًا لمجموعة واسعة من المهام — من تطوير البرمجيات إلى إنشاء أنظمة الحوار[1].
AgentVerse (2023)
منصة مفتوحة المصدر طورها مجتمع OpenBMB لدراسة التعاون الديناميكي والسلوك الناشئ للوكلاء. يوفر AgentVerse وضعين للتشغيل:
- حل المهام (task-solving): يتحد عدة وكلاء LLM في فريق لإنجاز مهمة معقدة (على سبيل المثال، التطوير المشترك للبرمجيات).
- محاكاة البيئة (simulation): يسمح للمستخدم بتحديد بيئة افتراضية ومراقبة تفاعل الوكلاء (على سبيل المثال، محاكاة فصل دراسي أو معضلة السجينين).
تؤكد المنصة على أهمية وجود بيئة موحدة وبروتوكولات تواصل من أجل اتصال مُدار[3].
CrewAI (2024)
إطار عمل يركز على دمج وكلاء LLM في العمليات التجارية وتحليل البيانات. يطبق CrewAI مفهوم AI-Based Agents Workflow (AgWf)، حيث ينفذ الوكلاء خطوات موصوفة في شكل تعليمات نصية، ويمكنهم استخدام أدوات خارجية (فئات/دوال بايثون). يسمح هذا بأتمتة السيناريوهات التحليلية المعقدة، جامعًا بين مرونة LLM والشيفرة البرمجية الحتمية[2].
LangGraph (2024)
إطار عمل تجريبي يستخدم هياكل الرسم البياني لتمثيل الحالة والسياق في الحوارات مع LLM. الميزة الرئيسية في LangGraph هي دعم سير العمل الدوري. يسمح هذا للوكلاء بتبادل البيانات عبر رسم بياني للمعرفة مشترك، والبحث عن المعلومات بشكل تكراري، وتقييم موثوقيتها، وتصحيح الإجابات، وهو أمر مفيد بشكل خاص في مهام البحث عن المعلومات (QA) مع قاعدة معرفية معززة[2].
مشاريع أخرى
حظيت المشاريع التجريبية AutoGPT و AgentGPT باهتمام واسع، حيث أظهرت إمكانات وكلاء الذكاء الاصطناعي المستقلين تمامًا القادرين على تحديد الأهداف بأنفسهم، وإجراء عمليات بحث على الويب، وتشغيل الشيفرة البرمجية، وإدارة الملفات. على الرغم من أن هذه المشاريع لم تخضع لمراجعة علمية، إلا أنها أبرزت أهمية مكونات التخطيط والذاكرة والأدوات لبناء وكلاء مستقلين حقًا[4].
تطبيقات الأنظمة متعددة الوكلاء
- أتمتة تطوير البرمجيات: تعمل مجموعات من وكلاء LLM في أدوار المدير والمبرمج والمختبِر، حيث يخططون وينفذون المشاريع البرمجية بشكل مشترك. أظهرت دراسة ChatDev أن فريقًا من أربعة وكلاء تمكن من إنشاء تطبيق بسيط في دقائق معدودة، مع إجراء حوار في جميع المراحل من تحديد المهمة إلى الاختبار[2].
- المساعدون الأذكياء: تستخدم منتجات الشركات مثل Microsoft 365 Copilot و IBM Watsonx Orchestrate عدة وكلاء لتنفيذ المهام المعقدة، حيث يعالج أحد الوكلاء الطلب، ويستخرج آخر الحقائق من قاعدة البيانات، ويقوم ثالث بإعداد التقرير.
- البحث العلمي: يُستخدم الوكلاء لتوليد الفرضيات ونقدها. في مناهج مثل Guided Debate أو Self-Refine، يقترح أحد الوكلاء حلاً، بينما يقوم آخر بتقييمه وتصحيحه، مما يساعد على تقليل عدد الأخطاء[4].
- النمذجة الاجتماعية والعوالم الافتراضية: في المشروع البارز Generative Agents، قامت عشرات من وكلاء LLM، المزوّدين بشخصيات وذاكرة، بمحاكاة حياة بلدة افتراضية صغيرة، مما أظهر تفاعلًا اجتماعيًا واقعيًا. يمكن أن تجد مثل هذه المحاكاة تطبيقات في الألعاب (لإنشاء شخصيات غير قابلة للعب واقعية)، وفي التعليم والعلوم الاجتماعية[4].
التحديات والآفاق المستقبلية
على الرغم من النجاحات، تواجه الأنظمة متعددة الوكلاء عددًا من المشكلات الخطيرة:
- الهلوسة والأخطاء المتتالية: يمكن أن ينتقل الخطأ الذي يرتكبه أحد الوكلاء عبر السلسلة إلى وكلاء آخرين، الذين يعتبرونه أساسًا لاستنتاجاتهم، مما يؤدي إلى تشويه عمل المجموعة بأكملها[1].
- قابلية التوسع واستهلاك الموارد: يتطلب كل وكيل قائم على LLM موارد حاسوبية كبيرة. ويعد ضمان التشغيل المتزامن لعشرات الوكلاء مهمة فنية معقدة[1].
- التنسيق والإدارة: مع زيادة عدد الوكلاء، يزداد خطر الفوضى. ويتطلب الأمر آليات "تنسيق" مدروسة لإدارة تفاعلهم.
- التقييم والاختبار: لا توجد معايير قياسية مقبولة عالميًا للمقارنة الموضوعية بين مختلف أطر العمل متعددة الوكلاء.
في المستقبل، يُتوقع ظهور أنظمة متعددة الوسائط أكثر كفاءة وأمانًا، حيث يمكن للوكلاء تبادل ليس فقط النصوص، بل الصور والبيانات الأخرى أيضًا. قد يعلّم إدخال التعلم المعزز مجموعات الوكلاء التنسيق بشكل أفضل بمرور الوقت، مما يحقق تأثير "الذكاء الجماعي". في نهاية المطاف، تعد أطر العمل متعددة الوكلاء خطوة نحو إنشاء أنظمة ذكاء اصطناعي أكثر مرونة وقوة، حيث تعمل العديد من "العقول" المتخصصة معًا.
روابط خارجية
- مقال استعراضي: Large Language Model based Multi-Agents (2024)
- مقال استعراضي: LLMs Working in Harmony (2025)
مراجع
- Yao, S. et al. (2022). ReAct: Synergizing Reasoning and Acting in Language Models. arXiv:2210.03629.
- Hong, S. et al. (2023). MetaGPT: Meta Programming for a Multi-Agent Collaborative Framework. arXiv:2308.00352.
- Li, G. et al. (2023). CAMEL: Communicative Agents for "Mind" Exploration of Large Language Model Society. arXiv:2303.17760.
- Wu, Q. et al. (2023). AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation. arXiv:2308.08155.
- Liu, X. et al. (2023). AgentBench: Evaluating LLMs as Agents. arXiv:2308.03688.
- Yao, S. et al. (2023). Tree of Thoughts: Deliberate Problem Solving with Large Language Models. arXiv:2305.10601.
- Shinn, N. et al. (2023). Reflexion: Language Agents with Verbal Reinforcement Learning. arXiv:2303.11366.
- Chen, W. et al. (2023). AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors. arXiv:2308.10848.
- Park, J. S. et al. (2023). Generative Agents: Interactive Simulacra of Human Behavior. arXiv:2304.03442.
- Guo, T. et al. (2024). Large Language Model Based Multi-Agents: A Survey of Progress and Challenges. arXiv:2402.01680.
- Chen, Q. et al. (2024). ChatDev: Communicative Agents for Software Development. arXiv:2307.07924.
- Duan, Z.; Wang, J. (2024). Exploration of LLM Multi-Agent Application Implementation Based on LangGraph + CrewAI. arXiv:2411.18241.
- Aratchige, R. M.; Ilmini, W. M. K. S. (2025). LLMs Working in Harmony: A Survey on the Technological Aspects of Building Effective LLM-Based Multi-Agent Systems. arXiv:2504.01963.
ملاحظات
- ↑ 1.0 1.1 1.2 1.3 1.4 1.5 Wang, L., et al. «Large Language Model based Multi-Agents: A Survey of Progress and Challenges». arXiv:2402.01680 [cs.AI], 1 февр. 2024 г. [١]
- ↑ 2.0 2.1 2.2 2.3 Yu, H., et al. «LLMs Working in Harmony: A Survey on the Technological Aspects of Building Effective LLM-Based Multi Agent Systems». arXiv:2504.01963 [cs.CL], 2 апр. 2025 г. [٢]
- ↑ «GitHub - OpenBMB/AgentVerse». GitHub. [٣]
- ↑ 4.0 4.1 4.2 «Building Your First LLM Agent Application». NVIDIA Technical Blog. [٤]