Tree of Thoughts (ToT) — شجرة الأفكار

From Systems analysis wiki
Jump to navigation Jump to search

Tree of Thoughts (ToT) (بالعربية: شجرة الأفكار) هو إطار عمل مبتكر لإدارة استدلال نماذج اللغة الكبيرة (LLM)، مما يسمح لها بأداء حل المشكلات بشكل مدروس من خلال الاستكشاف المنهجي لمسارات تفكير متعددة. تم تقديم هذا المفهوم في عام 2023 من قبل باحثين من جامعة برينستون وGoogle DeepMind[1].

يُعد إطار ToT امتدادًا وتعميمًا للتقنية الشائعة "سلسلة الأفكار" (Chain of Thought, CoT). على عكس CoT، حيث يكون الاستدلال عبارة عن تسلسل خطي واحد من الخطوات، ينظم ToT عملية التفكير على شكل شجرة، حيث تمثل كل عقدة حالة وسيطة ("فكرة")، وتمثل الفروع مسارات محتملة لتطور الاستدلال. يسمح هذا للنموذج باستكشاف عدة خيارات بالتوازي، وتقييم جدواها، والعودة إلى الخطوات السابقة عند اكتشاف طرق مسدودة (backtracking)، واتخاذ خيار مدروس[1][2].

مبدأ العمل

ينظم إطار ToT عملية حل المشكلات كبحث في شجرة الحالات. يعتمد عمله على تفاعل دوري بين أربعة مكونات رئيسية[1]:

  1. تجزئة المهمة إلى "أفكار": يتم تقسيم المشكلة الأصلية إلى مهام فرعية أصغر أو خطوات، تسمى "أفكار". على عكس CoT، حيث تكون "الفكرة" مجرد التوكن التالي، في ToT تكون "الفكرة" وحدة ذات معنى دلالي (مثل معادلة في مسألة رياضية أو فقرة في مخطط نصي) تقربنا من الحل.
  1. توليد الأفكار: في كل خطوة، وللحالة الحالية (عقدة في الشجرة)، يقوم النموذج بتوليد عدة "أفكار" تالية محتملة (فروع). تُستخدم لهذا الغرض استراتيجيتان:
  • أخذ العينات (sample): يقوم النموذج بتوليد عدة خيارات للمتابعة بشكل مستقل. هذا مناسب للمهام الإبداعية حيث يكون من المفيد وجود مجموعة واسعة من الأفكار.
  • الاقتراح (propose): يقوم النموذج بتوليد الخيارات بشكل تسلسلي، وهو أكثر كفاءة للمهام ذات فضاء حلول محدود.
  1. تقييم الحالات: يتم تقييم "الأفكار" المولدة بواسطة نموذج اللغة الكبير (LLM) نفسه لتحديد مدى جدواها. يمكن أن يكون التقييم رقميًا (على سبيل المثال، على مقياس من 0 إلى 1) أو فئويًا ("مؤكد"، "ممكن"، "مستحيل"). هذه هي دالة استدلالية (heuristic function) توجه البحث نحو الفروع الواعدة.
  1. خوارزمية البحث: لاستكشاف شجرة الأفكار بشكل منهجي، تُستخدم خوارزميات البحث الكلاسيكية:
  • البحث بالعرض أولاً (BFS): يستكشف جميع العقد في مستوى واحد قبل الانتقال إلى المستوى التالي. يضمن إيجاد أقصر مسار، ولكنه يتطلب ذاكرة أكبر.
  • البحث بالعمق أولاً (DFS): يستكشف فرعًا واحدًا حتى النهاية قبل العودة وتجربة فرع آخر. هو أكثر اقتصادًا في استخدام الذاكرة ومناسب للمهام ذات فضاء بحث عميق ولكن ليس واسعًا جدًا.

يحاكي هذا الإطار التفكير البشري عند حل المشكلات، حيث يجمع بين التوليد الحدسي للأفكار (بمساعدة LLM) والتخطيط المنهجي المدروس واستعراض الخيارات[2].

مقارنة مع أساليب الاستدلال الأخرى

ToT vs. Chain of Thought (CoT) - مقارنة ToT مع سلسلة الأفكار (CoT)

يعد ToT تعميمًا مباشرًا لـ CoT. إذا كان من الممكن تمثيل CoT كشجرة بعرض تفرع يساوي 1، فإن ToT يسمح باستكشاف شجرة بعرض عشوائي. وهذا يمنحه مزايا رئيسية[3]:

  • استكشاف البدائل: يمكن لـ ToT النظر في مسارات حل متعددة، بينما يقتصر CoT على مسار خطي واحد.
  • إمكانية التراجع: يسمح ToT للنموذج بـ "العودة إلى الوراء" إذا وصل فرع من التفكير إلى طريق مسدود، وهو أمر غير ممكن في CoT.
  • التخطيط الشامل: يسمح ToT باتخاذ خيارات استراتيجية بناءً على تقييم عدة خطوات مستقبلية.

ToT vs. Self-Consistency - مقارنة ToT مع الاتساق الذاتي

يقوم أسلوب الاتساق الذاتي (Self-Consistency) بتوليد العديد من "سلاسل الأفكار" المستقلة ويختار الإجابة الأكثر شيوعًا عن طريق التصويت. تعمل هذه الطريقة على تحسين موثوقية CoT، ولكنها، مثل CoT، لا تسمح باستكشاف بنية الحل المتفرعة. في المقابل، يمكن لـ ToT أن يُظهر تحسينات أكثر أهمية في مهام التخطيط المعقدة، حيث لا يهم فقط المحاولات المستقلة، بل ترابطها أيضًا[1].

النتائج التجريبية

أظهر مؤلفو ToT فعاليته في ثلاث مهام تتطلب تخطيطًا أو بحثًا غير بسيط.

  • لعبة 24: لغز رياضي يتطلب الحصول على الرقم 24 من أربعة أرقام معطاة باستخدام العمليات الحسابية الأساسية. أظهر التوجيه القياسي مع GPT-4 نسبة نجاح بلغت 7.3%، بينما حققت سلسلة الأفكار (Chain of Thought) نسبة 4%. وصل ToT مع البحث بالعرض أولاً (b=5) إلى نسبة نجاح 74%، وهو ما يتفوق على CoT بـ 18.5 مرة[1][4].
  • الكتابة الإبداعية: في مهمة توليد نص مترابط من أربع فقرات بجمل أخيرة محددة، حصلت النصوص التي تم إنشاؤها باستخدام ToT على متوسط درجة ترابط بلغ 7.56 من 10، بينما حصلت نصوص CoT على 6.15. في 41 من أصل 100 مقارنة، فضل البشر النص الذي تم إنشاؤه بواسطة ToT، مقابل 21 لـ CoT[5].
  • الكلمات المتقاطعة المصغرة (5x5): ملأ ToT 60% من الكلمات بشكل صحيح، بينما ملأ CoT 1% فقط[6].

القيود والتوجهات المستقبلية

على الرغم من النتائج المثيرة للإعجاب، فإن إطار ToT له عدد من القيود:

  • التعقيد الحسابي: يتطلب ToT موارد حسابية أكبر بكثير (من 5 إلى 100 مرة أكثر من التوكنات) من الأساليب القياسية، بسبب الحاجة إلى توليد وتقييم العديد من "الأفكار"[1].
  • صعوبة التنفيذ: يتطلب تطبيق ToT جهودًا هندسية كبيرة لإنشاء وتكوين جميع المكونات: مولّد الأفكار، ومقيّم الحالات، وخوارزمية البحث.
  • الاعتماد على جودة التقييم: تعتمد فعالية الإطار بأكمله بشكل كبير على قدرة نموذج اللغة الكبير (LLM) على تقييم الحالات الوسيطة بشكل مناسب، وهو أمر غير مضمون دائمًا.

تهدف الأبحاث المستقبلية إلى زيادة الكفاءة، وأتمتة التحسين، ودمج ToT مع أساليب أخرى مثل التعلم المعزز، لإنشاء وكلاء أكثر ذكاءً واستقلالية.

روابط خارجية

مراجع

  • Yao, S. et al. (2023). Tree of Thoughts: Deliberate Problem Solving with Large Language Models. arXiv:2305.10601.
  • Wei, J. et al. (2022). Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. arXiv:2201.11903.
  • Wang, X. et al. (2022). Self-Consistency Improves Chain of Thought Reasoning in Language Models. arXiv:2203.11171.
  • Kojima, T. et al. (2022). Large Language Models are Zero-Shot Reasoners. arXiv:2205.11916.
  • Zhang, Z. et al. (2022). Automatic Chain of Thought Prompting in Large Language Models. arXiv:2210.03493.
  • Lyu, Q. et al. (2023). Faithful Chain-of-Thought Reasoning. arXiv:2301.13379.
  • Ling, Z. et al. (2023). Deductive Verification of Chain of Thought Reasoning. arXiv:2306.03872.
  • Yao, S. et al. (2022). ReAct: Synergizing Reasoning and Acting in Language Models. arXiv:2210.03629.
  • Besta, M. et al. (2023). Graph of Thoughts: Solving Elaborate Problems with Large Language Models. arXiv:2308.09687.
  • Lightman, H. et al. (2023). Let’s Verify Step by Step. arXiv:2305.20050.
  • Lanham, T. et al. (2023). Measuring Faithfulness in Chain-of-Thought Reasoning. arXiv:2307.13702.
  • Yang, B. et al. (2025). Hallucination Detection in Large Language Models with Metamorphic Relations. arXiv:2502.15844.

هوامش

  1. 1.0 1.1 1.2 1.3 1.4 1.5 Yao, S., Yu, D., Zhao, J., et al. (2023). «Tree of Thoughts: Deliberate Problem Solving with Large Language Models». arXiv. [١]
  2. 2.0 2.1 «What is Tree of Thoughts Prompting?». IBM. [٢]
  3. «Tree of Thoughts vs Chain of Thought». Substack.
  4. «...18.5 times improvement...». arXiv.
  5. «...41 out of 100 comparisons...». OpenReview.
  6. «...CoT: 1% success rate...». arXiv.