Stochastic parrot — ببغاء عشوائي
الببغاء العشوائي (بالإنجليزية: Stochastic parrot) هو استعارة تُستخدم في مجال الذكاء الاصطناعي لوصف النماذج اللغوية الكبيرة (LLM) بأنها أنظمة قادرة على تجميع الأشكال اللغوية بطريقة محتملة إحصائيًا، لكنها تفتقر إلى الفهم الحقيقي لمعناها[1].
صيغ هذا المصطلح في مارس 2021 في ورقة بحثية بعنوان "عن مخاطر الببغاوات العشوائية: هل يمكن أن تكون النماذج اللغوية كبيرة جدًا؟" (بالإنجليزية: On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?)، نُشرت في مؤتمر FAccT. وقد كتبها كل من إميلي إم. بندر، وتيمنيت غيبرو، وأنجلينا ماكميلان-ميجر، ومارغريت ميتشل[2].
التعريف والمفهوم
وفقًا لمؤلفي الورقة، فإن الببغاء العشوائي هو «نظام يجمع بشكل عشوائي بين سلاسل من الأشكال اللغوية التي يلاحظها في بيانات التدريب الضخمة، وفقًا للمعلومات الاحتمالية حول كيفية ترابطها، ولكن دون أي ارتباط بالمعنى»[2].
يتكون المصطلح من جزأين:
- عشوائي (Stochastic) — من الكلمة اليونانية القديمة στοχαστικός (بمعنى "قائم على التخمين")، وفي الرياضيات الحديثة، يشير إلى عملية تحددها توزيعات احتمالية عشوائية[1].
- ببغاء (Parrot) — إشارة إلى قدرة الببغاوات على تقليد كلام البشر دون فهم معناه[1].
يؤكد المفهوم أن النماذج اللغوية الكبيرة، التي تُدرَّب على توقع الكلمة التالية في تسلسل، هي في جوهرها أنظمة إكمال تلقائي معقدة تتلاعب بالرموز دون الوصول إلى معناها.
الحجج الرئيسية في ورقة «On the Dangers of Stochastic Parrots»
تحدد الورقة أربع فئات رئيسية من المخاطر المرتبطة بتطوير نماذج لغوية كبيرة بشكل مفرط.
1. بيانات تدريب غير قابلة للفحص
تُدرَّب النماذج اللغوية الكبيرة على مجموعات بيانات ضخمة وغير مشروحة يتم جمعها من الإنترنت (مثل Common Crawl). تحتوي مجموعات البيانات هذه حتمًا على تحيزات، ولغة سامة، ووجهات نظر مهيمنة تلحق الضرر بالفئات الضعيفة. على سبيل المثال، يمثل محتوى الإنترنت بشكل غير متناسب الرجال البيض من الدول المتقدمة (67% من مستخدمي Reddit في الولايات المتحدة هم من الرجال)[2].
2. غياب الفهم الحقيقي للغة
يؤكد المؤلفون أن النماذج اللغوية الكبيرة لا تمتلك فهمًا حقيقيًا للغة. ويشيرون إلى النظرية القائلة بأن اللغة هي نظام من العلامات، حيث يرتبط الشكل (الكلمة) ارتباطًا وثيقًا بالمعنى. تحتوي بيانات التدريب للنماذج اللغوية الكبيرة على الشكل فقط، مما يحرم النموذج من الوصول إلى المعنى. لذلك، فإن النماذج اللغوية الكبيرة لا تفعل سوى محاكاة الكلام ذي المعنى.
3. النص الاصطناعي والضرر المحتمل
بما أن النماذج اللغوية الكبيرة تولد نصوصًا صحيحة نحويًا ومقنعة، يميل الناس إلى إسناد معنى إليها والثقة بها. وهذا يخلق خطر نشر المعلومات المضللة وخطاب الكراهية والاحتيال. كلما كانت المحاكاة أكثر إتقانًا، زاد خطر أن يبالغ الناس في تقدير قدرات الذكاء الاصطناعي ويوكلوا إليه قرارات حاسمة.
التأثير العلمي والجدل حول النشر
أصبحت الورقة محور فضيحة كبرى في Google، حيث كانت تعمل في ذلك الوقت المؤلفتان المشاركتان تيمنيت غيبرو ومارغريت ميتشل. في أواخر عام 2020، أثناء المراجعة الداخلية، طلبت إدارة Google من المؤلفين سحب الورقة أو إزالة أسماء موظفي Google منها[3].
رفضت تيمنيت غيبرو، وهي باحثة بارزة في أخلاقيات الذكاء الاصطناعي، الامتثال لهذا الطلب، مما أدى إلى طردها من Google في ديسمبر 2020. وفي فبراير 2021، طُردت أيضًا مارغريت ميتشل، التي دعمت غيبرو[4]. أثارت هذه الأحداث ضجة عامة واسعة. وقع أكثر من 2200 موظف في Google وآلاف من أعضاء المجتمع الأكاديمي على رسالة احتجاج، متهمين الشركة بالرقابة العلمية وقمع الأبحاث التي قد تمس مصالحها التجارية[5]. في النهاية، نُشرت الورقة في مارس 2021 في مؤتمر FAccT.
ردود الفعل والنقاشات وتطور وجهات النظر
انتشرت استعارة "الببغاء العشوائي" بسرعة وأصبحت نقطة محورية في النقاشات حول طبيعة الذكاء الاصطناعي. اختارت الجمعية الأمريكية للهجات (ADS) مصطلح «stochastic parrot» ليكون كلمة العام في مجال الذكاء الاصطناعي لعام 2023، حيث تفوق حتى على «ChatGPT» و«LLM»[1].
نقد المفهوم وأدلة الفهم
اعترض على هذا المفهوم العديد من الباحثين البارزين.
- جيفري هينتون، أحد "عرابي" التعلم العميق، جادل بأنه «لتوقع الكلمة التالية بدقة، يجب فهم الجملة»[1]. في عام 2023، بعد مغادرته Google، صرح بأن النماذج الكبيرة «تفهم» بالفعل ما يتم تعليمها إياه ويمكنها استخلاص استنتاجات مستقلة[6].
- القدرات الناشئة: أظهرت الأبحاث أنه عند الوصول إلى حجم معين، تظهر النماذج اللغوية الكبيرة قفزة في القدرات الجديدة، مثل حل المسائل الحسابية، التي لم تتم برمجتها بشكل صريح فيها[7].
- النماذج الداخلية للعالم: أظهرت دراسة أجريت عام 2022 أن نموذجًا تم تدريبه على لعب "عطيل" (Othello) بناءً على سجلات نصية للحركات، قد شكل تلقائيًا تمثيلًا داخليًا للوحة اللعب، مما يشير إلى تطوير نموذج مجرد للعالم الموصوف[3].
- الأداء في اختبارات القياس: تحقق النماذج الحديثة، مثل GPT-4، نتائج على مستوى الإنسان (أو أعلى) في الاختبارات المهنية المعقدة، وهو ما يعتقد البعض أنه مستحيل بدون فهم[8].
الاستخدام الساخر والخطاب العام
أصبح المصطلح شائعًا لدرجة أن رئيس OpenAI سام ألتمان استخدمه بسخرية، حيث كتب على تويتر: «أنا ببغاء عشوائي، وأنتم كذلك» (i am a stochastic parrot, and so r u). بهذا، ألمح إلى أن الكلام البشري هو أيضًا في جزء كبير منه توقع احتمالي للكلمة التالية، مستخدمًا النقد الموجه للذكاء الاصطناعي بطريقة ذكية[1].
التأثير على الخطاب العلمي
تظل استعارة "الببغاء العشوائي" محورية في النقاشات حول إمكانيات وحدود النماذج اللغوية الكبيرة. لقد ساعدت في صياغة مشكلة غياب الفهم الحقيقي لدى النماذج اللغوية ولفتت الانتباه إلى المخاطر المرتبطة بتطويرها. في الوقت نفسه، يجبر التقدم السريع في مجال النماذج اللغوية الكبيرة على إعادة التفكير المستمر في هذه الاستعارة، حيث تُظهر أحدث النماذج سلوكًا يزداد تعقيدًا ولا يتناسب مع صورة «الببغاء الذي لا يفقه شيئًا». يستمر المصطلح في التأثير على الخطاب العلمي، مؤكدًا على أهمية التحليل النقدي لقدرات أنظمة الذكاء الاصطناعي وعواقبها الاجتماعية[8].
المراجع
- Bender, E. M.; Gebru, T.; McMillan-Major, A.; Mitchell, M. (2021). On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?. FAccT 2021.
- Floridi, L.; Chiriatti, M. (2020). GPT-3: Its Nature, Scope, Limits, and Consequences. Minds & Machines, 30(4), 681-694.
- Bommasani, R. et al. (2021). On the Opportunities and Risks of Foundation Models. arXiv:2108.07258.
- Weidinger, L. et al. (2021). Ethical and Social Risks of Harm from Language Models. arXiv:2112.04359.
- Kaplan, J. et al. (2020). Scaling Laws for Neural Language Models. arXiv:2001.08361.
- Wei, J. et al. (2022). Emergent Abilities of Large Language Models. arXiv:2206.07682.
- Perez, E. et al. (2022). Red Teaming Language Models with Language Models. EMNLP 2022.
- Bai, Y. et al. (2022). Constitutional AI: Harmlessness from AI Feedback. arXiv:2212.08073.
- Du, Z. et al. (2024). Understanding Emergent Abilities of Language Models from the Loss Perspective. arXiv:2403.15796.
- Gerstgrasser, M. et al. (2024). Is Model Collapse Inevitable? Breaking the Curse of Recursion by Accumulating Real and Synthetic Data. arXiv:2404.01413.
ملاحظات
- ↑ 1.0 1.1 1.2 1.3 1.4 1.5 'Stochastic Parrot': A Name for AI That Sounds a Bit Less Intelligent. Mint. [١]
- ↑ 2.0 2.1 2.2 Bender, Emily M., et al. «On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?». Conference on Fairness, Accountability, and Transparency (FAccT '21). [٢]
- ↑ 3.0 3.1 «Протестующие пчёлы и стохастические попугаи: дайджест публикаций с критикой и поддержкой развития AI». Хабр. [٣]
- ↑ Hao, Karen. «We read the paper that forced Timnit Gebru out of Google. Here's what it says». MIT Technology Review. [٤]
- ↑ Vincent, James. «Timnit Gebru's actual paper may explain why Google ejected her». The Verge. [٥]
- ↑ «Geoffrey Hinton on the promise, risks of artificial intelligence». 60 Minutes - CBS News. [٦]
- ↑ «Stochastic parrot». Wikipedia. [٧]
- ↑ 8.0 8.1 «The debate over understanding in AI's large language models». PMC. [٨]