IBM Granite (language model) — آي بي إم جرانيت
IBM Granite هي سلسلة من نماذج اللغة الكبيرة (LLM) التي طورتها شركة IBM للاستخدام في بيئات الشركات. نماذج Granite هي محولات انحدارية ذاتية (autoregressive transformers) ذات بنية "ديكودر فقط" (decoder-only)، وهي قادرة على توليد النصوص بناءً على سياق معين[1].
تم تقديم هذه العائلة رسميًا في 7 سبتمبر 2023 كجزء من إطلاق منصة IBM watsonx.ai السحابية[2]. تقدم IBM نماذج Granite على أنها حلول مفتوحة وعالية الأداء وموثوقة للمؤسسات، مع التركيز على شفافية بيانات التدريب، والتحكم في المخاطر، والترخيص الذي يسمح بالاستخدام التجاري[3].
تاريخ التطوير
أصبحت عائلة نماذج Granite جزءًا من استراتيجية IBM لتقديم نماذجها التوليدية الخاصة للشركات، إلى جانب النماذج المقدمة من الشركاء.
- سبتمبر 2023: الإعلان الرسمي وإطلاق النماذج الأولى على منصة watsonx.ai. الإصدارات الأولى، Granite.13b.instruct وGranite.13b.chat، كانت تحتوي على حوالي 13 مليار مُعلَمة وكانت موجهة للمهام الرئيسية في معالجة اللغات[2].
- مايو 2024: أعلنت IBM عن الإطلاق المفتوح لعدة نماذج من عائلة Granite Code (بحجم يتراوح من 3 إلى 34 مليار مُعلَمة) بموجب ترخيص Apache 2.0. تم نشر أوزان النماذج على منصة Hugging Face، مما شكّل خطوة مهمة في دعم النظام البيئي المفتوح للذكاء الاصطناعي[4].
- خريف 2024: أصدرت IBM تحديث Granite 3.0، الذي يتضمن نماذج أصغر حجمًا (2 و 8 مليار مُعلَمة) وميزات جديدة، مما يؤكد توجهها نحو توسيع هذه العائلة[5].
البنية والتدريب
البنية
تعتمد نماذج IBM Granite على بنية المحول القائمة على المُفكِّك فقط (decoder-only), بشكل مشابه لنماذج GPT. يستخدم نموذج Granite.13b الأساسي آلية الانتباه متعدد الاستعلامات (multi-query attention) ويمتلك نافذة سياق تصل إلى 8000 توكن[6]. يتم تدريب النماذج باستخدام التعلم ذاتي الإشراف (self-supervised learning).
بيانات التدريب وحوكمة الذكاء الاصطناعي
الميزة الرئيسية لنماذج Granite هي استخدامها لمجموعة بيانات خاصة ومنسقة بعناية، تم اختيارها لتلبية احتياجات الشركات. على عكس العديد من نماذج اللغة الكبيرة التي تُدرَّب على عينات غير مفلترة من الويب، تم تدريب Granite على بيانات عالية الجودة (enterprise-quality) تغطي المجالات التالية[6]:
- البيانات الأكاديمية والعلمية: الأدبيات العلمية والمنشورات التقنية.
- الكود البرمجي: مجموعات كبيرة من الأكواد بلغات متعددة.
- البيانات القانونية: قرارات قضائية وتقارير عامة.
- البيانات المالية: تقارير مالية للشركات.
- الإنترنت: نصوص غير مهيكلة ذات طابع عام خضعت للفلترة.
تؤكد IBM أن عملية التطوير اتبعت مبادئ صارمة لحوكمة الذكاء الاصطناعي (AI Governance) والتي تشمل أخلاقيات وإدارة البيانات. خضع كل جزء من البيانات لعملية تدقيق للتحقق من توافقه مع سياسات الشركة. لإزالة المحتوى غير المرغوب فيه، تم استخدام كاشف داخلي يسمى «HAP» (اختصار لـ Hate and Profanity)، بالإضافة إلى قوائم حظر آلية لمصادر الويب[1]. نشرت IBM تقريرًا فنيًا مفصلاً يتضمن قائمة بالمصادر، وهي خطوة نادرة بالنسبة لشركات التكنولوجيا الكبرى وتضمن شفافية عالية.
عائلة نماذج Granite
تغطي عائلة IBM Granite عدة فئات من النماذج لمختلف مهام الأعمال:
- نماذج اللغة (Granite Language Models): نماذج أساسية ونماذج مضبوطة بالتعليمات (instruction-tuned) لمهام معالجة النصوص مثل التوليد، والتلخيص، والتصنيف، وغيرها.
- نماذج البرمجة (Granite Code Models): نماذج لغة كبيرة متخصصة، مدربة على أكثر من 100 لغة برمجة، لمهام مثل الإكمال التلقائي، وتوليد الكود، وتصحيحه. متوفرة بأحجام تتراوح من 3 إلى 34 مليار مُعلَمة[4].
- نماذج الرؤية الحاسوبية (Granite Vision Models): شبكات عصبونية لتحليل الصور والمستندات، والتعرف على النصوص، وفهم المحتوى.
- نماذج الكلام (Granite Speech Models): نماذج مدمجة للتعرف على الكلام وترجمته.
- نماذج السلاسل الزمنية (Granite for Time Series): نماذج متخصصة للتنبؤ بناءً على السلاسل الزمنية.
- النموذج الجغرافي المكاني (Granite for Geospatial): تم تطويره بالتعاون مع وكالة ناسا لتحليل صور الأقمار الصناعية والبيانات الجغرافية الأخرى.
- نماذج التضمين (Granite Embedding Models): نماذج مخصصة لمهام البحث الدلالي وبناء أنظمة RAG.
- Granite Guardian: وحدة متخصصة لضمان الأمان، مصممة لفلترة الطلبات غير المرغوب فيها ومراقبة المحتوى.
المصدر المفتوح والترخيص
ركزت IBM بشكل كبير على جعل عائلة Granite مفتوحة، حيث قدمتها كبديل شفاف لنماذج اللغة الكبيرة المغلقة والمملوكة. في مايو 2024، أتاحت الشركة نماذج Granite Code الأساسية للمجتمع المفتوح بموجب ترخيص Apache 2.0، مما يسمح باستخدامها وتعديلها وتوزيعها بحرية[4].
هذه الخطوة، إلى جانب نشر معلومات مفصلة عن بيانات التدريب، جلبت لشركة IBM تقييمًا عاليًا من مجتمع البحث العلمي. في عام 2024، احتلت النماذج مراكز متقدمة في مؤشر شفافية النماذج الأساسية الذي تصدره جامعة ستانفورد[3].
التطبيقات
تم دمج نماذج Granite في منصة IBM watsonx السحابية وتُستخدم في سيناريوهات متنوعة للشركات.
- التحليلات الرياضية (US Open): بالتعاون مع اتحاد التنس في الولايات المتحدة (USTA)، تستخدم IBM نماذج Granite لإنشاء تقارير المباريات والتعليقات الصوتية تلقائيًا بعد كل مباراة في بطولة US Open. يقوم الحل بإنشاء ملخص نصي مفصل للمباراة في غضون دقائق من انتهائها[7].
- مساعدة المبرمجين: تشكل نماذج Granite Code أساس IBM watsonx Code Assistant، وهي مجموعة من الأدوات التي يمكنها، على سبيل المثال، تحويل أكواد COBOL القديمة تلقائيًا إلى خدمات مصغرة (microservices) حديثة لمنصة IBM Z[4].
- تطبيقات الذكاء الاصطناعي القطاعية: قامت شركة Lockheed Martin بدمج نماذج Granite في منصتها AI Factory لمهام الأمن القومي. كما تستخدم ESPN نماذج Granite لتوليد تعليقات مخصصة في رياضات الفانتازي (fantasy sports)[3].
المراجع
- Ainslie, J. et al. (2023). GQA: Training Generalized Multi‑Query Transformer Models from Multi‑Head Checkpoints. arXiv:2305.13245.
- Awasthy, P. et al. (2025). Granite Embedding Models. arXiv:2502.20204.
- Dao, T. et al. (2022). FlashAttention: Fast and Memory‑Efficient Exact Attention with IO‑Awareness. arXiv:2205.14135.
- Ding, Y. et al. (2024). LongRoPE: Extending LLM Context Window Beyond 2 Million Tokens. arXiv:2402.13753.
- Fedus, W.; Zoph, B.; Shazeer, N. (2021). Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity. arXiv:2101.03961.
- Granite Vision Team (2025). Granite Vision: A Lightweight, Open‑Source Multimodal Model for Enterprise Intelligence. arXiv:2502.09927.
- Mishra, M. et al. (2024). Granite Code Models: A Family of Open Foundation Models for Code Intelligence. arXiv:2405.04324.
- Padhi, I. et al. (2024). Granite Guardian: Risk Detection for Safe and Responsible Use of LLMs. arXiv:2412.07724.
- Peng, B. et al. (2023). YaRN: Efficient Context Window Extension of Large Language Models. arXiv:2309.00071.
- Stallone, M. et al. (2024). Scaling Granite Code Models to 128K Context. arXiv:2407.13739.
ملاحظات
- ↑ 1.0 1.1 «Building AI for business: IBM's Granite foundation models». IBM Blog. [١]
- ↑ 2.0 2.1 Lardinois, Frederic (7 سبتمبر 2023). «IBM rolls out new generative AI features and models». TechCrunch. [٢]
- ↑ 3.0 3.1 3.2 «Granite». IBM. [٣]
- ↑ 4.0 4.1 4.2 4.3 «IBM's Granite code model family is going open source». IBM Research Blog. [٤]
- ↑ «Granite 3.3 Language Models - a ibm-granite Collection». Hugging Face. [٥]
- ↑ 6.0 6.1 «Granite Foundation Models: Technical Specifications». IBM. [٦]
- ↑ «IBM and the USTA Serve Up New and Enhanced Generative AI Features for 2024 US Open Digital Platforms». IBM Newsroom. [٧]