YandexGPT (modèle de langage)

From Systems analysis wiki
Jump to navigation Jump to search

YandexGPT (Yet another GPT) est une famille de grands modèles de langage (LLM) développée par Yandex et présentée pour la première fois en mai 2023.[1] Les réseaux YandexGPT sont utilisés dans l'assistant intégré Alice, dans le moteur de recherche Yandex et d'autres services, et sont également accessibles via l'API publique de la plateforme Yandex Cloud.[2]

YaLM-100B (2022) est un modèle de recherche précédent de 100 milliards de paramètres et open source ; il a servi de « preuve de concept », mais YandexGPT a été créé séparément pour une application commerciale.[3]

Historique des versions

Versions principales
Date Version Caractéristiques clés
Juin 2022 YaLM-100B 100 milliards de paramètres, 1,7 To de données ; Apache 2.0.[3]
17 mai 2023 YandexGPT 1.0 Intégration dans « Alice ».[1]
7 sept. 2023 YandexGPT 2 +67 % de qualité selon les tests internes.[4]
28 mars 2024 YandexGPT 3 Pro / Lite Nouvelle gamme d'API pour les entreprises.[5]
24 oct. 2024 YandexGPT 4 Pro / Lite Contexte de 32 000 tokens ; raisonnement caché (chain-of-thought).[6]
25 févr. 2025 YandexGPT 5 Pro Parité avec GPT-4o dans 64 % des tâches.[7]
31 mars 2025 YandexGPT 5 Lite Instruct Modèle de 8 milliards de paramètres en accès libre ; format Llama.[8]

Architecture et entraînement

  • Architecture de base : transformer, optimisée pour la langue russe.
  • YandexGPT 5 Lite : compatible Llama ; pré-entraînement ≈ 15 billions de tokens, fine-tuning ultérieur ≈ 320 milliards.[8]

Contexte et limites

  • Limite architecturale du contexte — 32 000 tokens (versions 4/5).[6]
  • L'API publique limite une seule requête (prompt + complétion) à 7 400 tokens.[9]
  • La taille maximale de la **réponse** est de 2 000 tokens, selon la section « Quotas and limits ».[10]

Modèles actuels (juin 2025)

Modèle Paramètres Contexte Licence Remarques
YandexGPT 5 Pro n/d 32 000 propriétaire Accès via API et « Alice Pro ».[7]
YandexGPT 5 Lite 8 milliards 32 000 Yandex GPT-Lite License Open source ; compatible Llama.[8]
YaLM-100B 100 milliards 2 048 Apache 2.0 Projet initial.[3]

Benchmarks

  • Tests internes : le 5 Pro a atteint la parité avec GPT-4o dans 64 % des tâches ; supériorité de 67 % par rapport au 4 Pro.[7]
  • ru-LLM Arena : YandexGPT maintient la première place au classement ELO parmi les modèles russophones.[11]

Fine-tuning

Pour le 5 Lite, la méthode LoRA est officiellement prise en charge ; un exemple de mise en œuvre est publié dans la model card.[8]

Modes de l'API

  • Synchrone — réponses rapides (Lite).
  • Asynchrone — tâches gourmandes en ressources (Pro).[2]

Multimodalité

La famille YandexGPT reste textuelle ; les services multimodaux (« Neuro », « YandexArt », « Yandex Vision ») sont développés séparément.[6]

Liens

Publications

  • Matkin, N. et al. (2024). Comparative Analysis of Encoder-Based NER and Large Language Models for Skill Extraction from Russian Job Vacancies. arXiv:2407.19816.
  • Tsanda, A.; Bruches, E. (2024). Russian-Language Multimodal Dataset for Automatic Summarization of Scientific Papers. arXiv:2405.07886.
  • Goloburda, M. et al. (2025). Qorǵau: Evaluating LLM Safety in Kazakh-Russian Bilingual Contexts. arXiv:2502.13640.
  • Togmanov, M. et al. (2025). KazMMLU: Evaluating Language Models on Kazakh, Russian, and Regional Knowledge of Kazakhstan. arXiv:2502.12829.
  • Noels, S. et al. (2025). What Large Language Models Do Not Talk About: An Empirical Study of Moderation and Censorship Practices. arXiv:2504.03803.

Notes

  1. 1.0 1.1 « Yandex a ajouté un analogue de ChatGPT à Alice ». RBC. [1]
  2. 2.0 2.1 « Getting started with YandexGPT (Quickstart) ». Yandex Cloud Docs. [2]
  3. 3.0 3.1 3.2 « yandex/YaLM-100B: Pretrained language model with 100B ». GitHub. [3]
  4. « Comment Yandex a décidé de monétiser son analogue de ChatGPT ». RBC. [4]
  5. « Yandex a présenté la troisième génération de réseaux neuronaux YandexGPT ». RBC. [5]
  6. 6.0 6.1 6.2 « Une famille de modèles YandexGPT 4 plus puissante ». Habr. [6]
  7. 7.0 7.1 7.2 « Yandex a intégré YandexGPT 5 Pro dans le chat avec “Alice Pro” ». AdIndex. [7]
  8. 8.0 8.1 8.2 8.3 « yandex/YandexGPT-5-Lite-8B-pretrain ». Hugging Face. [8]
  9. « ChatYandexGPT API Reference (max_tokens = 7400) ». LangChain Docs. [9]
  10. « Yandex Cloud service quotas and limits → Foundation Models ». Yandex Cloud Docs. [10]
  11. « llmarena/llmarena — plateforme russe de crowdsourcing pour l'évaluation des LLM ». GitHub. [11]