YandexGPT (modèle de langage)
YandexGPT (Yet another GPT) est une famille de grands modèles de langage (LLM) développée par Yandex et présentée pour la première fois en mai 2023.[1] Les réseaux YandexGPT sont utilisés dans l'assistant intégré Alice, dans le moteur de recherche Yandex et d'autres services, et sont également accessibles via l'API publique de la plateforme Yandex Cloud.[2]
YaLM-100B (2022) est un modèle de recherche précédent de 100 milliards de paramètres et open source ; il a servi de « preuve de concept », mais YandexGPT a été créé séparément pour une application commerciale.[3]
Historique des versions
| Date | Version | Caractéristiques clés |
|---|---|---|
| Juin 2022 | YaLM-100B | 100 milliards de paramètres, 1,7 To de données ; Apache 2.0.[3] |
| 17 mai 2023 | YandexGPT 1.0 | Intégration dans « Alice ».[1] |
| 7 sept. 2023 | YandexGPT 2 | +67 % de qualité selon les tests internes.[4] |
| 28 mars 2024 | YandexGPT 3 Pro / Lite | Nouvelle gamme d'API pour les entreprises.[5] |
| 24 oct. 2024 | YandexGPT 4 Pro / Lite | Contexte de 32 000 tokens ; raisonnement caché (chain-of-thought).[6] |
| 25 févr. 2025 | YandexGPT 5 Pro | Parité avec GPT-4o dans 64 % des tâches.[7] |
| 31 mars 2025 | YandexGPT 5 Lite Instruct | Modèle de 8 milliards de paramètres en accès libre ; format Llama.[8] |
Architecture et entraînement
- Architecture de base : transformer, optimisée pour la langue russe.
- YandexGPT 5 Lite : compatible Llama ; pré-entraînement ≈ 15 billions de tokens, fine-tuning ultérieur ≈ 320 milliards.[8]
Contexte et limites
- Limite architecturale du contexte — 32 000 tokens (versions 4/5).[6]
- L'API publique limite une seule requête (prompt + complétion) à 7 400 tokens.[9]
- La taille maximale de la **réponse** est de 2 000 tokens, selon la section « Quotas and limits ».[10]
Modèles actuels (juin 2025)
| Modèle | Paramètres | Contexte | Licence | Remarques |
|---|---|---|---|---|
| YandexGPT 5 Pro | n/d | 32 000 | propriétaire | Accès via API et « Alice Pro ».[7] |
| YandexGPT 5 Lite | 8 milliards | 32 000 | Yandex GPT-Lite License | Open source ; compatible Llama.[8] |
| YaLM-100B | 100 milliards | 2 048 | Apache 2.0 | Projet initial.[3] |
Benchmarks
- Tests internes : le 5 Pro a atteint la parité avec GPT-4o dans 64 % des tâches ; supériorité de 67 % par rapport au 4 Pro.[7]
- ru-LLM Arena : YandexGPT maintient la première place au classement ELO parmi les modèles russophones.[11]
Fine-tuning
Pour le 5 Lite, la méthode LoRA est officiellement prise en charge ; un exemple de mise en œuvre est publié dans la model card.[8]
Modes de l'API
- Synchrone — réponses rapides (Lite).
- Asynchrone — tâches gourmandes en ressources (Pro).[2]
Multimodalité
La famille YandexGPT reste textuelle ; les services multimodaux (« Neuro », « YandexArt », « Yandex Vision ») sont développés séparément.[6]
Liens
- YandexGPT sur Yandex Cloud — page du service
- Poids de YandexGPT-5 Lite sur Hugging Face
- Dépôt de YaLM-100B sur GitHub
Publications
- Matkin, N. et al. (2024). Comparative Analysis of Encoder-Based NER and Large Language Models for Skill Extraction from Russian Job Vacancies. arXiv:2407.19816.
- Tsanda, A.; Bruches, E. (2024). Russian-Language Multimodal Dataset for Automatic Summarization of Scientific Papers. arXiv:2405.07886.
- Goloburda, M. et al. (2025). Qorǵau: Evaluating LLM Safety in Kazakh-Russian Bilingual Contexts. arXiv:2502.13640.
- Togmanov, M. et al. (2025). KazMMLU: Evaluating Language Models on Kazakh, Russian, and Regional Knowledge of Kazakhstan. arXiv:2502.12829.
- Noels, S. et al. (2025). What Large Language Models Do Not Talk About: An Empirical Study of Moderation and Censorship Practices. arXiv:2504.03803.
Notes
- ↑ 1.0 1.1 « Yandex a ajouté un analogue de ChatGPT à Alice ». RBC. [1]
- ↑ 2.0 2.1 « Getting started with YandexGPT (Quickstart) ». Yandex Cloud Docs. [2]
- ↑ 3.0 3.1 3.2 « yandex/YaLM-100B: Pretrained language model with 100B ». GitHub. [3]
- ↑ « Comment Yandex a décidé de monétiser son analogue de ChatGPT ». RBC. [4]
- ↑ « Yandex a présenté la troisième génération de réseaux neuronaux YandexGPT ». RBC. [5]
- ↑ 6.0 6.1 6.2 « Une famille de modèles YandexGPT 4 plus puissante ». Habr. [6]
- ↑ 7.0 7.1 7.2 « Yandex a intégré YandexGPT 5 Pro dans le chat avec “Alice Pro” ». AdIndex. [7]
- ↑ 8.0 8.1 8.2 8.3 « yandex/YandexGPT-5-Lite-8B-pretrain ». Hugging Face. [8]
- ↑ « ChatYandexGPT API Reference (max_tokens = 7400) ». LangChain Docs. [9]
- ↑ « Yandex Cloud service quotas and limits → Foundation Models ». Yandex Cloud Docs. [10]
- ↑ « llmarena/llmarena — plateforme russe de crowdsourcing pour l'évaluation des LLM ». GitHub. [11]