YandexGPT (language model) — ヤンデックスGPT

YandexGPT (Yet another GPT)は、ヤンデックス社が開発し、2023年5月に初めて発表された大規模言語モデルのファミリーです。^[1] YandexGPTネットワークは、内蔵アシスタントのアリサ、検索エンジン、その他のサービスで使用されているほか、Yandex Cloudプラットフォームの公開APIを通じても利用可能です。^[2]

YaLM-100B (2022年) は、1000億パラメータを持つ先行研究モデルで、オープンソースです。これは「概念実証」として機能しましたが、YandexGPTは商用利用のために別途開発されました。^[3]

リリース履歴

主なバージョン
日付	リリース	主な特徴
2022年6月	YaLM‑100B	1000億パラメータ、1.7TBのデータ; Apache 2.0。^[3]
2023年5月17日	YandexGPT 1.0	「アリサ」への統合。^[1]
2023年9月7日	YandexGPT 2	内部テストで品質が+67%向上。^[4]
2024年3月28日	YandexGPT 3 Pro / Lite	新しい法人向けAPIラインナップ。^[5]
2024年10月24日	YandexGPT 4 Pro / Lite	32,000トークンのコンテキスト。隠れた推論 (chain‑of‑thought)。^[6]
2025年2月25日	YandexGPT 5 Pro	64%のタスクでGPT-4oと同等の性能。^[7]
2025年3月31日	YandexGPT 5 Lite Instruct	80億パラメータモデルをオープンアクセスで公開。Llamaフォーマット。^[8]

アーキテクチャとトレーニング

基本アーキテクチャ: ロシア語に最適化されたトランスフォーマー。
YandexGPT 5 Lite: Llama互換。事前学習 ≈ 15兆トークン、その後のファインチューニング ≈ 3200億トークン。^[8]

コンテキストと制限

アーキテクチャ上のコンテキスト上限 — 32,000トークン (バージョン4/5)。^[6]
公開APIでは、1回のリクエスト (prompt + completion) が7,400トークンに制限されています。^[9]
「Quotas and limits」セクションによると、**応答**の最大サイズは2,000トークンです。^[10]

現行モデル (2025年6月時点)

モデル	パラメータ	コンテキスト	ライセンス	備考
YandexGPT 5 Pro	非公開	32,000	プロプライエタリ	APIおよび「アリサPro」経由でアクセス可能。^[7]
YandexGPT 5 Lite	80億	32,000	Yandex GPT-Lite License	オープン。Llama互換。^[8]
YaLM-100B	1000億	2,048	Apache 2.0	初期のプロジェクト。^[3]

ベンチマーク

内部テスト: 5 Proは64%のタスクでGPT-4oと同等の性能を達成。4 Proを67%上回る。^[7]
ru-LLM Arena: YandexGPTは、ロシア語モデルの中でELOレーティングの首位を維持しています。^[11]

Fine-tuning - ファインチューニング

5 LiteではLoRAメソッドが公式にサポートされており、実行例がモデルカードに公開されています。^[8]

APIモード

同期モード — 迅速な応答 (Lite)。
非同期モード — リソースを大量に消費するタスク (Pro)。^[2]

マルチモーダル性

YandexGPTファミリーはテキストベースのままです。マルチモーダルサービス (「Neuro」、「YandexArt」、「Yandex Vision」) は別途開発されています。^[6]

外部リンク

参考文献

Matkin, N. et al. (2024). Comparative Analysis of Encoder-Based NER and Large Language Models for Skill Extraction from Russian Job Vacancies. arXiv:2407.19816.
Tsanda, A.; Bruches, E. (2024). Russian-Language Multimodal Dataset for Automatic Summarization of Scientific Papers. arXiv:2405.07886.
Goloburda, M. et al. (2025). Qorǵau: Evaluating LLM Safety in Kazakh-Russian Bilingual Contexts. arXiv:2502.13640.
Togmanov, M. et al. (2025). KazMMLU: Evaluating Language Models on Kazakh, Russian, and Regional Knowledge of Kazakhstan. arXiv:2502.12829.
Noels, S. et al. (2025). What Large Language Models Do Not Talk About: An Empirical Study of Moderation and Censorship Practices. arXiv:2504.03803.

脚注

↑ ^1.0 ^1.1 «“Яндекс” добавил в “Алису” аналог ChatGPT». РБК. [1]
↑ ^2.0 ^2.1 «Getting started with YandexGPT (Quickstart)». Yandex Cloud Docs. [2]
↑ ^3.0 ^3.1 ^3.2 «yandex/YaLM‑100B: Pretrained language model with 100B». GitHub. [3]
↑ «Как “Яндекс” решил зарабатывать на своём аналоге ChatGPT». РБК. [4]
↑ «“Яндекс” представил третье поколение нейросетей YandexGPT». РБК. [5]
↑ ^6.0 ^6.1 ^6.2 «Более мощное семейство моделей YandexGPT 4». Habr. [6]
↑ ^7.0 ^7.1 ^7.2 «“Яндекс” внедрил YandexGPT 5 Pro в чат с “Алисой Про”». AdIndex. [7]
↑ ^8.0 ^8.1 ^8.2 ^8.3 «yandex/YandexGPT‑5‑Lite‑8B‑pretrain». Hugging Face. [8]
↑ «ChatYandexGPT API Reference (max_tokens = 7400)». LangChain Docs. [9]
↑ «Yandex Cloud service quotas and limits → Foundation Models». Yandex Cloud Docs. [10]
↑ «llmarena/llmarena — российская краудсорсинговая платформа оценки LLM». GitHub. [11]

[rbc-may17-1] 1.0 ^1.1 «“Яндекс” добавил в “Алису” аналог ChatGPT». РБК. [1]

[cloud-api-2] 2.0 ^2.1 «Getting started with YandexGPT (Quickstart)». Yandex Cloud Docs. [2]

[github-yalm-3] 3.0 ^3.1 ^3.2 «yandex/YaLM‑100B: Pretrained language model with 100B». GitHub. [3]

[rbc-sep8-4] «Как “Яндекс” решил зарабатывать на своём аналоге ChatGPT». РБК. [4]

[rbc-mar28-5] «“Яндекс” представил третье поколение нейросетей YandexGPT». РБК. [5]

[habr-gpt4-6] 6.0 ^6.1 ^6.2 «Более мощное семейство моделей YandexGPT 4». Habr. [6]

[adindex-5pro-7] 7.0 ^7.1 ^7.2 «“Яндекс” внедрил YandexGPT 5 Pro в чат с “Алисой Про”». AdIndex. [7]

[hf-5lite-8] 8.0 ^8.1 ^8.2 ^8.3 «yandex/YandexGPT‑5‑Lite‑8B‑pretrain». Hugging Face. [8]

[langchain-7400-9] «ChatYandexGPT API Reference (max_tokens = 7400)». LangChain Docs. [9]

[cloud-limits-10] «Yandex Cloud service quotas and limits → Foundation Models». Yandex Cloud Docs. [10]

[llmarena-11] «llmarena/llmarena — российская краудсорсинговая платформа оценки LLM». GitHub. [11]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

YandexGPT (language model) — ヤンデックスGPT

Contents

リリース履歴

アーキテクチャとトレーニング

コンテキストと制限

現行モデル (2025年6月時点)

ベンチマーク

Fine-tuning - ファインチューニング

APIモード

マルチモーダル性

外部リンク

参考文献

脚注

Navigation menu

YandexGPT (language model) — ヤンデックスGPT

リリース履歴

アーキテクチャとトレーニング

コンテキストと制限

現行モデル (2025年6月時点)

ベンチマーク

Fine-tuning - ファインチューニング

APIモード

マルチモーダル性

外部リンク

参考文献

脚注

Navigation menu

Search