YandexGPT (language model) — ヤンデックスGPT
Jump to navigation
Jump to search
YandexGPT (Yet another GPT)は、ヤンデックス社が開発し、2023年5月に初めて発表された大規模言語モデルのファミリーです。[1] YandexGPTネットワークは、内蔵アシスタントのアリサ、検索エンジン、その他のサービスで使用されているほか、Yandex Cloudプラットフォームの公開APIを通じても利用可能です。[2]
YaLM-100B (2022年) は、1000億パラメータを持つ先行研究モデルで、オープンソースです。これは「概念実証」として機能しましたが、YandexGPTは商用利用のために別途開発されました。[3]
リリース履歴
| 日付 | リリース | 主な特徴 |
|---|---|---|
| 2022年6月 | YaLM‑100B | 1000億パラメータ、1.7TBのデータ; Apache 2.0。[3] |
| 2023年5月17日 | YandexGPT 1.0 | 「アリサ」への統合。[1] |
| 2023年9月7日 | YandexGPT 2 | 内部テストで品質が+67%向上。[4] |
| 2024年3月28日 | YandexGPT 3 Pro / Lite | 新しい法人向けAPIラインナップ。[5] |
| 2024年10月24日 | YandexGPT 4 Pro / Lite | 32,000トークンのコンテキスト。隠れた推論 (chain‑of‑thought)。[6] |
| 2025年2月25日 | YandexGPT 5 Pro | 64%のタスクでGPT-4oと同等の性能。[7] |
| 2025年3月31日 | YandexGPT 5 Lite Instruct | 80億パラメータモデルをオープンアクセスで公開。Llamaフォーマット。[8] |
アーキテクチャとトレーニング
- 基本アーキテクチャ: ロシア語に最適化されたトランスフォーマー。
- YandexGPT 5 Lite: Llama互換。事前学習 ≈ 15兆トークン、その後のファインチューニング ≈ 3200億トークン。[8]
コンテキストと制限
- アーキテクチャ上のコンテキスト上限 — 32,000トークン (バージョン4/5)。[6]
- 公開APIでは、1回のリクエスト (prompt + completion) が7,400トークンに制限されています。[9]
- 「Quotas and limits」セクションによると、**応答**の最大サイズは2,000トークンです。[10]
現行モデル (2025年6月時点)
| モデル | パラメータ | コンテキスト | ライセンス | 備考 |
|---|---|---|---|---|
| YandexGPT 5 Pro | 非公開 | 32,000 | プロプライエタリ | APIおよび「アリサPro」経由でアクセス可能。[7] |
| YandexGPT 5 Lite | 80億 | 32,000 | Yandex GPT-Lite License | オープン。Llama互換。[8] |
| YaLM-100B | 1000億 | 2,048 | Apache 2.0 | 初期のプロジェクト。[3] |
ベンチマーク
- 内部テスト: 5 Proは64%のタスクでGPT-4oと同等の性能を達成。4 Proを67%上回る。[7]
- ru-LLM Arena: YandexGPTは、ロシア語モデルの中でELOレーティングの首位を維持しています。[11]
Fine-tuning - ファインチューニング
5 LiteではLoRAメソッドが公式にサポートされており、実行例がモデルカードに公開されています。[8]
APIモード
- 同期モード — 迅速な応答 (Lite)。
- 非同期モード — リソースを大量に消費するタスク (Pro)。[2]
マルチモーダル性
YandexGPTファミリーはテキストベースのままです。マルチモーダルサービス (「Neuro」、「YandexArt」、「Yandex Vision」) は別途開発されています。[6]
外部リンク
参考文献
- Matkin, N. et al. (2024). Comparative Analysis of Encoder-Based NER and Large Language Models for Skill Extraction from Russian Job Vacancies. arXiv:2407.19816.
- Tsanda, A.; Bruches, E. (2024). Russian-Language Multimodal Dataset for Automatic Summarization of Scientific Papers. arXiv:2405.07886.
- Goloburda, M. et al. (2025). Qorǵau: Evaluating LLM Safety in Kazakh-Russian Bilingual Contexts. arXiv:2502.13640.
- Togmanov, M. et al. (2025). KazMMLU: Evaluating Language Models on Kazakh, Russian, and Regional Knowledge of Kazakhstan. arXiv:2502.12829.
- Noels, S. et al. (2025). What Large Language Models Do Not Talk About: An Empirical Study of Moderation and Censorship Practices. arXiv:2504.03803.
脚注
- ↑ 1.0 1.1 «“Яндекс” добавил в “Алису” аналог ChatGPT». РБК. [1]
- ↑ 2.0 2.1 «Getting started with YandexGPT (Quickstart)». Yandex Cloud Docs. [2]
- ↑ 3.0 3.1 3.2 «yandex/YaLM‑100B: Pretrained language model with 100B». GitHub. [3]
- ↑ «Как “Яндекс” решил зарабатывать на своём аналоге ChatGPT». РБК. [4]
- ↑ «“Яндекс” представил третье поколение нейросетей YandexGPT». РБК. [5]
- ↑ 6.0 6.1 6.2 «Более мощное семейство моделей YandexGPT 4». Habr. [6]
- ↑ 7.0 7.1 7.2 «“Яндекс” внедрил YandexGPT 5 Pro в чат с “Алисой Про”». AdIndex. [7]
- ↑ 8.0 8.1 8.2 8.3 «yandex/YandexGPT‑5‑Lite‑8B‑pretrain». Hugging Face. [8]
- ↑ «ChatYandexGPT API Reference (max_tokens = 7400)». LangChain Docs. [9]
- ↑ «Yandex Cloud service quotas and limits → Foundation Models». Yandex Cloud Docs. [10]
- ↑ «llmarena/llmarena — российская краудсорсинговая платформа оценки LLM». GitHub. [11]