YandexGPT (language model) — ヤンデックスGPT

From Systems analysis wiki
Jump to navigation Jump to search

YandexGPT (Yet another GPT)は、ヤンデックス社が開発し、2023年5月に初めて発表された大規模言語モデルのファミリーです。[1] YandexGPTネットワークは、内蔵アシスタントのアリサ、検索エンジン、その他のサービスで使用されているほか、Yandex Cloudプラットフォームの公開APIを通じても利用可能です。[2]

YaLM-100B (2022年) は、1000億パラメータを持つ先行研究モデルで、オープンソースです。これは「概念実証」として機能しましたが、YandexGPTは商用利用のために別途開発されました。[3]

リリース履歴

主なバージョン
日付 リリース 主な特徴
2022年6月 YaLM‑100B 1000億パラメータ、1.7TBのデータ; Apache 2.0。[3]
2023年5月17日 YandexGPT 1.0 「アリサ」への統合。[1]
2023年9月7日 YandexGPT 2 内部テストで品質が+67%向上。[4]
2024年3月28日 YandexGPT 3 Pro / Lite 新しい法人向けAPIラインナップ。[5]
2024年10月24日 YandexGPT 4 Pro / Lite 32,000トークンのコンテキスト。隠れた推論 (chain‑of‑thought)。[6]
2025年2月25日 YandexGPT 5 Pro 64%のタスクでGPT-4oと同等の性能。[7]
2025年3月31日 YandexGPT 5 Lite Instruct 80億パラメータモデルをオープンアクセスで公開。Llamaフォーマット。[8]

アーキテクチャとトレーニング

  • 基本アーキテクチャ: ロシア語に最適化されたトランスフォーマー。
  • YandexGPT 5 Lite: Llama互換。事前学習 ≈ 15兆トークン、その後のファインチューニング ≈ 3200億トークン。[8]

コンテキストと制限

  • アーキテクチャ上のコンテキスト上限 — 32,000トークン (バージョン4/5)。[6]
  • 公開APIでは、1回のリクエスト (prompt + completion) が7,400トークンに制限されています。[9]
  • 「Quotas and limits」セクションによると、**応答**の最大サイズは2,000トークンです。[10]

現行モデル (2025年6月時点)

モデル パラメータ コンテキスト ライセンス 備考
YandexGPT 5 Pro 非公開 32,000 プロプライエタリ APIおよび「アリサPro」経由でアクセス可能。[7]
YandexGPT 5 Lite 80億 32,000 Yandex GPT-Lite License オープン。Llama互換。[8]
YaLM-100B 1000億 2,048 Apache 2.0 初期のプロジェクト。[3]

ベンチマーク

  • 内部テスト: 5 Proは64%のタスクでGPT-4oと同等の性能を達成。4 Proを67%上回る。[7]
  • ru-LLM Arena: YandexGPTは、ロシア語モデルの中でELOレーティングの首位を維持しています。[11]

Fine-tuning - ファインチューニング

5 LiteではLoRAメソッドが公式にサポートされており、実行例がモデルカードに公開されています。[8]

APIモード

  • 同期モード — 迅速な応答 (Lite)。
  • 非同期モード — リソースを大量に消費するタスク (Pro)。[2]

マルチモーダル性

YandexGPTファミリーはテキストベースのままです。マルチモーダルサービス (「Neuro」、「YandexArt」、「Yandex Vision」) は別途開発されています。[6]

外部リンク

参考文献

  • Matkin, N. et al. (2024). Comparative Analysis of Encoder-Based NER and Large Language Models for Skill Extraction from Russian Job Vacancies. arXiv:2407.19816.
  • Tsanda, A.; Bruches, E. (2024). Russian-Language Multimodal Dataset for Automatic Summarization of Scientific Papers. arXiv:2405.07886.
  • Goloburda, M. et al. (2025). Qorǵau: Evaluating LLM Safety in Kazakh-Russian Bilingual Contexts. arXiv:2502.13640.
  • Togmanov, M. et al. (2025). KazMMLU: Evaluating Language Models on Kazakh, Russian, and Regional Knowledge of Kazakhstan. arXiv:2502.12829.
  • Noels, S. et al. (2025). What Large Language Models Do Not Talk About: An Empirical Study of Moderation and Censorship Practices. arXiv:2504.03803.

脚注

  1. 1.0 1.1 «“Яндекс” добавил в “Алису” аналог ChatGPT». РБК. [1]
  2. 2.0 2.1 «Getting started with YandexGPT (Quickstart)». Yandex Cloud Docs. [2]
  3. 3.0 3.1 3.2 «yandex/YaLM‑100B: Pretrained language model with 100B». GitHub. [3]
  4. «Как “Яндекс” решил зарабатывать на своём аналоге ChatGPT». РБК. [4]
  5. «“Яндекс” представил третье поколение нейросетей YandexGPT». РБК. [5]
  6. 6.0 6.1 6.2 «Более мощное семейство моделей YandexGPT 4». Habr. [6]
  7. 7.0 7.1 7.2 «“Яндекс” внедрил YandexGPT 5 Pro в чат с “Алисой Про”». AdIndex. [7]
  8. 8.0 8.1 8.2 8.3 «yandex/YandexGPT‑5‑Lite‑8B‑pretrain». Hugging Face. [8]
  9. «ChatYandexGPT API Reference (max_tokens = 7400)». LangChain Docs. [9]
  10. «Yandex Cloud service quotas and limits → Foundation Models». Yandex Cloud Docs. [10]
  11. «llmarena/llmarena — российская краудсорсинговая платформа оценки LLM». GitHub. [11]