YandexGPT (language model) — Yandex的大语言模型

YandexGPT 是由 Yandex 公司开发的大规模语言模型系列，于2023年5月首次发布。^[1] 它被用于内置助手 Alice（俄语 Алиса）、搜索引擎及其他服务中，并可通过云端 AI 平台 Yandex Cloud AI Studio 的 API 调用。^[2] 截至2026年6月，主力模型为 YandexGPT Pro 5.1 以及与之相关的 Alice AI LLM。^[3]

YandexGPT 源自 Yandex 内部代号为“Genesis”（Дженезис，又称“YaLM 2.0”）的项目。其前身模型 YaLM-100B（2022年）是一个拥有1000亿参数的开源模型（Apache 2.0 许可，基于1.7TB 数据训练），起到了“概念验证”的作用，而 YandexGPT 则是为商业用途单独开发的。^[4]

发布历史

主要版本
日期	版本	主要特性
2022年6月	YaLM‑100B	1000亿参数、1.7TB 数据、Apache 2.0。^[4]
2023年5月17日	YandexGPT 1.0	整合进 Alice。^[1]
2023年9月7日	YandexGPT 2	内部评估中约67%的回答质量优于初代。^[5]
2024年3月28日	YandexGPT 3 Pro	面向企业（Yandex Cloud）。在内部 Side-by-Side 评测中约67%的情况优于 YandexGPT 2，64%优于 ChatGPT-3.5。^[6]^[7]
2024年5月28日	YandexGPT 3 Lite	基于 YandexGPT 3 的轻量版（候选版本，RC）。6月24日成为默认模型。^[8]
2024年10月24日	YandexGPT 4 Pro / Lite	32,000 token 上下文；隐式推理（скрытые рассуждения，通过 chain-of-thought 数据训练）；响应速度较上一代平均提升2.5倍。^[9]
2025年2月25日	YandexGPT 5 Pro	大幅改进函数调用，支持结构化输出，上下文32k。同日开源发布 Lite 版的 pretrain 权重。^[10]^[8]
2025年3月31日	YandexGPT 5 Lite	在 AI Studio 以 RC 提供（32k 上下文，支持 OpenAI 工具）。在 Hugging Face 开源发布80亿参数的 pretrain 版与 instruct 版。^[11]^[8]
2025年8月28日	YandexGPT Pro 5.1	内部评估中分别以58%、56%优于 5 Pro 和 GPT-4.1；幻觉率约减半（32%→16%）；以 RC 提供；不支持推理模式；API 价格下调至原来的三分之一。^[8]^[12]
2025年9月24日	Yandex Cloud AI Studio	将“Yandex Foundation Models”升级为生成式 AI 与 AI 智能体平台“Yandex Cloud AI Studio”。^[8]
2025年10月	品牌重塑为 Alice AI	将面向消费者的产品整合进 Alice AI。^[13]
2025年11月25日	Alice AI LLM	在 AI Studio 基础实例向所有用户提供；擅长 RAG 与自由对话，面向 AI 智能体用途。^[8]

架构与训练

基本架构：针对俄语优化的 Transformer。
YandexGPT 5 Pro：通过组合公开模型的权重与 Yandex 自有的训练流程构建。据报道其基础采用了中国阿里巴巴的 Qwen-2.5，从而将实验周期最多缩短至原来的二十分之一。^[14]^[15]
YandexGPT 5 Lite：不使用任何其他模型的权重，从随机初始值开始训练。预训练分两个阶段：第一阶段使用以俄语和英语为主、共约15万亿 token 的文本（上下文长度至多8,000 token）；第二阶段“Powerup”使用约3,200亿 token 的高质量数据，并通过 NTK-aware scaling 将上下文扩展至32,000 token。^[14]

分词器（tokenizer）针对俄语进行了优化：对于俄语文本，YandexGPT 5 Pro 的32,000 token 相当于 Qwen-2.5-32B-base 约48,000 token。对齐（指令适配）由 SFT（监督微调）和 RLHF（基于人类反馈的强化学习）组成。^[14]

上下文与限制

模型上下文长度：YandexGPT 5／5.1／5 Lite 为32,000 token（32,768），Alice AI LLM 为64,000 token（65,536）。^[3]
在文本生成方面，AI Playground 中单次响应的最大 token 数限制为1,000；文本向量化的输入最多2,048 token。^[16]

现有模型（截至2026年6月）

模型	上下文	API	备注
Alice AI LLM	64,000	文本生成・OpenAI 兼容	AI Studio 当前的旗舰系列。^[3]
Alice AI LLM Flash	64,000	OpenAI 兼容	高速版。^[3]
YandexGPT Pro 5.1	32,000	文本生成・OpenAI 兼容	2025年8月以 RC 形式推出。^[3]
YandexGPT Pro 5	32,000	文本生成・OpenAI 兼容	第五代 Pro。^[3]
YandexGPT Lite 5	32,000	文本生成・OpenAI 兼容	轻量版。^[3]
Fine-tuned YandexGPT Lite	32,000	文本生成・OpenAI 兼容	微调版。^[3]

此外，80亿参数的 YandexGPT 5 Lite（pretrain 版与 instruct 版）已在 Hugging Face 开源发布。早期的 YaLM-100B（Apache 2.0）也作为开源模型公开，但不包含在 AI Studio 当前的产品线中。^[11]^[4]

Yandex Cloud AI Studio

面向企业和开发者，YandexGPT 通过 Yandex 的云端 AI 平台“Yandex Cloud AI Studio”（2025年9月由“Yandex Foundation Models”更名而来）提供。文本生成除了 OpenAI 兼容的 API（Completions、Responses API），还可通过专有的 REST、gRPC API、Yandex Cloud ML SDK 以及浏览器中的 AI Playground 使用。模型以 URI 指定（例如 gpt://<folder_ID>/yandexgpt-5.1），调用支持同步、异步、批处理三种模式。^[3]^[8]

在第五代中，函数调用（function calling）得到大幅改进，并支持结构化输出（structured output，可指定 JSON／schema）。平台此外还具备文本嵌入模型、向量与混合检索索引、参照知识库的 RAG、无代码构建 AI 智能体（Agent Atelier）、MCP Hub、运行 Python 代码的 Code Interpreter 等功能。除 YandexGPT 外，也可使用 Qwen3、DeepSeek、gpt-oss（OpenAI OSS）等开源模型。需要注意的是，旧版 AI Assistant API 已于2026年1月停止提供，目前推荐使用 Responses API 等。^[8]^[3]

基准测试

以下均为 Yandex 的内部评估（盲测的 side-by-side 并排比较），而非独立第三方评测。

据称，在内部 side-by-side 评测中，YandexGPT 5 Pro 在约67%的情况下优于 YandexGPT 4 Pro，并与 GPT-4o 相当；在约64%的标准任务上优于同等规模的 Qwen-2.5-32B-Instruct。^[10]
据称，在内部盲测并排比较中，YandexGPT 5.1 Pro 分别以58%、56%优于 YandexGPT 5 Pro 和 GPT-4.1，并将幻觉率从32%降至16%（约减半）。^[12]
在以众包方式评估俄语 LLM 的 ru-LLM Arena（llmarena.ru）上，各模型也接受了比较。^[17]

微调

YandexGPT 5 Lite 官方支持 LoRA，模型卡中公开了运行示例。AI Studio 中也提供基于 LoRA 的模型及分类器微调。^[11]^[8]

多模态能力

YandexGPT 本身主要作为文本生成模型提供。另一方面，自2025年起，Yandex Cloud AI Studio 与 Alice AI 中已集成多模态模型，包括视觉语言模型（VLM，2025年4月开始提供）、图像生成模型 YandexART 及 Alice AI ART、语音模型 Speech Realtime 等。^[8]^[3]

整合进 Alice AI

2025年10月，Yandex 将以 YandexGPT 为核心的、面向消费者的产品重塑为“Alice AI”（Алиса AI）品牌。聊天机器人、语音助手与 AI 智能体创建平台被整合到同一品牌之下，并新增了文档（PDF、DOC、DOCX、TXT）处理、使用摄像头的“实时模式”等功能。Alice AI 系列包括：文本模型 Alice AI LLM、视觉-文本模型 Alice AI VLM、图像生成模型 Alice AI ART（基于 YandexART）。^[13]

评价与局限

YandexGPT 在俄语文本创作与摘要方面表现出色，但也存在一些已被指出的局限。在代码生成方面，虽然在基准测试中能给出接近 GPT-4o 的数值，但据报道实际上常常生成无法运行的代码。在独立的比较评测中，它在全球主要模型中处于中下游，并且即便对于有充分文献记载的主题，也会以“缺乏最新数据”为由拒绝回答。此外，YandexGPT 5 Pro 以阿里巴巴的 Qwen-2.5 为基础这一点也受到关注。^[18]^[15]

外部链接

延伸阅读

Matkin, N. et al. (2024). Comparative Analysis of Encoder-Based NER and Large Language Models for Skill Extraction from Russian Job Vacancies. arXiv:2407.19816.
Tsanda, A.; Bruches, E. (2024). Russian-Language Multimodal Dataset for Automatic Summarization of Scientific Papers. arXiv:2405.07886.
Goloburda, M. et al. (2025). Qorǵau: Evaluating LLM Safety in Kazakh-Russian Bilingual Contexts. arXiv:2502.13640.
Togmanov, M. et al. (2025). KazMMLU: Evaluating Language Models on Kazakh, Russian, and Regional Knowledge of Kazakhstan. arXiv:2502.12829.
Noels, S. et al. (2025). What Large Language Models Do Not Talk About: An Empirical Study of Moderation and Censorship Practices. arXiv:2504.03803.

注释

↑ ^1.0 ^1.1 «“Яндекс” добавил в “Алису” аналог ChatGPT». РБК. [1]
↑ «Getting started with YandexGPT (Quickstart)». Yandex Cloud Docs. [2]
↑ ^3.00 ^3.01 ^3.02 ^3.03 ^3.04 ^3.05 ^3.06 ^3.07 ^3.08 ^3.09 ^3.10 «Common instance models». Yandex Cloud AI Studio Docs. [3]
↑ ^4.0 ^4.1 ^4.2 «yandex/YaLM‑100B: Pretrained language model with 100B». GitHub. [4]
↑ «Яндекс представил второе поколение нейросети YandexGPT». iPhones.ru. [5]
↑ «“Яндекс” представил третье поколение нейросетей YandexGPT». РБК. [6]
↑ «Третье поколение моделей YandexGPT». Yandex Cloud Blog. [7]
↑ ^8.00 ^8.01 ^8.02 ^8.03 ^8.04 ^8.05 ^8.06 ^8.07 ^8.08 ^8.09 «Yandex Cloud AI Studio release notes». Yandex Cloud AI Studio Docs. [8]
↑ «Более мощное семейство моделей YandexGPT 4». Habr. [9]
↑ ^10.0 ^10.1 «“Яндекс” внедрил YandexGPT 5 Pro в чат с “Алисой Про”». AdIndex. [10]
↑ ^11.0 ^11.1 ^11.2 «yandex/YandexGPT‑5‑Lite‑8B‑pretrain». Hugging Face. [11]
↑ ^12.0 ^12.1 «Нейросеть YandexGPT». Яндекс. [12]
↑ ^13.0 ^13.1 «YandexGPT: обзор, тарифы и как пользоваться в 2026 году». ai-journal.ru. [13]
↑ ^14.0 ^14.1 ^14.2 «Встречаем YandexGPT 5 — в Алисе, облаке и опенсорсе». Habr. [14]
↑ ^15.0 ^15.1 «Тестируем YandexGPT-5-Pro». Habr. [15]
↑ «Yandex Cloud AI Studio quotas and limits». Yandex Cloud AI Studio Docs. [16]
↑ «llmarena/llmarena — российская краудсорсинговая платформа оценки LLM». GitHub. [17]
↑ «YandexGPT in 2026: A Review of Russia's AI Platform for Business». mysummit.school. [18]

[rbc-may17-1] 1.0 ^1.1 «“Яндекс” добавил в “Алису” аналог ChatGPT». РБК. [1]

[cloud-api-2] «Getting started with YandexGPT (Quickstart)». Yandex Cloud Docs. [2]

[aistudio-models-3] 3.00 ^3.01 ^3.02 ^3.03 ^3.04 ^3.05 ^3.06 ^3.07 ^3.08 ^3.09 ^3.10 «Common instance models». Yandex Cloud AI Studio Docs. [3]

[github-yalm-4] 4.0 ^4.1 ^4.2 «yandex/YaLM‑100B: Pretrained language model with 100B». GitHub. [4]

[iphones-gpt2-5] «Яндекс представил второе поколение нейросети YandexGPT». iPhones.ru. [5]

[rbc-mar28-6] «“Яндекс” представил третье поколение нейросетей YandexGPT». РБК. [6]

[yacloud-3g-7] «Третье поколение моделей YandexGPT». Yandex Cloud Blog. [7]

[aistudio-relnotes-8] 8.00 ^8.01 ^8.02 ^8.03 ^8.04 ^8.05 ^8.06 ^8.07 ^8.08 ^8.09 «Yandex Cloud AI Studio release notes». Yandex Cloud AI Studio Docs. [8]

[habr-gpt4-9] «Более мощное семейство моделей YandexGPT 4». Habr. [9]

[adindex-5pro-10] 10.0 ^10.1 «“Яндекс” внедрил YandexGPT 5 Pro в чат с “Алисой Про”». AdIndex. [10]

[hf-5lite-11] 11.0 ^11.1 ^11.2 «yandex/YandexGPT‑5‑Lite‑8B‑pretrain». Hugging Face. [11]

[ya-gpt-12] 12.0 ^12.1 «Нейросеть YandexGPT». Яндекс. [12]

[ai-journal-13] 13.0 ^13.1 «YandexGPT: обзор, тарифы и как пользоваться в 2026 году». ai-journal.ru. [13]

[habr-gpt5-tech-14] 14.0 ^14.1 ^14.2 «Встречаем YandexGPT 5 — в Алисе, облаке и опенсорсе». Habr. [14]

[habr-bothub-test-15] 15.0 ^15.1 «Тестируем YandexGPT-5-Pro». Habr. [15]

[aistudio-limits-16] «Yandex Cloud AI Studio quotas and limits». Yandex Cloud AI Studio Docs. [16]

[llmarena-17] «llmarena/llmarena — российская краудсорсинговая платформа оценки LLM». GitHub. [17]

[mysummit-review-18] «YandexGPT in 2026: A Review of Russia's AI Platform for Business». mysummit.school. [18]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

YandexGPT (language model) — Yandex的大语言模型

Contents

发布历史

架构与训练

上下文与限制

现有模型（截至2026年6月）

Yandex Cloud AI Studio

基准测试

微调

多模态能力

整合进 Alice AI

评价与局限

外部链接

延伸阅读

注释

Navigation menu

YandexGPT (language model) — Yandex的大语言模型

发布历史

架构与训练

上下文与限制

现有模型（截至2026年6月）

Yandex Cloud AI Studio

基准测试

微调

多模态能力

整合进 Alice AI

评价与局限

外部链接

延伸阅读

注释

Navigation menu

Search