Grok
Grok — это семейство мультимодальных больших языковых моделей (LLM) и чат-бот, разработанный компанией xAI, основанной Илоном Маском. Grok позиционируется как «фронтир-модель», стремящаяся к «пониманию истинной природы Вселенной» и созданию альтернативы существующим ИИ-системам, которые, по мнению Маска, являются «слишком политкорректными»[1][2].
Ключевыми особенностями Grok являются его глубокая интеграция с социальной сетью X для получения информации в реальном времени, а также заявленный «бунтарский» характер ответов с элементами юмора и сарказма, что отличает его от более осторожных конкурентов[3]. Технологическая основа Grok включает архитектуру Mixture-of-Experts (MoE) для первой версии и обучение на одном из крупнейших в мире суперкомпьютеров — Colossus — для последующих.
История и развитие
Развитие семейства Grok характеризуется чрезвычайно быстрыми темпами — от прототипа до флагманской модели, конкурирующей с лидерами рынка, прошло менее двух лет.
- Июль-октябрь 2023: Основание xAI и ускоренная разработка прототипа. По словам Маска, на обучение первой версии ушло всего два месяца[4].
- Ноябрь 2023: Ранний бета-релиз Grok-1. Доступ получили подписчики высшего уровня X Premium+. Модель позиционировалась как «очень ранний продукт» с нестандартным стилем ответов[5].
- Март 2024: xAI публикует исходный код и веса Grok-1 под лицензией Apache 2.0, делая её крупнейшей на тот момент открытой LLM с 314 млрд параметров[6]. В конце месяца анонсирована Grok-1.5 с улучшенным рассуждением и контекстным окном, увеличенным до 128 000 токенов[7].
- Апрель 2024: Представлена первая мультимодальная версия — Grok-1.5 Vision, способная анализировать изображения и документы. Модель продемонстрировала превосходство над GPT-4V в бенчмарке RealWorldQA, но не была выпущена публично[8].
- Август 2024: Релиз Grok-2 и его облегчённой версии Grok-2 mini. Главным нововведением стала генерация изображений с помощью модели FLUX.1. Пользователи отметили, что Grok-2 генерирует изображения с меньшими ограничениями, чем конкуренты (например, может рисовать реальных политиков)[9][10].
- Осень 2024: Grok-2 получает серию обновлений: понимание изображений (октябрь), веб-поиск (ноябрь) и анализ PDF-файлов (ноябрь). В декабре xAI внедряет собственную модель генерации изображений Aurora[8]. Доступ к боту становится частично бесплатным для всех пользователей X[11].
- Февраль 2025: Релиз флагманской модели Grok-3. Обученная на суперкомпьютере Colossus, она, по заявлениям xAI, превзошла GPT-4 на ряде сложных тестов (например, AIME 2025). Появились уникальные режимы, такие как “Think” (углублённое рассуждение) и DeepSearch (расширенный веб-поиск)[12].
- Весна 2025: xAI расширяет доступность Grok-3, открывая API для разработчиков и анонсируя интеграцию в облачную платформу Microsoft Azure и мессенджер Telegram[13][14].
Технические особенности и архитектура
Архитектура и параметры
Первая версия, Grok-1, была построена на архитектуре Mixture-of-Experts (MoE) с общим размером 314 млрд параметров. Модель состоит из 8 экспертов, из которых 2 активируются для каждого токена, что делает её вычислительно эффективной для своего масштаба[15]. Максимальный контекст исходной модели составлял 8192 токена.
Последующие версии, Grok-1.5 и Grok-3, значительно эволюционировали. Контекстное окно было увеличено до 128 000 токенов в Grok-1.5 и до 1 миллиона токенов в Grok-3, что является одним из самых больших показателей в индустрии[16]. Точное число параметров для Grok-3 не раскрывается, но, по некоторым оценкам, может достигать 2.7 трлн[17].
Мультимодальность и рассуждение
Начиная с Grok-1.5V, модели стали мультимодальными. Grok-3 поддерживает полный цикл визуального взаимодействия: понимание изображений, их редактирование по текстовому описанию и генерацию новых.
Особое внимание xAI уделяет улучшению reasoning (логических выводов). В Grok-2 были внедрены механизмы для самостоятельного поиска недостающей информации. В Grok-3 этот подход был развит в режим “Think” (также Big Brain Mode). При его активации модель задействует дополнительные вычисления, генерирует несколько вариантов решения, использует более длинные цепочки рассуждений (Chain-of-Thought) и проверяет себя на противоречия. Это позволяет пользователю выбирать между быстрым ответом и более точным, но медленным[18].
Обучение и данные
Grok обучается на комбинации общедоступных данных (интернет, код, литература) и уникальных данных из экосистемы Илона Маска. Ключевым компонентом является непрерывный поток данных из X (Twitter), что обеспечивает модели актуальность и осведомлённость о текущих событиях. Также в датасеты включаются юридические и научные тексты[8]. Такой подход, с одной стороны, даёт Grok преимущество, а с другой — вызывает вопросы у регуляторов по поводу приватности пользовательских данных[19].
Сравнение с конкурентами
| Характеристика | Grok (xAI) | GPT (OpenAI) | Claude (Anthropic) | Gemini (Google) |
|---|---|---|---|---|
| Ключевое преимущество | Интеграция с X, актуальность, «бунтарский» стиль | Высокое качество и стабильность ответов, развитая экосистема | Безопасность, большой контекст, этический фокус | Интеграция с экосистемой Google, мультимодальность |
| Макс. контекст | 1 000 000 токенов (Grok-3) | 128 000 токенов (GPT-4o) | 200 000+ токенов (Claude 3) | 2 000 000 токенов (Gemini 2.0 Pro) |
| Генерация изображений | Да (встроено, модель Aurora) | Да (через DALL·E 3) | Нет | Да (модель Imagen) |
| Лицензия | Смешанная (Grok-1 открыт, новые версии — проприетарные) | Проприетарная | Проприетарная | Проприетарная |
| Доступ к реальному времени | Да (нативно через X и веб-поиск) | Да (через плагины/веб-браузинг) | Нет (базово) | Да (нативно через поиск Google) |
Интеграции и экосистема
Стратегия xAI заключается в том, чтобы сделать Grok вездесущим ИИ-ассистентом.
- Платформа X: Основная площадка, где Grok используется для ответов на вопросы, суммирования новостей и модерации контента.
- Telegram: В 2025 году анонсирована полная интеграция Grok в мессенджер, что даст доступ к ИИ более чем миллиарду пользователей. Сделка оценивается в $300 млн плюс 50% от прибыли[20].
- Tesla: Планируется интеграция Grok в качестве “Smart Voice Assistant” во все автомобили Tesla. Ассистент будет иметь доступ к системам машины и сможет выполнять сложные команды, понимать естественную речь и предоставлять информацию из интернета[21].
- API и партнёрства: Grok-3 доступен через API для разработчиков и интегрирован в популярные dev-инструменты (Vercel, Cursor) и платформы автоматизации (Zapier, Albato)[22].
Хронология релизов (таблица)
| Модель | Дата релиза | Параметры модели | Ключевые особенности | Доступность и лицензия |
|---|---|---|---|---|
| Grok-1 | 3 нояб. 2023 г. (открыт 17 мар. 2024 г.) |
314 млрд (MoE) | Первая версия, архитектура MoE, контекст 8k токенов. | Ранний доступ для X Premium+. Позже открыт под Apache 2.0. |
| Grok-1.5 | Анонс: 29 мар. 2024 г. (доступ с 15 мая 2024 г.) |
~314 млрд | Улучшенное рассуждение, контекст 128 000 токенов, высокие баллы на GSM8K (90%). | Проприетарная. Доступ для подписчиков X Premium. |
| Grok-1.5 Vision | Анонс: 12 апр. 2024 г. | ~314 млрд + визуальный модуль | Первая мультимодальная версия, понимание изображений и диаграмм. | Публично не запущена. Наработки использованы в Grok-2. |
| Grok-2 | 14 авг. 2024 г. | Не раскрыто | Улучшенный чат и кодинг, генерация изображений (через Flux.1, затем Aurora), улучшенная мультимодальность. | Проприетарная. Доступ для X Premium+, позже частично бесплатный. |
| Grok-3 | 17 фев. 2025 г. | ~2.7 трлн (оценка) | Флагманская модель, контекст 1 млн токенов, режимы “Think” и “DeepSearch”, функция редактирования изображений. | Проприетарная. Доступ через X Premium+, SuperGrok и API. |
Литература
- Shazeer, N. et al. (2017). Outrageously Large Neural Networks: The Sparsely‑Gated Mixture‑of‑Experts Layer. arXiv:1701.06538.
- Lepikhin, D. et al. (2020). GShard: Scaling Giant Models with Conditional Computation and Automatic Sharding. arXiv:2006.16668.
- Fedus, W. et al. (2021). Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity. arXiv:2101.03961.
- Wei, J. et al. (2022). Chain‑of‑Thought Prompting Elicits Reasoning in Large Language Models. arXiv:2201.11903.
- Ding, J. et al. (2023). LongNet: Scaling Transformers to 1,000,000,000 Tokens. arXiv:2307.02486.
- Dao, T. (2023). FlashAttention‑2: Faster Attention with Better Parallelism and Work Partitioning. arXiv:2307.08691.
- Li, K. et al. (2024). MME‑RealWorld: Could Your Multimodal LLM Challenge High‑Fidelity Real‑World Data?. arXiv:2408.13257.
- Batifol, S. et al. (2025). FLUX.1 Kontext: Flow Matching for In‑Context Image Generation and Editing in Latent Space. arXiv:2506.15742.
- Tran, P. et al. (2025). Search Arena: Analyzing Search‑Augmented Large Language Models. arXiv:2506.05334.
- Suzuki, T.; Ozawa, K. (2025). Resampling Benchmark for Efficient Comprehensive Evaluation of Large Vision‑Language Models. arXiv:2504.09979.
Примечания
- ↑ «What is Elon Musk's Grok 3?». LinkedIn. [1]
- ↑ «"Grok, это правда?": насколько можно доверять чат-ботам с ИИ». Deutsche Welle. [2]
- ↑ «Grok, an AI chatbot from Elon Musk’s xAI, is coming to X». TechCrunch. [3]
- ↑ «Маск признался, что на тренировку нейросети Grok ушло два месяца». РБК. [4]
- ↑ «Grok (chatbot)». Wikipedia. [5]
- ↑ «Grok open release». GitHub. [6]
- ↑ «xAI анонсировала ИИ-модель Grok-1.5». Habr. [7]
- ↑ 8,0 8,1 8,2 «Grok (чат-бот)». Википедия. [8]
- ↑ «xAI releases Grok-2, adds image generation on X». TechCrunch. [9]
- ↑ «Grok-2's image generator has no content rules, for now». Mashable. [10]
- ↑ «Grok-3: Everything you need to know about this new LLM by xAI». Daily.dev. [11]
- ↑ «Grok-3 Release». xAI News. [12]
- ↑ «Grok 3, xAI's latest model, is now available on the API». xAI Blog. [13]
- ↑ «Дуров и Маск договорились о полной интеграции Grok в Telegram». РБК. [14]
- ↑ «GitHub - xai-org/grok-1: Grok open release». GitHub. [15]
- ↑ «Grok-3». xAI. [16]
- ↑ «Visual Reasoning Evaluation of Grok, Deepseek's Janus, Gemini, Qwen, Mistral, and ChatGPT». arXiv. [17]
- ↑ «Grok-3 Functions». xAI Blog. [18]
- ↑ «Irish DPC probes X and xAI over Grok training data». TechCrunch. [19]
- ↑ «Telegram и xAI Илона Маска заключили стратегическое партнерство». Sostav.ru. [20]
- ↑ «All Tesla Vehicles to Receive Grok Smart Voice Assistant According to Musk». Not a Tesla App. [21]
- ↑ «Grok by xAI Integrations». Zapier. [22]