Claude
Claude — это семейство мультимодальных больших языковых моделей (LLM), разработанных исследовательской компанией Anthropic.
Модели Claude, построенные на архитектуре трансформеров, позиционируются как AI-ассистенты, ориентированные на безопасность, полезность и честность. Ключевой особенностью их разработки является методика Constitutional AI («Конституционный ИИ»), направленная на создание управляемых и этически согласованных систем.
История и философия
Основание и миссия Anthropic
Компания Anthropic была основана в 2021 году бывшими старшими сотрудниками OpenAI, включая брата и сестру Дарио[1] и Даниэлу Амодеи[2]. Причиной ухода стали разногласия с руководством OpenAI относительно направления развития, в частности, из-за опасений, что партнёрство с Microsoft и растущая коммерциализация могут поставить под угрозу приверженность безопасности ИИ.
Миссия Anthropic — «разработка и поддержка передового ИИ для долгосрочной пользы человечества». Компания зарегистрирована как Public Benefit Corporation (PBC) в США, что юридически обязывает её уравновешивать финансовые интересы с общественной пользой. Этот подход подкреплён уникальной структурой управления с Long-Term Benefit Trust (LTBT), независимым органом, который имеет право влиять на состав совета директоров для обеспечения приверженности миссии безопасности.
Философия: HHH и Конституционный ИИ
В основе поведения моделей Claude лежит формула HHH: Helpful, Honest, and Harmless (Полезный, Честный и Безвредный). Для реализации этих принципов Anthropic разработала собственную методику обучения — Constitutional AI (CAI).
В отличие от традиционного RLHF (обучение с подкреплением на основе отзывов людей), где люди-аннотаторы напрямую оценивают ответы модели, CAI использует «конституцию» — набор явных этических принципов, на основе которых модель обучается самостоятельно оценивать и корректировать свои ответы. Это делает процесс более масштабируемым, прозрачным и контролируемым.
Архитектура и ключевые технологии
Основа на Трансформере
Как и другие современные LLM, Claude использует архитектуру трансформера-декодера, которая авторегрессионно генерирует текст токен за токеном. Однако Anthropic внесла значительные усовершенствования, направленные на повышение производительности, безопасности и управляемости.
Конституционный ИИ (CAI)
Процесс обучения с CAI проходит в два этапа:
- Фаза обучения с учителем (Supervised Learning): Модель генерирует ответы на запросы, а затем другая модель-критик, руководствуясь «конституцией», оценивает их и предлагает исправления. На основе этих исправлений исходная модель дообучается.
- Фаза обучения с подкреплением от ИИ (RLAIF): Модель генерирует пары ответов, а модель-критик выбирает лучший из них на основе «конституции». Эти данные используются для обучения модели предпочтений (reward model), которая затем служит сигналом для дообучения основной модели с помощью алгоритмов подкрепления.
Длинный контекст и мультимодальность
Одним из главных преимуществ Claude является очень большое контекстное окно. Начиная со 100 тыс. токенов в Claude 2, оно было увеличено до 200 тыс. в Claude 3 и до 1-2 млн токенов в версиях 3.5 и 4. Это позволяет моделям анализировать целые книги, кодовые базы или многочасовые транскрипты внутри одного запроса.
Начиная с семейства Claude 3, модели стали мультимодальными, получив способность обрабатывать изображения наряду с текстом.
Гибридное мышление и агентные возможности
С версий Claude 3.7 и 4 была внедрена архитектура гибридного мышления. Она позволяет моделям переключаться между двумя режимами:
- Быстрые ответы: Стандартный режим для простых задач.
- Расширенное мышление (Extended Thinking): Для сложных задач модель делает паузу, чтобы «подумать», выполняя внутренние шаги рассуждений, вызывая инструменты (веб-поиск, выполнение кода) и формируя более обоснованный ответ. Это делает процесс более прозрачным и надёжным.
Эволюция моделей Claude
Claude 1 (2023)
- Claude (14 марта 2023): первая публично представленная версия модели. Одновременно были объявлены две конфигурации — Claude (основная) и Claude Instant (более быстрая и дешёвая).[3]
- 100K Context Window (11 мая 2023): расширение контекстного окна Claude с 9 000 до 100 000 токенов. Это был отдельный апдейт после первоначального запуска, а не часть мартовского релиза.[4]
Claude 2 (2023)
- Claude 2 (11 июля 2023): крупное обновление с улучшениями в кодировании, математике и рассуждении. Модель стала доступна через API и публичную beta-версию claude.ai. Поддерживала ввод до 100 000 токенов; в тесте Codex HumanEval Anthropic указывала результат 71,2 %.[5]
- Claude 2.1 (21 ноября 2023): версия с контекстным окном 200 000 токенов, сниженной склонностью к галлюцинациям, поддержкой system prompts и бета-функцией tool use.[6]
Claude 3 (2024)
- Claude 3 (4 марта 2024): новое семейство моделей, включавшее Haiku (самая быстрая), Sonnet (сбалансированная) и Opus (самая мощная). Anthropic позиционировала это поколение как новый рубеж по ряду когнитивных бенчмарков.[7]
- Ключевые изменения: сильные визуальные и мультимодальные возможности (анализ изображений, графиков и диаграмм), заметное снижение необоснованных отказов, рост точности, а также 200 000 токенов контекста на старте. Для отдельных клиентов Anthropic также указывала возможность работы с входами свыше 1 млн токенов.[8]
Claude 3.5 (2024)
- Claude 3.5 Sonnet (21 июня 2024): первая модель семейства 3.5. По заявлению Anthropic, она превосходила Claude 3 Opus на широком наборе оценок, сохраняя скорость и стоимость среднего класса; компания также отдельно отмечала примерно двукратный прирост скорости. Контекстное окно составляло 200 000 токенов.[9]
- Обновлённый Claude 3.5 Sonnet и Claude 3.5 Haiku (22 октября 2024): октябрьское обновление усилило возможности в агентном кодинге и использовании инструментов. Тогда же Anthropic впервые вывела в public beta функцию Computer Use, позволяющую модели работать с интерфейсом компьютера: видеть экран, двигать курсор, нажимать кнопки и вводить текст. У обновлённого 3.5 Sonnet результат на SWE-bench Verified вырос с 33,4 % до 49,0 %.[10]
Claude 3.7 и Claude 4 (2025)
- Claude 3.7 Sonnet (24 февраля 2025): Anthropic представила его как первую hybrid reasoning model. Модель могла либо отвечать почти мгновенно, либо использовать режим более длительного, пошагового рассуждения. Одновременно был представлен Claude Code.[11]
- Claude 4 (22 мая 2025): новое флагманское семейство, включавшее Opus 4 и Sonnet 4. Обе модели описывались как гибридные: с режимами быстрых ответов и extended thinking. Anthropic отдельно подчёркивала extended thinking with tool use, parallel tool execution и улучшения памяти; Opus 4 был заявлен лидером на SWE-bench с результатом 72,5 %.[12]
Claude 4.5–4.6 (конец 2025 — начало 2026)
- Claude Sonnet 4.5 (29 сентября 2025): существенное обновление линии Sonnet с заметным ростом качества в кодировании, computer use, рассуждении и математике. Anthropic также отмечала, что модель удерживает фокус на сложных многошаговых задачах более 30 часов.[13]
- Claude Opus 4.5 (24 ноября 2025): следующая итерация Opus, которую Anthropic описывала как особенно сильную в кодировании, агентных сценариях и computer use.[14]
- Claude Opus 4.6 (5 февраля 2026): обновлённая Opus-модель с улучшениями в кодировании, code review, debugging и длительных агентных задачах. Впервые для Opus-линейки был заявлен 1M token context window в бета-режиме.[15]
- Claude Sonnet 4.6 (17 февраля 2026): наиболее мощная версия Sonnet на тот момент; Anthropic указывала улучшения в кодировании, computer use, long-context reasoning, agent planning, knowledge work и design. Как и Opus 4.6, модель получила 1M token context window в beta.[16]
Сводная таблица поколений Claude
| Поколение | Год выпуска | Ключевые версии | Макс. контекстное окно | Ключевые инновации |
|---|---|---|---|---|
| Claude 1 | 2023 | Claude, Instant | 100 000 токенов | Первый публичный релиз, большой контекст. |
| Claude 2 | 2023 | Claude 2, 2.1 | 200 000 токенов | Улучшенное кодирование и рассуждения, общедоступность. |
| Claude 3 | 2024 | Opus, Sonnet, Haiku | 200 000+ токенов | Мультимодальность (изображения), превосходство над GPT-4. |
| Claude 3.5 | 2024 | Sonnet, Haiku | 200 000+ токенов | Повышение скорости и интеллекта, функция "Artifacts". |
| Claude 4 / 3.7 | 2025 | Opus, Sonnet | 200 000+ токенов | Гибридное мышление, агентные возможности, использование инструментов. |
Применение и доступность
Модели Claude доступны через несколько каналов:
- Веб-интерфейс claude.ai: Предоставляет бесплатный доступ (к модели Sonnet) и платные подписки (Pro, Max) с доступом к более мощным моделям (Opus) и расширенными лимитами.
- API для разработчиков: Anthropic предоставляет коммерческий API, позволяющий интегрировать Claude в сторонние приложения. Цены варьируются в зависимости от модели (Haiku — самая дешёвая, Opus — самая дорогая).
- Облачные платформы: Claude доступен через Amazon Bedrock и Google Cloud Vertex AI, что упрощает его использование в корпоративной среде.
- Интеграции: Claude интегрирован в популярные сервисы, такие как Slack, Notion, Quora (в чат-боте Poe).
Литература
- Anthropic (2022). Constitutional AI: Harmlessness from AI Feedback. arXiv:2212.08073.
- Anthropic (2023). Claude’s Constitution.
- Anthropic (2024, март). Introducing the next generation of Claude.
- Anthropic (2025, май). Introducing Claude 4.
Ссылки
Литература
- Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. arXiv:2203.02155.
- Bai, Y. et al. (2022). Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback. arXiv:2204.05862.
- Bai, Y. et al. (2022). Constitutional AI: Harmlessness from AI Feedback. arXiv:2212.08073.
- Bulatov, A. et al. (2023). Scaling Transformer to 1M Tokens and Beyond with RMT. arXiv:2304.11062.
- Jimenez, C. E. et al. (2023). SWE-bench: Can Language Models Resolve Real-World GitHub Issues?. arXiv:2310.06770.
- Yuan, W. et al. (2024). Self-Rewarding Language Models. arXiv:2401.10020.
- Yang, A. et al. (2024). Context Parallelism for Scalable Million-Token Inference. arXiv:2411.01783.
- Miranda, L. J. V. et al. (2024). Hybrid Preferences: Learning to Route Instances for Human vs AI Feedback. arXiv:2410.19133.
- Chittepu, Y. et al. (2025). Reinforcement Learning from Human Feedback with High-Confidence Safety Constraints. arXiv:2506.08266.
- Yuan, W. et al. (2025). Process-based Self-Rewarding Language Models. arXiv:2503.03746.
- Yang, B. et al. (2025). Long Context Windows in Generative AI: An AI Atlas Report. [3] (tech-report, open review).
Примечания
- ↑ «Dario Amodei». В Wikipedia [1]
- ↑ «Daniela Amodei». В Wikipedia [2]
- ↑ Introducing Claude. Anthropic. 14 марта 2023.
- ↑ Introducing 100K Context Windows. Anthropic. 11 мая 2023.
- ↑ Introducing Claude 2. Anthropic. 11 июля 2023.
- ↑ Introducing Claude 2.1. Anthropic. 21 ноября 2023.
- ↑ The Claude 3 model family: Opus, Sonnet, Haiku. Anthropic. 4 марта 2024.
- ↑ The Claude 3 model family: Opus, Sonnet, Haiku. Anthropic. 4 марта 2024.
- ↑ Introducing Claude 3.5 Sonnet. Anthropic. 21 июня 2024.
- ↑ New Claude 3.5 Sonnet and Claude 3.5 Haiku, plus desktop automation. Anthropic. 22 октября 2024.
- ↑ Claude 3.7 Sonnet and Claude Code. Anthropic. 24 февраля 2025.
- ↑ Introducing Claude 4. Anthropic. 22 мая 2025.
- ↑ Introducing Claude Sonnet 4.5. Anthropic. 29 сентября 2025.
- ↑ Introducing Claude Opus 4.5. Anthropic. 24 ноября 2025.
- ↑ Introducing Claude Opus 4.6. Anthropic. 5 февраля 2026.
- ↑ Introducing Claude Sonnet 4.6. Anthropic. 17 февраля 2026.