Claude

Материал из Systems analysis wiki
Перейти к навигации Перейти к поиску

Claude — это семейство мультимодальных больших языковых моделей (LLM), разработанных исследовательской компанией Anthropic.

Модели Claude, построенные на архитектуре трансформеров, позиционируются как AI-ассистенты, ориентированные на безопасность, полезность и честность. Ключевой особенностью их разработки является методика Constitutional AI («Конституционный ИИ»), направленная на создание управляемых и этически согласованных систем.

История и философия

Основание и миссия Anthropic

Компания Anthropic была основана в 2021 году бывшими старшими сотрудниками OpenAI, включая брата и сестру Дарио[1] и Даниэлу Амодеи[2]. Причиной ухода стали разногласия с руководством OpenAI относительно направления развития, в частности, из-за опасений, что партнёрство с Microsoft и растущая коммерциализация могут поставить под угрозу приверженность безопасности ИИ.

Миссия Anthropic — «разработка и поддержка передового ИИ для долгосрочной пользы человечества». Компания зарегистрирована как Public Benefit Corporation (PBC) в США, что юридически обязывает её уравновешивать финансовые интересы с общественной пользой. Этот подход подкреплён уникальной структурой управления с Long-Term Benefit Trust (LTBT), независимым органом, который имеет право влиять на состав совета директоров для обеспечения приверженности миссии безопасности.

Философия: HHH и Конституционный ИИ

В основе поведения моделей Claude лежит формула HHH: Helpful, Honest, and Harmless (Полезный, Честный и Безвредный). Для реализации этих принципов Anthropic разработала собственную методику обучения — Constitutional AI (CAI).

В отличие от традиционного RLHF (обучение с подкреплением на основе отзывов людей), где люди-аннотаторы напрямую оценивают ответы модели, CAI использует «конституцию» — набор явных этических принципов, на основе которых модель обучается самостоятельно оценивать и корректировать свои ответы. Это делает процесс более масштабируемым, прозрачным и контролируемым.

Архитектура и ключевые технологии

Основа на Трансформере

Как и другие современные LLM, Claude использует архитектуру трансформера-декодера, которая авторегрессионно генерирует текст токен за токеном. Однако Anthropic внесла значительные усовершенствования, направленные на повышение производительности, безопасности и управляемости.

Конституционный ИИ (CAI)

Процесс обучения с CAI проходит в два этапа:

  1. Фаза обучения с учителем (Supervised Learning): Модель генерирует ответы на запросы, а затем другая модель-критик, руководствуясь «конституцией», оценивает их и предлагает исправления. На основе этих исправлений исходная модель дообучается.
  2. Фаза обучения с подкреплением от ИИ (RLAIF): Модель генерирует пары ответов, а модель-критик выбирает лучший из них на основе «конституции». Эти данные используются для обучения модели предпочтений (reward model), которая затем служит сигналом для дообучения основной модели с помощью алгоритмов подкрепления.

Длинный контекст и мультимодальность

Одним из главных преимуществ Claude является очень большое контекстное окно. Начиная со 100 тыс. токенов в Claude 2, оно было увеличено до 200 тыс. в Claude 3 и до 1-2 млн токенов в версиях 3.5 и 4. Это позволяет моделям анализировать целые книги, кодовые базы или многочасовые транскрипты внутри одного запроса.

Начиная с семейства Claude 3, модели стали мультимодальными, получив способность обрабатывать изображения наряду с текстом.

Гибридное мышление и агентные возможности

С версий Claude 3.7 и 4 была внедрена архитектура гибридного мышления. Она позволяет моделям переключаться между двумя режимами:

  • Быстрые ответы: Стандартный режим для простых задач.
  • Расширенное мышление (Extended Thinking): Для сложных задач модель делает паузу, чтобы «подумать», выполняя внутренние шаги рассуждений, вызывая инструменты (веб-поиск, выполнение кода) и формируя более обоснованный ответ. Это делает процесс более прозрачным и надёжным.

Эволюция моделей Claude

Claude 1 (2023)

  • Claude (14 марта 2023): первая публично представленная версия модели. Одновременно были объявлены две конфигурации — Claude (основная) и Claude Instant (более быстрая и дешёвая).[3]
  • 100K Context Window (11 мая 2023): расширение контекстного окна Claude с 9 000 до 100 000 токенов. Это был отдельный апдейт после первоначального запуска, а не часть мартовского релиза.[4]

Claude 2 (2023)

  • Claude 2 (11 июля 2023): крупное обновление с улучшениями в кодировании, математике и рассуждении. Модель стала доступна через API и публичную beta-версию claude.ai. Поддерживала ввод до 100 000 токенов; в тесте Codex HumanEval Anthropic указывала результат 71,2 %.[5]
  • Claude 2.1 (21 ноября 2023): версия с контекстным окном 200 000 токенов, сниженной склонностью к галлюцинациям, поддержкой system prompts и бета-функцией tool use.[6]

Claude 3 (2024)

  • Claude 3 (4 марта 2024): новое семейство моделей, включавшее Haiku (самая быстрая), Sonnet (сбалансированная) и Opus (самая мощная). Anthropic позиционировала это поколение как новый рубеж по ряду когнитивных бенчмарков.[7]
  • Ключевые изменения: сильные визуальные и мультимодальные возможности (анализ изображений, графиков и диаграмм), заметное снижение необоснованных отказов, рост точности, а также 200 000 токенов контекста на старте. Для отдельных клиентов Anthropic также указывала возможность работы с входами свыше 1 млн токенов.[8]

Claude 3.5 (2024)

  • Claude 3.5 Sonnet (21 июня 2024): первая модель семейства 3.5. По заявлению Anthropic, она превосходила Claude 3 Opus на широком наборе оценок, сохраняя скорость и стоимость среднего класса; компания также отдельно отмечала примерно двукратный прирост скорости. Контекстное окно составляло 200 000 токенов.[9]
  • Обновлённый Claude 3.5 Sonnet и Claude 3.5 Haiku (22 октября 2024): октябрьское обновление усилило возможности в агентном кодинге и использовании инструментов. Тогда же Anthropic впервые вывела в public beta функцию Computer Use, позволяющую модели работать с интерфейсом компьютера: видеть экран, двигать курсор, нажимать кнопки и вводить текст. У обновлённого 3.5 Sonnet результат на SWE-bench Verified вырос с 33,4 % до 49,0 %.[10]

Claude 3.7 и Claude 4 (2025)

  • Claude 3.7 Sonnet (24 февраля 2025): Anthropic представила его как первую hybrid reasoning model. Модель могла либо отвечать почти мгновенно, либо использовать режим более длительного, пошагового рассуждения. Одновременно был представлен Claude Code.[11]
  • Claude 4 (22 мая 2025): новое флагманское семейство, включавшее Opus 4 и Sonnet 4. Обе модели описывались как гибридные: с режимами быстрых ответов и extended thinking. Anthropic отдельно подчёркивала extended thinking with tool use, parallel tool execution и улучшения памяти; Opus 4 был заявлен лидером на SWE-bench с результатом 72,5 %.[12]

Claude 4.5–4.6 (конец 2025 — начало 2026)

  • Claude Sonnet 4.5 (29 сентября 2025): существенное обновление линии Sonnet с заметным ростом качества в кодировании, computer use, рассуждении и математике. Anthropic также отмечала, что модель удерживает фокус на сложных многошаговых задачах более 30 часов.[13]
  • Claude Opus 4.5 (24 ноября 2025): следующая итерация Opus, которую Anthropic описывала как особенно сильную в кодировании, агентных сценариях и computer use.[14]
  • Claude Opus 4.6 (5 февраля 2026): обновлённая Opus-модель с улучшениями в кодировании, code review, debugging и длительных агентных задачах. Впервые для Opus-линейки был заявлен 1M token context window в бета-режиме.[15]
  • Claude Sonnet 4.6 (17 февраля 2026): наиболее мощная версия Sonnet на тот момент; Anthropic указывала улучшения в кодировании, computer use, long-context reasoning, agent planning, knowledge work и design. Как и Opus 4.6, модель получила 1M token context window в beta.[16]

Сводная таблица поколений Claude

Эволюция ключевых характеристик моделей Claude
Поколение Год выпуска Ключевые версии Макс. контекстное окно Ключевые инновации
Claude 1 2023 Claude, Instant 100 000 токенов Первый публичный релиз, большой контекст.
Claude 2 2023 Claude 2, 2.1 200 000 токенов Улучшенное кодирование и рассуждения, общедоступность.
Claude 3 2024 Opus, Sonnet, Haiku 200 000+ токенов Мультимодальность (изображения), превосходство над GPT-4.
Claude 3.5 2024 Sonnet, Haiku 200 000+ токенов Повышение скорости и интеллекта, функция "Artifacts".
Claude 4 / 3.7 2025 Opus, Sonnet 200 000+ токенов Гибридное мышление, агентные возможности, использование инструментов.

Применение и доступность

Модели Claude доступны через несколько каналов:

  • Веб-интерфейс claude.ai: Предоставляет бесплатный доступ (к модели Sonnet) и платные подписки (Pro, Max) с доступом к более мощным моделям (Opus) и расширенными лимитами.
  • API для разработчиков: Anthropic предоставляет коммерческий API, позволяющий интегрировать Claude в сторонние приложения. Цены варьируются в зависимости от модели (Haiku — самая дешёвая, Opus — самая дорогая).
  • Облачные платформы: Claude доступен через Amazon Bedrock и Google Cloud Vertex AI, что упрощает его использование в корпоративной среде.
  • Интеграции: Claude интегрирован в популярные сервисы, такие как Slack, Notion, Quora (в чат-боте Poe).

Литература

Ссылки

Литература

  • Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. arXiv:2203.02155.
  • Bai, Y. et al. (2022). Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback. arXiv:2204.05862.
  • Bai, Y. et al. (2022). Constitutional AI: Harmlessness from AI Feedback. arXiv:2212.08073.
  • Bulatov, A. et al. (2023). Scaling Transformer to 1M Tokens and Beyond with RMT. arXiv:2304.11062.
  • Jimenez, C. E. et al. (2023). SWE-bench: Can Language Models Resolve Real-World GitHub Issues?. arXiv:2310.06770.
  • Yuan, W. et al. (2024). Self-Rewarding Language Models. arXiv:2401.10020.
  • Yang, A. et al. (2024). Context Parallelism for Scalable Million-Token Inference. arXiv:2411.01783.
  • Miranda, L. J. V. et al. (2024). Hybrid Preferences: Learning to Route Instances for Human vs AI Feedback. arXiv:2410.19133.
  • Chittepu, Y. et al. (2025). Reinforcement Learning from Human Feedback with High-Confidence Safety Constraints. arXiv:2506.08266.
  • Yuan, W. et al. (2025). Process-based Self-Rewarding Language Models. arXiv:2503.03746.
  • Yang, B. et al. (2025). Long Context Windows in Generative AI: An AI Atlas Report. [3] (tech-report, open review).

Примечания

  1. «Dario Amodei». В Wikipedia [1]
  2. «Daniela Amodei». В Wikipedia [2]
  3. Introducing Claude. Anthropic. 14 марта 2023.
  4. Introducing 100K Context Windows. Anthropic. 11 мая 2023.
  5. Introducing Claude 2. Anthropic. 11 июля 2023.
  6. Introducing Claude 2.1. Anthropic. 21 ноября 2023.
  7. The Claude 3 model family: Opus, Sonnet, Haiku. Anthropic. 4 марта 2024.
  8. The Claude 3 model family: Opus, Sonnet, Haiku. Anthropic. 4 марта 2024.
  9. Introducing Claude 3.5 Sonnet. Anthropic. 21 июня 2024.
  10. New Claude 3.5 Sonnet and Claude 3.5 Haiku, plus desktop automation. Anthropic. 22 октября 2024.
  11. Claude 3.7 Sonnet and Claude Code. Anthropic. 24 февраля 2025.
  12. Introducing Claude 4. Anthropic. 22 мая 2025.
  13. Introducing Claude Sonnet 4.5. Anthropic. 29 сентября 2025.
  14. Introducing Claude Opus 4.5. Anthropic. 24 ноября 2025.
  15. Introducing Claude Opus 4.6. Anthropic. 5 февраля 2026.
  16. Introducing Claude Sonnet 4.6. Anthropic. 17 февраля 2026.