Nova (Amazon)
Amazon Nova — семейство фундаментальных моделей (Foundation Models, FM) и больших языковых моделей (Large Language Model, LLM), разработанное подразделением Amazon Artificial General Intelligence (AAG Intelligence) и доступное через полностью управляемый сервис Amazon Bedrock. Семейство охватывает модели для понимания и генерации текста, обработки изображений, видео и документов, а также синтеза и распознавания речи. Amazon Nova позиционируется как замена предыдущего поколения моделей Amazon Titan и интегрировано в облачную экосистему Amazon Web Services (AWS).[1][2][3]
История и хронология развития
До запуска Nova платформа Amazon Bedrock предоставляла доступ к сторонним моделям: Anthropic Claude, Meta Llama, Mistral и другим. Amazon Nova стала первым семейством фундаментальных моделей собственной разработки AWS, ориентированным на коммерческое применение в облачной инфраструктуре.[3]
Первое поколение (2024–2025)
Первое поколение семейства Amazon Nova было официально представлено 3 декабря 2024 года на конференции AWS re:Invent 2024. В первоначальный релиз вошли три модели понимания (understanding models) — Nova Micro (только текст), мультимодальные Nova Lite и Nova Pro, — а также генеративные модели Nova Canvas (генерация изображений) и Nova Reel (генерация видео).[4][3][5]
В апреле 2025 года линейка пополнилась флагманской моделью Nova Premier — наиболее мощной моделью семейства с контекстным окном в 1 миллион токенов, предназначенной для задач со сложными рассуждениями и дистилляции (distillation, перенос знаний от крупной модели к меньшей) моделей.[6] Тогда же, в апреле 2025 года, была представлена Nova Sonic — речевая модель класса speech‑to‑speech с поддержкой диалогов в реальном времени.[7]
Второе поколение — Nova 2 (2025–2026)
В ноябре–декабре 2025 года на конференции AWS re:Invent 2025 было анонсировано второе поколение — Amazon Nova 2. В линейку вошли обновлённые модели Nova 2 Lite и Nova 2 Pro с поддержкой динамических рассуждений (dynamic reasoning) и расширенной обработки контекста, нативная мультимодальная модель Nova 2 Omni (одновременная обработка и генерация текста, изображений, видео и аудио), а также Nova 2 Sonic — речевая модель следующего поколения. Одновременно были представлены сервисы Nova Forge (среда для кастомного обучения моделей) и Nova Act (фреймворк для агентных workflow).[8][9][10]
В феврале 2026 года опубликован официальный технический отчёт Amazon Nova 2.[11]
Сводная хронология
| Дата | Событие |
|---|---|
| Декабрь 2024 | Анонс Amazon Nova на AWS re:Invent 2024: Nova Micro, Lite, Pro, Canvas, Reel |
| Апрель 2025 | Выпуск Nova Premier (контекст 1M токенов) и Nova Sonic (speech‑to‑speech) |
| Июнь 2025 | Публикация технического отчёта первого поколения (arXiv:2506.12103) |
| Ноябрь–Декабрь 2025 | Анонс Nova 2 на AWS re:Invent 2025: Nova 2 Lite, 2 Pro, 2 Omni, 2 Sonic, Nova Forge, Nova Act |
| Февраль 2026 | Публикация технического отчёта Amazon Nova 2 |
Теоретические основы и архитектура
Базовая архитектура understanding‑моделей
Согласно техническому отчёту arXiv:2506.12103, модели понимания (Nova Micro, Lite, Pro, Premier) основаны на архитектуре трансформера (Transformer), описанной в работе Vaswani et al.[12] Базовый механизм многоголового самовнимания (Multi‑Head Self‑Attention) описывается формулой:
где , , — матрицы запросов (queries), ключей (keys) и значений (values) соответственно, — размерность ключей.[12][1]
Точные параметры архитектуры (число слоёв, размер скрытого состояния, число голов внимания, общее количество параметров) в публично доступных источниках по состоянию на март 2026 года не раскрыты. Такой подход характерен для закрытых коммерческих моделей.[1]
Мультимодальная обработка в Nova Lite и Nova Pro реализована через объединение текстовых, визуальных и видео‑токенов в единую последовательность, подаваемую на вход единой языковой модели. Визуальные кодировщики (vision encoders) преобразуют изображения и кадры видео в последовательности токенов, совместимых с текстовым представлением.[1][13]
Архитектура генеративных моделей
Генеративные модели Nova Canvas (изображения) и Nova Reel (видео) используют архитектуру латентных диффузионных моделей (Latent Diffusion Models, LDM)[14] в связке с вариационными автоэнкодерами (Variational AutoEncoder, VAE) для вычислений в латентном пространстве. Процесс диффузии описывается уравнением прямого шума:
где — исходное изображение в латентном пространстве, — его зашумлённая версия на шаге , — кумулятивный параметр шумового расписания, — стандартный гауссов шум. Текстовый кодировщик (text encoder) обеспечивает conditioning — обусловливание генерации на текстовом промпте.[13][14]
Архитектура речевых моделей
Nova Sonic использует отличную от текстовых моделей архитектуру: она объединяет специализированный кодировщик речи (speech encoder), декодер речи (speech renderer) и основную мультимодальную языковую модель в единый сквозной конвейер (end‑to‑end pipeline). Это позволяет обрабатывать речевой ввод и генерировать речевой вывод без промежуточного преобразования в текст (хотя текстовое представление используется внутренне для обеспечения качества).[15][1]
Инфраструктура обучения
Обучение моделей Nova производилось на распределённых кластерах AWS Elastic Kubernetes Service (EKS) с использованием собственных ИИ‑ускорителей Amazon Trainium (инстансы TRN1), а также графических процессоров NVIDIA A100 и H100.[13][1]
Для снижения вычислительных издержек при обучении были разработаны и применены специализированные методы оптимизации:
- Super‑Selective Activation Checkpointing (SSC) — метод сохранения активаций, который, по данным технического отчёта, уменьшает потребление памяти графических процессоров приблизительно на 50 % при минимальных накладных расходах на повторные вычисления (recomputation).[13]
- In‑CPU‑Memory Checkpointing — кэширование промежуточных весов (checkpoints) в оперативной памяти центральных процессоров (CPU) перед их асинхронной выгрузкой в облачное хранилище Amazon S3. По данным Amazon, этот подход позволил сократить время сохранения состояния модели до 0,1 секунды на инстансах с TRN1.[16][13]
Пайплайн обучения и выравнивание
Процесс обучения моделей Nova состоит из нескольких этапов, характерных для современных LLM:[1][17]
Предварительное обучение (Pre‑training)
Масштабное обучение на крупном мультиязычном и мультимодальном корпусе данных, включающем более 200 языков. Точный состав обучающих данных (объём, соотношение языков, конкретные источники) в публичных материалах не приводится.[1]
Контролируемое дообучение (Supervised Fine‑Tuning, SFT)
Дообучение на размеченных примерах пар «инструкция — ответ», приводящее модель к следованию инструкциям пользователя.[1]
Выравнивание с помощью обучения с подкреплением
Для выравнивания поведения модели с предпочтениями человека применяются два основных алгоритма:
Proximal Policy Optimization (PPO) — алгоритм обучения с подкреплением на основе отзывов людей (Reinforcement Learning from Human Feedback, RLHF), использующий отдельную модель вознаграждения (Reward Model).[18][1]
Direct Preference Optimization (DPO) — альтернативный метод выравнивания, не требующий явной модели вознаграждения. Целевая функция DPO имеет вид:[19]
где:
- — параметризованная стратегия (обучаемая модель);
- — базовая (замороженная) референсная модель;
- — входной промпт (контекст);
- и — предпочтительный (winner) и отвергнутый (loser) ответы соответственно;
- — логистическая (сигмоидная) функция;
- — гиперпараметр, контролирующий силу штрафа за отклонение от базовой модели (аналог штрафа Кульбака–Лейблера, KL‑divergence penalty).[19][1]
Состав семейства моделей
Семейство моделей разделено на тиры (tiers) в зависимости от баланса между производительностью, стоимостью и задержкой (latency).[2][20]
Модели понимания первого поколения
| Параметр | Nova Micro | Nova Lite | Nova Pro | Nova Premier |
|---|---|---|---|---|
| Входные модальности | Текст | Текст, изображение, видео | Текст, изображение, видео | Текст, изображение, видео |
| Выходная модальность | Текст | Текст | Текст | Текст |
| Контекстное окно | 128 тыс. токенов | 300 тыс. токенов | 300 тыс. токенов | 1 млн токенов |
| Макс. выходных токенов | 10 тыс. | 10 тыс. | 10 тыс. | 10 тыс. |
| Поддержка языков | 200+ | 200+ | 200+ | 200+ |
| Дообучение (fine‑tuning) | Да | Да | Да | Нет |
| Дата релиза | Декабрь 2024 | Декабрь 2024 | Декабрь 2024 | Апрель 2025 |
| Основное назначение | Минимальная задержка и стоимость для текстовых задач | Базовый мультимодальный анализ | Оптимальный баланс для сложных логических и агентных задач | Максимальная точность, модель‑учитель для дистилляции |
Источник: AWS AI Service Cards; arXiv:2506.12103.[20][1]
Оптимизированные языки (15): английский, немецкий, испанский, французский, итальянский, японский, корейский, арабский, китайский (упрощённый), русский, хинди, португальский, нидерландский, турецкий, иврит.[2]
Nova Premier предназначена для задач, требующих глубокого понимания контекста, многошагового планирования и работы с большими объёмами данных: кодовыми базами, документами объёмом более 400 страниц, видео длительностью до 90 минут.[6]
Модели второго поколения (Nova 2)
Nova 2 Lite и Nova 2 Pro выпущены в ноябре–декабре 2025 года. Оба поддерживают расширенное мышление (extended thinking) — механизм, при котором модель выполняет многошаговые рассуждения перед генерацией ответа. Глубина рассуждений регулируется параметром reasoning_effort с уровнями low, medium и high. Контекстное окно расширено до 1 миллиона токенов. Встроены нативные инструменты: веб‑поиск с подтверждением (web grounding) и интерпретатор кода (code interpreter).[9][8]
Nova 2 Omni — нативная мультимодальная модель, способная одновременно принимать на вход текст, изображения, видео и аудио и генерировать текст и изображения. Контекстное окно — 1 млн токенов.[8][11]
Nova 2 Sonic — речевая модель следующего поколения. Поддерживает 6 языков: английский (американский и британский варианты), испанский, немецкий, французский, итальянский. Вводит асинхронный вызов инструментов (asynchronous tool calling) — модель продолжает обрабатывать новый ввод, пока внешние инструменты выполняются в фоновом режиме.[10]
| Параметр | Nova 2 Lite | Nova 2 Pro | Nova 2 Omni | Nova 2 Sonic |
|---|---|---|---|---|
| Входные модальности | Текст, изображение, видео | Текст, изображение, видео | Текст, изображение, видео, аудио | Аудио (речь) |
| Выходная модальность | Текст | Текст | Текст, изображение | Аудио (речь) |
| Контекстное окно | 1 млн токенов | 1 млн токенов | 1 млн токенов | 300 тыс. токенов |
| Extended thinking | Да | Да | Да | — |
| Нативные инструменты | Web grounding, Code interpreter | Web grounding, Code interpreter | — | Asynchronous tool calling |
| Дата релиза | Ноябрь–Декабрь 2025 | Ноябрь–Декабрь 2025 | Декабрь 2025 | Декабрь 2025 |
Источник: AWS Blog; Amazon Science.[9][8][11]
Генеративные модели
Nova Canvas — модель генерации изображений. Поддерживает текстовый и графический ввод (PNG, JPEG). Выходное разрешение — до 4,19 млн пикселей (например, 2048×2048 или 2816×1536 пикселей). Максимальная длина промпта — 1024 символа. Поддерживаются операции inpainting (замена области изображения) и outpainting (расширение изображения за его границы).[2][4]
Nova Reel — модель генерации видео. Выходное разрешение: 1280×720 при 24 кадрах в секунду. Длительность генерируемого видео — до 6 секунд. Поддерживается управление движением камеры (camera control). Доступ осуществляется через асинхронный API (Asynchronous Invoke Model API).[2][4]
Речевые модели
Nova Sonic (апрель 2025) — речевая модель с двунаправленным потоковым API (bidirectional stream API). Поддерживает функциональные вызовы (function calling) и заземление на корпоративных данных через Retrieval‑Augmented Generation (RAG, генерация с привлечением внешних знаний). Функция водяного знака (watermarking) встроена по умолчанию. Максимальная продолжительность соединения — 8 минут с возможностью возобновления; максимум 20 одновременных соединений на клиента (значение по умолчанию).[7][15][2]
Nova 2 Sonic (декабрь 2025) — следующее поколение речевой модели с улучшенным распознаванием коротких высказываний, телефонного аудио (8 кГц) и акцентов.[10]
Оценка и бенчмарки
Оценка моделей Nova проводилась с использованием автоматизированных бенчмарков, включая подход «LLM‑as‑a‑judge» (использование языковой модели в качестве оценщика). По данным исследования HKU SPACE AI Hub, метрика Arena‑Hard‑Auto демонстрирует 98,6 % корреляцию с оценками экспертов.[21][22]
Бенчмарки первого поколения
Данные из технического отчёта arXiv:2506.12103 (условия: результаты разработчиков моделей‑конкурентов, опубликованные на момент подготовки отчёта):[1]
| Бенчмарк | Nova Pro | Nova Lite | Nova Micro | Claude 3.5 Sonnet (Oct 2024) | GPT‑4o (Nov 2024) |
|---|---|---|---|---|---|
| MMLU (5‑shot) | — | 80,5 | 77,6 | — | — |
| MATH (4‑shot) | — | 73,3 | 69,3 | — | — |
| IFEval | — | 87,5 | 87,2 | — | — |
| MT‑Bench (text) | 79,7 | 77,7 | — | 76,7 | 77,5 |
| MT‑Bench (multimodal) | 63,7 | 60,7 | — | 61,6 | 55,0 |
Источник: arXiv:2506.12103, таблица 2.1.1.[1]
Результаты показывают иерархию производительности внутри семейства (Premier > Pro > Lite > Micro). Разрыв наиболее заметен в категориях математики (Math) и рассуждений (Reasoning); в задачах ролевого взаимодействия (Roleplay) и извлечения информации (Extraction) младшие модели показывают результаты, близкие к старшим.[22]
Бенчмарки второго поколения (Nova 2)
Данные из технического отчёта Amazon Nova 2 (условия: internal measurements, 0‑shot / CoT где указано):[11]
| Бенчмарк | Nova 2 Lite | Nova 2 Pro | Claude Haiku 4.5 | GPT‑5 Mini | Gemini 2.5 Flash |
|---|---|---|---|---|---|
| MMLU‑Pro (acc) | 80,9 | 81,6 | 80,0 | 83,7 | 83,2 |
| GPQA‑Diamond (acc) | 79,6 | 81,4 | 73,0 | 82,3 | 82,8 |
| AIME 2025 (acc) | 91,0 | 92,3 | 80,7 | 91,1 | 72,0 |
| LongCodeBench 1M (acc) | 84,0 | 84,0 | — | — | 78,0 |
Источник: Amazon Nova 2 Technical Report, таблица 1.[11]
Агентные бенчмарки (Nova 2 Pro): SWE‑Bench Verified — 70,0 %; τ²‑bench Verified Telecom — 92,7 %.[11]
Мультимодальные бенчмарки (Nova 2 Omni): VideoMME — 77,9 %; MMMU Pro — 61,4 %.[11]
При оценке в задачах технической поддержки Nova 2 Lite набрала 9,63 ± 0,27 по десятибалльной шкале в метрике «Идентификация проблемы» (Problem Identification), значительно опередив Nova Lite первого поколения (8,57 ± 0,46).[23]
Примечание. При сопоставлении результатов с конкурирующими моделями необходимо учитывать, что условия промптинга, версии моделей и даты снятия метрик могут различаться. Бенчмарки первого и второго поколений получены из самоотчётов Amazon; независимые верификации (FloTorch, Artificial Analysis) в целом подтверждают заявленное соотношение цена/производительность, но по отдельным метрикам точности фиксируют отставание от ведущих конкурентов.[22]
Скорость вывода
По внутренним замерам Amazon (internal, через Bedrock API):[1][11]
| Модель | Скорость вывода (токенов/с) |
|---|---|
| Nova Micro | ≈210 |
| Nova Lite | ≈157 |
| Nova Pro | ≈100 |
| Nova 2 Omni | >200 |
Стоимость использования
Все модели доступны через Amazon Bedrock по модели оплаты за количество обработанных токенов (данные на март 2026 года):[2]
| Модель | Входные токены (USD / 1M) | Выходные токены (USD / 1M) |
|---|---|---|
| Nova Micro | $0,035 | $0,14 |
| Nova Lite | ≈$0,06 | ≈$0,24 |
| Nova Pro | $0,80 | $3,20 |
| Nova Premier | $2,50 | $12,50 |
Для сравнения: Anthropic Claude 3.5 Sonnet на момент релиза Nova тарифицировался по $6,00 / 1M входных и $30,00 / 1M выходных токенов.[22]
Кастомизация и дообучение
Инфраструктура AWS предоставляет несколько методов адаптации базовых моделей Nova под узкоспециализированные домены. Основным инструментом для этого во втором поколении выступает среда Amazon Nova Forge.[8][17]
Continued Pre‑Training (CPT) и Mid‑Training
Nova Forge открывает доступ к промежуточным чекпоинтам обучения моделей (например, pretraining‑text‑RD и pretraining‑text‑CE). Это позволяет продолжать самообучение (self‑supervised learning) на массивах корпоративных данных с аккуратным подбором скорости обучения (learning rate) для предотвращения катастрофического забывания (catastrophic forgetting).[24][25]
Parameter‑Efficient Fine‑Tuning (PEFT)
Обновление только небольшого подмножества весов модели через адаптеры низкого ранга — Low‑Rank Adaptation (LoRA)[26]. Этот подход существенно снижает требования к вычислительным ресурсам по сравнению с полным дообучением (full fine‑tuning). Поддерживается мультимодальный fine‑tuning для Nova Lite и Pro.[17]
Reinforcement Fine‑Tuning (RFT)
Пользовательские модели могут быть дополнительно дообучены методами с подкреплением на базе специфических для отрасли метрик вознаграждения, в том числе с использованием другой LLM в качестве модели‑судьи (LLM‑as‑a‑judge).[27]
Дистилляция моделей (Model Distillation)
Функция Model Distillation позволяет использовать Nova Premier или Nova Pro в качестве модели‑учителя (teacher model) для обучения меньших моделей‑учеников (student models) — Nova Lite и Nova Micro. Это снижает вычислительные затраты на инференс при сохранении существенной доли качества крупной модели.[2][6]
Применение и интеграция
Модели Nova интегрированы в вычислительные сервисы Amazon (AWS Step Functions, AWS Lambda, Amazon Q Developer). Основные задокументированные сценарии применения:[2][1]
Агентные рабочие процессы (Agentic Workflows)
Многошаговое выполнение задач с использованием Bedrock Agents и вызовом внешних инструментов (function calling). Используя архитектурный паттерн ReAct (Reasoning and Acting) в связке с фреймворками типа LangGraph, модели Nova координируют аналитику баз данных, формируют SQL‑запросы из естественного языка и управляют многосоставными процессами. Nova Act обеспечивает автоматизацию браузерных UI‑workflow с заявленной надёжностью 90 % на ранних пользовательских задачах.[28][8]
Генерация с привлечением внешних знаний (RAG)
Интеграция с Bedrock Knowledge Bases для заземления (grounding) ответов на корпоративных данных. Модели Nova 2 поддерживают нативный веб‑поиск с подтверждением (web grounding) как встроенный инструмент.[1][9]
Обработка документов
Поддерживаемые форматы входных документов: PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD (кроме Nova Micro, который принимает только текстовый ввод). Nova Premier способна обрабатывать видео длительностью до 90 минут в рамках единого запроса.[2][6]
Генерация и отладка кода
Поддерживаемые языки программирования: Python, Java, JavaScript, C#, TypeScript, SQL.[20]
Речевые интерфейсы
Nova Sonic и Nova 2 Sonic применяются для построения голосовых агентов с поддержкой реального времени, интегрированных с Amazon Connect.[10][7]
Оценка моделей (LLM‑as‑a‑judge)
Nova применяется как модель‑судья при оценке выходов других генеративных моделей на платформе Amazon SageMaker.[29]
Ограничения и открытые проблемы
- Закрытость архитектуры. Amazon не раскрывает число параметров, детальные архитектурные решения и состав обучающих данных, что существенно ограничивает независимую воспроизводимость результатов. Веса моделей Nova не предоставляются для скачивания или развёртывания вне инфраструктуры AWS (on‑premise развёртывание невозможно).[1][2]
- Выходной лимит. Максимальное количество выходных токенов для всех моделей понимания ограничено 10 тыс. токенов, что может быть недостаточным для задач генерации длинных документов.[2]
- Ограничения RFT. Reinforcement Fine‑Tuning не поддерживает многооборотные (multi‑turn) диалоги и мультимодальные данные; рекомендуемая доля положительных примеров в наборе данных — не менее 5 %.[27]
- Ограничения Nova Sonic. Максимальная длительность соединения — 8 минут; максимум 20 одновременных соединений на клиента по умолчанию.[2]
- Региональная доступность. Nova Premier доступна только в одном регионе (US East N. Virginia) без поддержки кросс‑регионального инференса; Nova 2‑модели имеют ограниченный список регионов развёртывания.[2]
- Чувствительность метрик. Оценки на синтетических бенчмарках не всегда коррелируют с качеством работы в производственных условиях (production), где критичны строгое следование корпоративным политикам и отсутствие галлюцинаций в многоступенчатых выводах.[22][23]
- Галлюцинации. Модели демонстрируют типичные для LLM ограничения: возможны фактические ошибки в генерируемых ответах. Для снижения рисков рекомендуется использование Bedrock Guardrails и RAG.[1]
- Сравнительная объективность бенчмарков. Amazon приводит сравнения с конкурирующими моделями на основе опубликованных самими разработчиками данных, что не всегда обеспечивает единую контролируемую экспериментальную базу.[22]
Этические и регуляторные аспекты
AWS декларирует следование принципам ответственного ИИ (Responsible AI) при разработке Nova‑моделей. Конкретные меры безопасности включают:[20][15]
- Встроенная модерация контента (content moderation).
- Водяные знаки (watermarking) для аудио‑выходов Nova Sonic.
- Оценка по категориям риска: безопасность (safety), конфиденциальность (privacy), достоверность (veracity), прозрачность (transparency), а также распространение ХБРЯ (химического, биологического, радиологического и ядерного) оружия (CBRN) и наступательные кибероперации.
- Интеграция с Amazon Bedrock Guardrails для фильтрации входных и выходных данных.
- Оценка модели Nova Premier на соответствие Amazon Frontier Model Safety Framework.
- Red teaming — внутреннее и внешнее тестирование на устойчивость к атакам (по данным технического отчёта, 307 техник).
- Оценка модерации контента по метрике F1: 85,84 на бенчмарке Aegis (по данным технического отчёта).[1]
Карточки ИИ‑сервисов (AI Service Cards) для Nova Micro, Lite, Pro, Premier и Sonic опубликованы на docs.aws.amazon.com как документация по ответственному применению.[20][15]
Перспективы и направления исследований
Семейство Nova 2 обозначает переход к моделям с расширенными возможностями рассуждения (extended thinking / reasoning), сопоставимым по концепции с цепочкой мысли (Chain‑of‑Thought, CoT) и аналогичными механизмами в других семействах моделей. Встроенный веб‑поиск и интерпретатор кода как нативные инструменты (а не сторонние плагины) представляют архитектурный сдвиг в направлении агентных систем.[9][8]
Направления дальнейшего развития, обозначенные в публичных материалах Amazon:
- Расширение мультимодальности (модель Omni как унифицированная «всё‑во‑всё» архитектура).
- Гибридные рассуждения (hybrid reasoning) с адаптивной глубиной в зависимости от сложности задачи.
- Открытое обучение на пользовательских данных (Nova Forge) на всех стадиях предобучения.
- Дистилляция для edge‑устройств.
- Расширение инструментария безопасности (safety toolkit).[8][11]
Тематика Amazon Nova AI Challenge, проводимого AWS среди университетских команд, включает направления автоматизированного состязательного тестирования, выравнивания безопасности (safety alignment) и многооборотных атак (multi‑turn jailbreaks), что свидетельствует об инвестициях в надёжность модельного семейства.[8]
См. также
Литература
- Amazon Artificial General Intelligence. The Amazon Nova Family of Models: Technical Report and Model Card. arXiv:2506.12103v1, 2025. https://arxiv.org/abs/2506.12103
- Amazon Artificial General Intelligence. Amazon Nova 2: Multimodal Reasoning and Generation Models — Technical Report and Model Card. Amazon Science, февраль 2026. https://www.amazon.science/publications/amazon-nova-2-multimodal-reasoning-and-generation-models
- Vaswani, A. et al. (2017). Attention Is All You Need. NeurIPS. https://arxiv.org/abs/1706.03762
- Rafailov, R. et al. (2023). Direct Preference Optimization: Your Language Model is Secretly a Reward Model. NeurIPS. https://arxiv.org/abs/2305.18290
- Ouyang, L. et al. (2022). Training language models to follow instructions with human feedback (InstructGPT). NeurIPS. https://arxiv.org/abs/2203.02155
- Rombach, R. et al. (2022). High‑Resolution Image Synthesis with Latent Diffusion Models. CVPR. https://arxiv.org/abs/2112.10752
- Hu, E.J. et al. (2021). LoRA: Low‑Rank Adaptation of Large Language Models. https://arxiv.org/abs/2106.09685
Ссылки
- https://docs.aws.amazon.com/nova/latest/userguide/what-is-nova.html — Официальная документация Amazon Nova
- https://docs.aws.amazon.com/ai/responsible-ai/nova-micro-lite-pro/overview.html — AI Service Cards для Nova Micro, Lite, Pro, Premier
- https://docs.aws.amazon.com/ai/responsible-ai/nova-sonic/overview.html — AI Service Card для Nova Sonic
- https://aws.amazon.com/blogs/aws/introducing-amazon-nova-frontier-intelligence-and-industry-leading-price-performance/ — Анонс Amazon Nova (декабрь 2024)
- https://www.aboutamazon.com/news/aws/aws-agentic-ai-amazon-bedrock-nova-models — Анонс Amazon Nova 2 (декабрь 2025)
Примечания
- ↑ 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10 1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,18 1,19 Amazon Artificial General Intelligence. The Amazon Nova Family of Models: Technical Report and Model Card. arXiv:2506.12103v1, 2025. https://arxiv.org/abs/2506.12103
- ↑ 2,00 2,01 2,02 2,03 2,04 2,05 2,06 2,07 2,08 2,09 2,10 2,11 2,12 2,13 AWS Documentation. What is Amazon Nova?. Amazon Nova User Guide. https://docs.aws.amazon.com/nova/latest/userguide/what-is-nova.html
- ↑ 3,0 3,1 3,2 AWS. Introducing Amazon Nova foundation models. AWS News Blog, 3 декабря 2024. https://aws.amazon.com/blogs/aws/introducing-amazon-nova-frontier-intelligence-and-industry-leading-price-performance/
- ↑ 4,0 4,1 4,2 About Amazon. 11 key announcements from AWS re:Invent 2024. aboutamazon.com, 2024. https://www.aboutamazon.com/news/aws/amazon-nova-ai-canvas-reel-aws-reinvent
- ↑ Futurum Research. Amazon unveils Nova models, chips, and tools at re:Invent. futurumgroup.com, 2025. https://futurumgroup.com/press-release/amazon-unveils-models-chips-and-tools-at-reinvent-boosting-its-ai-credentials/
- ↑ 6,0 6,1 6,2 6,3 AWS. Amazon Nova Premier — Our most capable model for complex tasks and teacher for model distillation. AWS Blog, 29 апреля 2025. https://aws.amazon.com/blogs/aws/amazon-nova-premier-our-most-capable-model-for-complex-tasks-and-teacher-for-model-distillation/
- ↑ 7,0 7,1 7,2 AWS. Announcing Amazon Nova Sonic. AWS What's New, 7 апреля 2025. https://aws.amazon.com/about-aws/whats-new/2025/04/amazon-nova-sonic-speech-to-speech-conversations-bedrock/
- ↑ 8,0 8,1 8,2 8,3 8,4 8,5 8,6 8,7 8,8 Amazon. Amazon introduces new frontier Nova models. aboutamazon.com, 2 декабря 2025. https://www.aboutamazon.com/news/aws/aws-agentic-ai-amazon-bedrock-nova-models
- ↑ 9,0 9,1 9,2 9,3 9,4 AWS. Introducing Amazon Nova 2 Lite — a fast, cost‑effective reasoning model. AWS Blog, декабрь 2025. https://aws.amazon.com/blogs/aws/introducing-amazon-nova-2-lite-a-fast-cost-effective-reasoning-model/
- ↑ 10,0 10,1 10,2 10,3 AWS. Introducing Amazon Nova 2 Sonic — next‑generation speech‑to‑speech model for conversational AI. AWS Blog, декабрь 2025. https://aws.amazon.com/blogs/aws/introducing-amazon-nova-2-sonic-next-generation-speech-to-speech-model-for-conversational-ai/
- ↑ 11,0 11,1 11,2 11,3 11,4 11,5 11,6 11,7 11,8 Amazon Artificial General Intelligence. Amazon Nova 2: Multimodal Reasoning and Generation Models — Technical Report and Model Card. Amazon Science, 16 февраля 2026. https://www.amazon.science/publications/amazon-nova-2-multimodal-reasoning-and-generation-models
- ↑ 12,0 12,1 Vaswani, A. et al. (2017). Attention Is All You Need. NeurIPS. https://arxiv.org/abs/1706.03762
- ↑ 13,0 13,1 13,2 13,3 13,4 AlphaXiv / Amazon Science. The Amazon Nova Family of Models: Model Architecture and Training Methodology. alphaxiv.org, 2025. https://www.alphaxiv.org/overview/2506.12103v1
- ↑ 14,0 14,1 Rombach, R. et al. (2022). High‑Resolution Image Synthesis with Latent Diffusion Models. CVPR. https://arxiv.org/abs/2112.10752
- ↑ 15,0 15,1 15,2 15,3 AWS. Amazon Nova Sonic — AWS AI Service Cards. docs.aws.amazon.com. https://docs.aws.amazon.com/ai/responsible-ai/nova-sonic/overview.html
- ↑ LinkedIn (инженеры AWS). Announcing Managed Tiered Checkpointing. linkedin.com, декабрь 2025. https://www.linkedin.com/posts/hajamaideen_announcing-managed-tiered-checkpointing-for-activity-7402077620147798016-njZo
- ↑ 17,0 17,1 17,2 AWS. Announcing Amazon Nova customization in Amazon SageMaker AI. aws.amazon.com, 2025. https://aws.amazon.com/blogs/aws/announcing-amazon-nova-customization-in-amazon-sagemaker-ai/
- ↑ Ouyang, L. et al. (2022). Training language models to follow instructions with human feedback (InstructGPT). NeurIPS. https://arxiv.org/abs/2203.02155
- ↑ 19,0 19,1 Rafailov, R. et al. (2023). Direct Preference Optimization: Your Language Model is Secretly a Reward Model. NeurIPS. https://arxiv.org/abs/2305.18290
- ↑ 20,0 20,1 20,2 20,3 20,4 AWS. Amazon Nova Micro, Lite, Pro, and Premier — AWS AI Service Cards. docs.aws.amazon.com. https://docs.aws.amazon.com/ai/responsible-ai/nova-micro-lite-pro/overview.html
- ↑ HKU SPACE AI Hub. Benchmarking Amazon Nova: A comprehensive analysis through MT‑Bench and Arena‑Hard‑Auto. aihub.hkuspace.hku.hk, 2025. https://aihub.hkuspace.hku.hk/benchmarking-amazon-nova-a-comprehensive-analysis-through-mt-bench-and-arena-hard-auto/
- ↑ 22,0 22,1 22,2 22,3 22,4 22,5 AWS Machine Learning Blog. Benchmarking Amazon Nova: A Comprehensive Analysis Through MT‑Bench and Arena‑Hard. aws.amazon.com, 2025. https://aws.amazon.com/blogs/machine-learning/benchmarking-amazon-nova-a-comprehensive-analysis-through-mt-bench-and-arena-hard-auto/
- ↑ 23,0 23,1 AWS Machine Learning Blog. Real‑world reasoning: How Amazon Nova Lite 2.0 handles complex customer support scenarios. aws.amazon.com, 2025. https://aws.amazon.com/blogs/machine-learning/real-world-reasoning-how-amazon-nova-lite-2-0-handles-complex-customer-support-scenarios/
- ↑ AWS Documentation. Continued Pre‑Training and Mid‑Training — Amazon Nova. docs.aws.amazon.com. https://docs.aws.amazon.com/nova/latest/nova2-userguide/nova-forge-cpt.html
- ↑ AWS Documentation. Continued Pre‑Training and Mid‑Training. Amazon SageMaker Developer Guide. https://docs.aws.amazon.com/sagemaker/latest/dg/nova-forge-cpt.html
- ↑ Hu, E.J. et al. (2021). LoRA: Low‑Rank Adaptation of Large Language Models. https://arxiv.org/abs/2106.09685
- ↑ 27,0 27,1 AWS Documentation. Reinforcement Fine‑Tuning (RFT) with Amazon Nova models. Amazon SageMaker Documentation. https://docs.aws.amazon.com/sagemaker/latest/dg/nova-reinforcement-fine-tuning.html
- ↑ AWS Machine Learning Blog. Natural language‑based database analytics with Amazon Nova. aws.amazon.com, 2025. https://aws.amazon.com/blogs/machine-learning/natural-language-based-database-analytics-with-amazon-nova/
- ↑ AWS Machine Learning Blog. Evaluating generative AI models with Amazon Nova LLM‑as‑a‑judge on Amazon SageMaker AI. aws.amazon.com, 2025. https://aws.amazon.com/blogs/machine-learning/evaluating-generative-ai-models-with-amazon-nova-llm-as-a-judge-on-amazon-sagemaker-ai/