Nova (Amazon)

Материал из Systems analysis wiki
Перейти к навигации Перейти к поиску

Amazon Nova — семейство фундаментальных моделей (Foundation Models, FM) и больших языковых моделей (Large Language Model, LLM), разработанное подразделением Amazon Artificial General Intelligence (AAG Intelligence) и доступное через полностью управляемый сервис Amazon Bedrock. Семейство охватывает модели для понимания и генерации текста, обработки изображений, видео и документов, а также синтеза и распознавания речи. Amazon Nova позиционируется как замена предыдущего поколения моделей Amazon Titan и интегрировано в облачную экосистему Amazon Web Services (AWS).[1][2][3]

История и хронология развития

До запуска Nova платформа Amazon Bedrock предоставляла доступ к сторонним моделям: Anthropic Claude, Meta Llama, Mistral и другим. Amazon Nova стала первым семейством фундаментальных моделей собственной разработки AWS, ориентированным на коммерческое применение в облачной инфраструктуре.[3]

Первое поколение (2024–2025)

Первое поколение семейства Amazon Nova было официально представлено 3 декабря 2024 года на конференции AWS re:Invent 2024. В первоначальный релиз вошли три модели понимания (understanding models) — Nova Micro (только текст), мультимодальные Nova Lite и Nova Pro, — а также генеративные модели Nova Canvas (генерация изображений) и Nova Reel (генерация видео).[4][3][5]

В апреле 2025 года линейка пополнилась флагманской моделью Nova Premier — наиболее мощной моделью семейства с контекстным окном в 1 миллион токенов, предназначенной для задач со сложными рассуждениями и дистилляции (distillation, перенос знаний от крупной модели к меньшей) моделей.[6] Тогда же, в апреле 2025 года, была представлена Nova Sonic — речевая модель класса speech‑to‑speech с поддержкой диалогов в реальном времени.[7]

Второе поколение — Nova 2 (2025–2026)

В ноябре–декабре 2025 года на конференции AWS re:Invent 2025 было анонсировано второе поколение — Amazon Nova 2. В линейку вошли обновлённые модели Nova 2 Lite и Nova 2 Pro с поддержкой динамических рассуждений (dynamic reasoning) и расширенной обработки контекста, нативная мультимодальная модель Nova 2 Omni (одновременная обработка и генерация текста, изображений, видео и аудио), а также Nova 2 Sonic — речевая модель следующего поколения. Одновременно были представлены сервисы Nova Forge (среда для кастомного обучения моделей) и Nova Act (фреймворк для агентных workflow).[8][9][10]

В феврале 2026 года опубликован официальный технический отчёт Amazon Nova 2.[11]

Сводная хронология

Дата Событие
Декабрь 2024 Анонс Amazon Nova на AWS re:Invent 2024: Nova Micro, Lite, Pro, Canvas, Reel
Апрель 2025 Выпуск Nova Premier (контекст 1M токенов) и Nova Sonic (speech‑to‑speech)
Июнь 2025 Публикация технического отчёта первого поколения (arXiv:2506.12103)
Ноябрь–Декабрь 2025 Анонс Nova 2 на AWS re:Invent 2025: Nova 2 Lite, 2 Pro, 2 Omni, 2 Sonic, Nova Forge, Nova Act
Февраль 2026 Публикация технического отчёта Amazon Nova 2

Теоретические основы и архитектура

Базовая архитектура understanding‑моделей

Согласно техническому отчёту arXiv:2506.12103, модели понимания (Nova Micro, Lite, Pro, Premier) основаны на архитектуре трансформера (Transformer), описанной в работе Vaswani et al.[12] Базовый механизм многоголового самовнимания (Multi‑Head Self‑Attention) описывается формулой:

Attention(Q,K,V)=softmax(QKdk)V

где Q, K, V — матрицы запросов (queries), ключей (keys) и значений (values) соответственно, dk — размерность ключей.[12][1]

Точные параметры архитектуры (число слоёв, размер скрытого состояния, число голов внимания, общее количество параметров) в публично доступных источниках по состоянию на март 2026 года не раскрыты. Такой подход характерен для закрытых коммерческих моделей.[1]

Мультимодальная обработка в Nova Lite и Nova Pro реализована через объединение текстовых, визуальных и видео‑токенов в единую последовательность, подаваемую на вход единой языковой модели. Визуальные кодировщики (vision encoders) преобразуют изображения и кадры видео в последовательности токенов, совместимых с текстовым представлением.[1][13]

Архитектура генеративных моделей

Генеративные модели Nova Canvas (изображения) и Nova Reel (видео) используют архитектуру латентных диффузионных моделей (Latent Diffusion Models, LDM)[14] в связке с вариационными автоэнкодерами (Variational AutoEncoder, VAE) для вычислений в латентном пространстве. Процесс диффузии описывается уравнением прямого шума:

xt=α¯tx0+1α¯tϵ,ϵ𝒩(0,I)

где x0 — исходное изображение в латентном пространстве, xt — его зашумлённая версия на шаге t, α¯t — кумулятивный параметр шумового расписания, ϵ — стандартный гауссов шум. Текстовый кодировщик (text encoder) обеспечивает conditioning — обусловливание генерации на текстовом промпте.[13][14]

Архитектура речевых моделей

Nova Sonic использует отличную от текстовых моделей архитектуру: она объединяет специализированный кодировщик речи (speech encoder), декодер речи (speech renderer) и основную мультимодальную языковую модель в единый сквозной конвейер (end‑to‑end pipeline). Это позволяет обрабатывать речевой ввод и генерировать речевой вывод без промежуточного преобразования в текст (хотя текстовое представление используется внутренне для обеспечения качества).[15][1]

Инфраструктура обучения

Обучение моделей Nova производилось на распределённых кластерах AWS Elastic Kubernetes Service (EKS) с использованием собственных ИИ‑ускорителей Amazon Trainium (инстансы TRN1), а также графических процессоров NVIDIA A100 и H100.[13][1]

Для снижения вычислительных издержек при обучении были разработаны и применены специализированные методы оптимизации:

  • Super‑Selective Activation Checkpointing (SSC) — метод сохранения активаций, который, по данным технического отчёта, уменьшает потребление памяти графических процессоров приблизительно на 50 % при минимальных накладных расходах на повторные вычисления (recomputation).[13]
  • In‑CPU‑Memory Checkpointing — кэширование промежуточных весов (checkpoints) в оперативной памяти центральных процессоров (CPU) перед их асинхронной выгрузкой в облачное хранилище Amazon S3. По данным Amazon, этот подход позволил сократить время сохранения состояния модели до 0,1 секунды на инстансах с TRN1.[16][13]

Пайплайн обучения и выравнивание

Процесс обучения моделей Nova состоит из нескольких этапов, характерных для современных LLM:[1][17]

Предварительное обучение (Pre‑training)

Масштабное обучение на крупном мультиязычном и мультимодальном корпусе данных, включающем более 200 языков. Точный состав обучающих данных (объём, соотношение языков, конкретные источники) в публичных материалах не приводится.[1]

Контролируемое дообучение (Supervised Fine‑Tuning, SFT)

Дообучение на размеченных примерах пар «инструкция — ответ», приводящее модель к следованию инструкциям пользователя.[1]

Выравнивание с помощью обучения с подкреплением

Для выравнивания поведения модели с предпочтениями человека применяются два основных алгоритма:

Proximal Policy Optimization (PPO) — алгоритм обучения с подкреплением на основе отзывов людей (Reinforcement Learning from Human Feedback, RLHF), использующий отдельную модель вознаграждения (Reward Model).[18][1]

Direct Preference Optimization (DPO) — альтернативный метод выравнивания, не требующий явной модели вознаграждения. Целевая функция DPO имеет вид:[19]

DPO(πθ;πref)=𝔼(x,yw,yl)𝒟[logσ(βlogπθ(ywx)πref(ywx)βlogπθ(ylx)πref(ylx))]

где:

  • πθ — параметризованная стратегия (обучаемая модель);
  • πref — базовая (замороженная) референсная модель;
  • x — входной промпт (контекст);
  • yw и yl — предпочтительный (winner) и отвергнутый (loser) ответы соответственно;
  • σ — логистическая (сигмоидная) функция;
  • β — гиперпараметр, контролирующий силу штрафа за отклонение от базовой модели (аналог штрафа Кульбака–Лейблера, KL‑divergence penalty).[19][1]

Состав семейства моделей

Семейство моделей разделено на тиры (tiers) в зависимости от баланса между производительностью, стоимостью и задержкой (latency).[2][20]

Модели понимания первого поколения

Параметр Nova Micro Nova Lite Nova Pro Nova Premier
Входные модальности Текст Текст, изображение, видео Текст, изображение, видео Текст, изображение, видео
Выходная модальность Текст Текст Текст Текст
Контекстное окно 128 тыс. токенов 300 тыс. токенов 300 тыс. токенов 1 млн токенов
Макс. выходных токенов 10 тыс. 10 тыс. 10 тыс. 10 тыс.
Поддержка языков 200+ 200+ 200+ 200+
Дообучение (fine‑tuning) Да Да Да Нет
Дата релиза Декабрь 2024 Декабрь 2024 Декабрь 2024 Апрель 2025
Основное назначение Минимальная задержка и стоимость для текстовых задач Базовый мультимодальный анализ Оптимальный баланс для сложных логических и агентных задач Максимальная точность, модель‑учитель для дистилляции

Источник: AWS AI Service Cards; arXiv:2506.12103.[20][1]

Оптимизированные языки (15): английский, немецкий, испанский, французский, итальянский, японский, корейский, арабский, китайский (упрощённый), русский, хинди, португальский, нидерландский, турецкий, иврит.[2]

Nova Premier предназначена для задач, требующих глубокого понимания контекста, многошагового планирования и работы с большими объёмами данных: кодовыми базами, документами объёмом более 400 страниц, видео длительностью до 90 минут.[6]

Модели второго поколения (Nova 2)

Nova 2 Lite и Nova 2 Pro выпущены в ноябре–декабре 2025 года. Оба поддерживают расширенное мышление (extended thinking) — механизм, при котором модель выполняет многошаговые рассуждения перед генерацией ответа. Глубина рассуждений регулируется параметром reasoning_effort с уровнями low, medium и high. Контекстное окно расширено до 1 миллиона токенов. Встроены нативные инструменты: веб‑поиск с подтверждением (web grounding) и интерпретатор кода (code interpreter).[9][8]

Nova 2 Omni — нативная мультимодальная модель, способная одновременно принимать на вход текст, изображения, видео и аудио и генерировать текст и изображения. Контекстное окно — 1 млн токенов.[8][11]

Nova 2 Sonic — речевая модель следующего поколения. Поддерживает 6 языков: английский (американский и британский варианты), испанский, немецкий, французский, итальянский. Вводит асинхронный вызов инструментов (asynchronous tool calling) — модель продолжает обрабатывать новый ввод, пока внешние инструменты выполняются в фоновом режиме.[10]

Параметр Nova 2 Lite Nova 2 Pro Nova 2 Omni Nova 2 Sonic
Входные модальности Текст, изображение, видео Текст, изображение, видео Текст, изображение, видео, аудио Аудио (речь)
Выходная модальность Текст Текст Текст, изображение Аудио (речь)
Контекстное окно 1 млн токенов 1 млн токенов 1 млн токенов 300 тыс. токенов
Extended thinking Да Да Да
Нативные инструменты Web grounding, Code interpreter Web grounding, Code interpreter Asynchronous tool calling
Дата релиза Ноябрь–Декабрь 2025 Ноябрь–Декабрь 2025 Декабрь 2025 Декабрь 2025

Источник: AWS Blog; Amazon Science.[9][8][11]

Генеративные модели

Nova Canvas — модель генерации изображений. Поддерживает текстовый и графический ввод (PNG, JPEG). Выходное разрешение — до 4,19 млн пикселей (например, 2048×2048 или 2816×1536 пикселей). Максимальная длина промпта — 1024 символа. Поддерживаются операции inpainting (замена области изображения) и outpainting (расширение изображения за его границы).[2][4]

Nova Reel — модель генерации видео. Выходное разрешение: 1280×720 при 24 кадрах в секунду. Длительность генерируемого видео — до 6 секунд. Поддерживается управление движением камеры (camera control). Доступ осуществляется через асинхронный API (Asynchronous Invoke Model API).[2][4]

Речевые модели

Nova Sonic (апрель 2025) — речевая модель с двунаправленным потоковым API (bidirectional stream API). Поддерживает функциональные вызовы (function calling) и заземление на корпоративных данных через Retrieval‑Augmented Generation (RAG, генерация с привлечением внешних знаний). Функция водяного знака (watermarking) встроена по умолчанию. Максимальная продолжительность соединения — 8 минут с возможностью возобновления; максимум 20 одновременных соединений на клиента (значение по умолчанию).[7][15][2]

Nova 2 Sonic (декабрь 2025) — следующее поколение речевой модели с улучшенным распознаванием коротких высказываний, телефонного аудио (8 кГц) и акцентов.[10]

Оценка и бенчмарки

Оценка моделей Nova проводилась с использованием автоматизированных бенчмарков, включая подход «LLM‑as‑a‑judge» (использование языковой модели в качестве оценщика). По данным исследования HKU SPACE AI Hub, метрика Arena‑Hard‑Auto демонстрирует 98,6 % корреляцию с оценками экспертов.[21][22]

Бенчмарки первого поколения

Данные из технического отчёта arXiv:2506.12103 (условия: результаты разработчиков моделей‑конкурентов, опубликованные на момент подготовки отчёта):[1]

Бенчмарк Nova Pro Nova Lite Nova Micro Claude 3.5 Sonnet (Oct 2024) GPT‑4o (Nov 2024)
MMLU (5‑shot) 80,5 77,6
MATH (4‑shot) 73,3 69,3
IFEval 87,5 87,2
MT‑Bench (text) 79,7 77,7 76,7 77,5
MT‑Bench (multimodal) 63,7 60,7 61,6 55,0

Источник: arXiv:2506.12103, таблица 2.1.1.[1]

Результаты показывают иерархию производительности внутри семейства (Premier > Pro > Lite > Micro). Разрыв наиболее заметен в категориях математики (Math) и рассуждений (Reasoning); в задачах ролевого взаимодействия (Roleplay) и извлечения информации (Extraction) младшие модели показывают результаты, близкие к старшим.[22]

Бенчмарки второго поколения (Nova 2)

Данные из технического отчёта Amazon Nova 2 (условия: internal measurements, 0‑shot / CoT где указано):[11]

Бенчмарк Nova 2 Lite Nova 2 Pro Claude Haiku 4.5 GPT‑5 Mini Gemini 2.5 Flash
MMLU‑Pro (acc) 80,9 81,6 80,0 83,7 83,2
GPQA‑Diamond (acc) 79,6 81,4 73,0 82,3 82,8
AIME 2025 (acc) 91,0 92,3 80,7 91,1 72,0
LongCodeBench 1M (acc) 84,0 84,0 78,0

Источник: Amazon Nova 2 Technical Report, таблица 1.[11]

Агентные бенчмарки (Nova 2 Pro): SWE‑Bench Verified — 70,0 %; τ²‑bench Verified Telecom — 92,7 %.[11]

Мультимодальные бенчмарки (Nova 2 Omni): VideoMME — 77,9 %; MMMU Pro — 61,4 %.[11]

При оценке в задачах технической поддержки Nova 2 Lite набрала 9,63 ± 0,27 по десятибалльной шкале в метрике «Идентификация проблемы» (Problem Identification), значительно опередив Nova Lite первого поколения (8,57 ± 0,46).[23]

Примечание. При сопоставлении результатов с конкурирующими моделями необходимо учитывать, что условия промптинга, версии моделей и даты снятия метрик могут различаться. Бенчмарки первого и второго поколений получены из самоотчётов Amazon; независимые верификации (FloTorch, Artificial Analysis) в целом подтверждают заявленное соотношение цена/производительность, но по отдельным метрикам точности фиксируют отставание от ведущих конкурентов.[22]

Скорость вывода

По внутренним замерам Amazon (internal, через Bedrock API):[1][11]

Модель Скорость вывода (токенов/с)
Nova Micro ≈210
Nova Lite ≈157
Nova Pro ≈100
Nova 2 Omni >200

Стоимость использования

Все модели доступны через Amazon Bedrock по модели оплаты за количество обработанных токенов (данные на март 2026 года):[2]

Модель Входные токены (USD / 1M) Выходные токены (USD / 1M)
Nova Micro $0,035 $0,14
Nova Lite ≈$0,06 ≈$0,24
Nova Pro $0,80 $3,20
Nova Premier $2,50 $12,50

Для сравнения: Anthropic Claude 3.5 Sonnet на момент релиза Nova тарифицировался по $6,00 / 1M входных и $30,00 / 1M выходных токенов.[22]

Кастомизация и дообучение

Инфраструктура AWS предоставляет несколько методов адаптации базовых моделей Nova под узкоспециализированные домены. Основным инструментом для этого во втором поколении выступает среда Amazon Nova Forge.[8][17]

Continued Pre‑Training (CPT) и Mid‑Training

Nova Forge открывает доступ к промежуточным чекпоинтам обучения моделей (например, pretraining‑text‑RD и pretraining‑text‑CE). Это позволяет продолжать самообучение (self‑supervised learning) на массивах корпоративных данных с аккуратным подбором скорости обучения (learning rate) для предотвращения катастрофического забывания (catastrophic forgetting).[24][25]

Parameter‑Efficient Fine‑Tuning (PEFT)

Обновление только небольшого подмножества весов модели через адаптеры низкого ранга — Low‑Rank Adaptation (LoRA)[26]. Этот подход существенно снижает требования к вычислительным ресурсам по сравнению с полным дообучением (full fine‑tuning). Поддерживается мультимодальный fine‑tuning для Nova Lite и Pro.[17]

Reinforcement Fine‑Tuning (RFT)

Пользовательские модели могут быть дополнительно дообучены методами с подкреплением на базе специфических для отрасли метрик вознаграждения, в том числе с использованием другой LLM в качестве модели‑судьи (LLM‑as‑a‑judge).[27]

Дистилляция моделей (Model Distillation)

Функция Model Distillation позволяет использовать Nova Premier или Nova Pro в качестве модели‑учителя (teacher model) для обучения меньших моделей‑учеников (student models) — Nova Lite и Nova Micro. Это снижает вычислительные затраты на инференс при сохранении существенной доли качества крупной модели.[2][6]

Применение и интеграция

Модели Nova интегрированы в вычислительные сервисы Amazon (AWS Step Functions, AWS Lambda, Amazon Q Developer). Основные задокументированные сценарии применения:[2][1]

Агентные рабочие процессы (Agentic Workflows)

Многошаговое выполнение задач с использованием Bedrock Agents и вызовом внешних инструментов (function calling). Используя архитектурный паттерн ReAct (Reasoning and Acting) в связке с фреймворками типа LangGraph, модели Nova координируют аналитику баз данных, формируют SQL‑запросы из естественного языка и управляют многосоставными процессами. Nova Act обеспечивает автоматизацию браузерных UI‑workflow с заявленной надёжностью 90 % на ранних пользовательских задачах.[28][8]

Генерация с привлечением внешних знаний (RAG)

Интеграция с Bedrock Knowledge Bases для заземления (grounding) ответов на корпоративных данных. Модели Nova 2 поддерживают нативный веб‑поиск с подтверждением (web grounding) как встроенный инструмент.[1][9]

Обработка документов

Поддерживаемые форматы входных документов: PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD (кроме Nova Micro, который принимает только текстовый ввод). Nova Premier способна обрабатывать видео длительностью до 90 минут в рамках единого запроса.[2][6]

Генерация и отладка кода

Поддерживаемые языки программирования: Python, Java, JavaScript, C#, TypeScript, SQL.[20]

Речевые интерфейсы

Nova Sonic и Nova 2 Sonic применяются для построения голосовых агентов с поддержкой реального времени, интегрированных с Amazon Connect.[10][7]

Оценка моделей (LLM‑as‑a‑judge)

Nova применяется как модель‑судья при оценке выходов других генеративных моделей на платформе Amazon SageMaker.[29]

Ограничения и открытые проблемы

  • Закрытость архитектуры. Amazon не раскрывает число параметров, детальные архитектурные решения и состав обучающих данных, что существенно ограничивает независимую воспроизводимость результатов. Веса моделей Nova не предоставляются для скачивания или развёртывания вне инфраструктуры AWS (on‑premise развёртывание невозможно).[1][2]
  • Выходной лимит. Максимальное количество выходных токенов для всех моделей понимания ограничено 10 тыс. токенов, что может быть недостаточным для задач генерации длинных документов.[2]
  • Ограничения RFT. Reinforcement Fine‑Tuning не поддерживает многооборотные (multi‑turn) диалоги и мультимодальные данные; рекомендуемая доля положительных примеров в наборе данных — не менее 5 %.[27]
  • Ограничения Nova Sonic. Максимальная длительность соединения — 8 минут; максимум 20 одновременных соединений на клиента по умолчанию.[2]
  • Региональная доступность. Nova Premier доступна только в одном регионе (US East N. Virginia) без поддержки кросс‑регионального инференса; Nova 2‑модели имеют ограниченный список регионов развёртывания.[2]
  • Чувствительность метрик. Оценки на синтетических бенчмарках не всегда коррелируют с качеством работы в производственных условиях (production), где критичны строгое следование корпоративным политикам и отсутствие галлюцинаций в многоступенчатых выводах.[22][23]
  • Галлюцинации. Модели демонстрируют типичные для LLM ограничения: возможны фактические ошибки в генерируемых ответах. Для снижения рисков рекомендуется использование Bedrock Guardrails и RAG.[1]
  • Сравнительная объективность бенчмарков. Amazon приводит сравнения с конкурирующими моделями на основе опубликованных самими разработчиками данных, что не всегда обеспечивает единую контролируемую экспериментальную базу.[22]

Этические и регуляторные аспекты

AWS декларирует следование принципам ответственного ИИ (Responsible AI) при разработке Nova‑моделей. Конкретные меры безопасности включают:[20][15]

  • Встроенная модерация контента (content moderation).
  • Водяные знаки (watermarking) для аудио‑выходов Nova Sonic.
  • Оценка по категориям риска: безопасность (safety), конфиденциальность (privacy), достоверность (veracity), прозрачность (transparency), а также распространение ХБРЯ (химического, биологического, радиологического и ядерного) оружия (CBRN) и наступательные кибероперации.
  • Интеграция с Amazon Bedrock Guardrails для фильтрации входных и выходных данных.
  • Оценка модели Nova Premier на соответствие Amazon Frontier Model Safety Framework.
  • Red teaming — внутреннее и внешнее тестирование на устойчивость к атакам (по данным технического отчёта, 307 техник).
  • Оценка модерации контента по метрике F1: 85,84 на бенчмарке Aegis (по данным технического отчёта).[1]

Карточки ИИ‑сервисов (AI Service Cards) для Nova Micro, Lite, Pro, Premier и Sonic опубликованы на docs.aws.amazon.com как документация по ответственному применению.[20][15]

Перспективы и направления исследований

Семейство Nova 2 обозначает переход к моделям с расширенными возможностями рассуждения (extended thinking / reasoning), сопоставимым по концепции с цепочкой мысли (Chain‑of‑Thought, CoT) и аналогичными механизмами в других семействах моделей. Встроенный веб‑поиск и интерпретатор кода как нативные инструменты (а не сторонние плагины) представляют архитектурный сдвиг в направлении агентных систем.[9][8]

Направления дальнейшего развития, обозначенные в публичных материалах Amazon:

  • Расширение мультимодальности (модель Omni как унифицированная «всё‑во‑всё» архитектура).
  • Гибридные рассуждения (hybrid reasoning) с адаптивной глубиной в зависимости от сложности задачи.
  • Открытое обучение на пользовательских данных (Nova Forge) на всех стадиях предобучения.
  • Дистилляция для edge‑устройств.
  • Расширение инструментария безопасности (safety toolkit).[8][11]

Тематика Amazon Nova AI Challenge, проводимого AWS среди университетских команд, включает направления автоматизированного состязательного тестирования, выравнивания безопасности (safety alignment) и многооборотных атак (multi‑turn jailbreaks), что свидетельствует об инвестициях в надёжность модельного семейства.[8]

См. также

Литература

Ссылки

Примечания

  1. 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10 1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,18 1,19 Amazon Artificial General Intelligence. The Amazon Nova Family of Models: Technical Report and Model Card. arXiv:2506.12103v1, 2025. https://arxiv.org/abs/2506.12103
  2. 2,00 2,01 2,02 2,03 2,04 2,05 2,06 2,07 2,08 2,09 2,10 2,11 2,12 2,13 AWS Documentation. What is Amazon Nova?. Amazon Nova User Guide. https://docs.aws.amazon.com/nova/latest/userguide/what-is-nova.html
  3. 3,0 3,1 3,2 AWS. Introducing Amazon Nova foundation models. AWS News Blog, 3 декабря 2024. https://aws.amazon.com/blogs/aws/introducing-amazon-nova-frontier-intelligence-and-industry-leading-price-performance/
  4. 4,0 4,1 4,2 About Amazon. 11 key announcements from AWS re:Invent 2024. aboutamazon.com, 2024. https://www.aboutamazon.com/news/aws/amazon-nova-ai-canvas-reel-aws-reinvent
  5. Futurum Research. Amazon unveils Nova models, chips, and tools at re:Invent. futurumgroup.com, 2025. https://futurumgroup.com/press-release/amazon-unveils-models-chips-and-tools-at-reinvent-boosting-its-ai-credentials/
  6. 6,0 6,1 6,2 6,3 AWS. Amazon Nova Premier — Our most capable model for complex tasks and teacher for model distillation. AWS Blog, 29 апреля 2025. https://aws.amazon.com/blogs/aws/amazon-nova-premier-our-most-capable-model-for-complex-tasks-and-teacher-for-model-distillation/
  7. 7,0 7,1 7,2 AWS. Announcing Amazon Nova Sonic. AWS What's New, 7 апреля 2025. https://aws.amazon.com/about-aws/whats-new/2025/04/amazon-nova-sonic-speech-to-speech-conversations-bedrock/
  8. 8,0 8,1 8,2 8,3 8,4 8,5 8,6 8,7 8,8 Amazon. Amazon introduces new frontier Nova models. aboutamazon.com, 2 декабря 2025. https://www.aboutamazon.com/news/aws/aws-agentic-ai-amazon-bedrock-nova-models
  9. 9,0 9,1 9,2 9,3 9,4 AWS. Introducing Amazon Nova 2 Lite — a fast, cost‑effective reasoning model. AWS Blog, декабрь 2025. https://aws.amazon.com/blogs/aws/introducing-amazon-nova-2-lite-a-fast-cost-effective-reasoning-model/
  10. 10,0 10,1 10,2 10,3 AWS. Introducing Amazon Nova 2 Sonic — next‑generation speech‑to‑speech model for conversational AI. AWS Blog, декабрь 2025. https://aws.amazon.com/blogs/aws/introducing-amazon-nova-2-sonic-next-generation-speech-to-speech-model-for-conversational-ai/
  11. 11,0 11,1 11,2 11,3 11,4 11,5 11,6 11,7 11,8 Amazon Artificial General Intelligence. Amazon Nova 2: Multimodal Reasoning and Generation Models — Technical Report and Model Card. Amazon Science, 16 февраля 2026. https://www.amazon.science/publications/amazon-nova-2-multimodal-reasoning-and-generation-models
  12. 12,0 12,1 Vaswani, A. et al. (2017). Attention Is All You Need. NeurIPS. https://arxiv.org/abs/1706.03762
  13. 13,0 13,1 13,2 13,3 13,4 AlphaXiv / Amazon Science. The Amazon Nova Family of Models: Model Architecture and Training Methodology. alphaxiv.org, 2025. https://www.alphaxiv.org/overview/2506.12103v1
  14. 14,0 14,1 Rombach, R. et al. (2022). High‑Resolution Image Synthesis with Latent Diffusion Models. CVPR. https://arxiv.org/abs/2112.10752
  15. 15,0 15,1 15,2 15,3 AWS. Amazon Nova Sonic — AWS AI Service Cards. docs.aws.amazon.com. https://docs.aws.amazon.com/ai/responsible-ai/nova-sonic/overview.html
  16. LinkedIn (инженеры AWS). Announcing Managed Tiered Checkpointing. linkedin.com, декабрь 2025. https://www.linkedin.com/posts/hajamaideen_announcing-managed-tiered-checkpointing-for-activity-7402077620147798016-njZo
  17. 17,0 17,1 17,2 AWS. Announcing Amazon Nova customization in Amazon SageMaker AI. aws.amazon.com, 2025. https://aws.amazon.com/blogs/aws/announcing-amazon-nova-customization-in-amazon-sagemaker-ai/
  18. Ouyang, L. et al. (2022). Training language models to follow instructions with human feedback (InstructGPT). NeurIPS. https://arxiv.org/abs/2203.02155
  19. 19,0 19,1 Rafailov, R. et al. (2023). Direct Preference Optimization: Your Language Model is Secretly a Reward Model. NeurIPS. https://arxiv.org/abs/2305.18290
  20. 20,0 20,1 20,2 20,3 20,4 AWS. Amazon Nova Micro, Lite, Pro, and Premier — AWS AI Service Cards. docs.aws.amazon.com. https://docs.aws.amazon.com/ai/responsible-ai/nova-micro-lite-pro/overview.html
  21. HKU SPACE AI Hub. Benchmarking Amazon Nova: A comprehensive analysis through MT‑Bench and Arena‑Hard‑Auto. aihub.hkuspace.hku.hk, 2025. https://aihub.hkuspace.hku.hk/benchmarking-amazon-nova-a-comprehensive-analysis-through-mt-bench-and-arena-hard-auto/
  22. 22,0 22,1 22,2 22,3 22,4 22,5 AWS Machine Learning Blog. Benchmarking Amazon Nova: A Comprehensive Analysis Through MT‑Bench and Arena‑Hard. aws.amazon.com, 2025. https://aws.amazon.com/blogs/machine-learning/benchmarking-amazon-nova-a-comprehensive-analysis-through-mt-bench-and-arena-hard-auto/
  23. 23,0 23,1 AWS Machine Learning Blog. Real‑world reasoning: How Amazon Nova Lite 2.0 handles complex customer support scenarios. aws.amazon.com, 2025. https://aws.amazon.com/blogs/machine-learning/real-world-reasoning-how-amazon-nova-lite-2-0-handles-complex-customer-support-scenarios/
  24. AWS Documentation. Continued Pre‑Training and Mid‑Training — Amazon Nova. docs.aws.amazon.com. https://docs.aws.amazon.com/nova/latest/nova2-userguide/nova-forge-cpt.html
  25. AWS Documentation. Continued Pre‑Training and Mid‑Training. Amazon SageMaker Developer Guide. https://docs.aws.amazon.com/sagemaker/latest/dg/nova-forge-cpt.html
  26. Hu, E.J. et al. (2021). LoRA: Low‑Rank Adaptation of Large Language Models. https://arxiv.org/abs/2106.09685
  27. 27,0 27,1 AWS Documentation. Reinforcement Fine‑Tuning (RFT) with Amazon Nova models. Amazon SageMaker Documentation. https://docs.aws.amazon.com/sagemaker/latest/dg/nova-reinforcement-fine-tuning.html
  28. AWS Machine Learning Blog. Natural language‑based database analytics with Amazon Nova. aws.amazon.com, 2025. https://aws.amazon.com/blogs/machine-learning/natural-language-based-database-analytics-with-amazon-nova/
  29. AWS Machine Learning Blog. Evaluating generative AI models with Amazon Nova LLM‑as‑a‑judge on Amazon SageMaker AI. aws.amazon.com, 2025. https://aws.amazon.com/blogs/machine-learning/evaluating-generative-ai-models-with-amazon-nova-llm-as-a-judge-on-amazon-sagemaker-ai/