Claude (Anthropic) (PT)

Claude é uma família de grandes modelos de linguagem (LLMs) multimodais desenvolvidos pela empresa de pesquisa Anthropic.

Os modelos Claude, construídos sobre a arquitetura transformer, são posicionados como assistentes de IA focados em segurança, utilidade e honestidade. A principal característica de seu desenvolvimento é a metodologia Constitutional AI ("IA Constitucional"), que visa criar sistemas controláveis e eticamente alinhados.

História e filosofia

Fundação e missão da Anthropic

A Anthropic foi fundada em 2021 por ex-funcionários seniores da OpenAI, incluindo os irmãos Dario^[1] e Daniela Amodei^[2]. O motivo da saída foram divergências com a liderança da OpenAI sobre a direção do desenvolvimento, especificamente devido a preocupações de que a parceria com a Microsoft e a crescente comercialização pudessem comprometer o compromisso com a segurança da IA.

A missão da Anthropic é "desenvolver e manter IA avançada para o benefício a longo prazo da humanidade". A empresa está registrada como uma Public Benefit Corporation (PBC) nos EUA, o que a obriga legalmente a equilibrar interesses financeiros com o bem público. Essa abordagem é reforçada por uma estrutura de governança única com o Long-Term Benefit Trust (LTBT), um órgão independente que tem o poder de influenciar a composição do conselho de administração para garantir o compromisso com a missão de segurança.

Filosofia: HHH e a IA Constitucional

Na base do comportamento dos modelos Claude está a fórmula HHH: Helpful, Honest, and Harmless (Útil, Honesto e Inofensivo). Para implementar esses princípios, a Anthropic desenvolveu sua própria metodologia de treinamento — a Constitutional AI (CAI).

Diferente do RLHF tradicional (aprendizagem por reforço com feedback humano), onde anotadores humanos avaliam diretamente as respostas do modelo, a CAI utiliza uma "constituição" — um conjunto de princípios éticos explícitos, com base nos quais o modelo aprende a avaliar e corrigir suas próprias respostas de forma autônoma. Isso torna o processo mais escalável, transparente e controlável.

Arquitetura e tecnologias-chave

Baseada na arquitetura Transformer

Assim como outros LLMs modernos, Claude utiliza uma arquitetura transformer-decoder, que gera texto de forma autorregressiva, token por token. No entanto, a Anthropic introduziu melhorias significativas visando aumentar o desempenho, a segurança e a controlabilidade.

IA Constitucional (CAI)

O processo de treinamento com a CAI ocorre em duas etapas:

Fase de aprendizado supervisionado (Supervised Learning): O modelo gera respostas para as solicitações e, em seguida, outro modelo-crítico, guiado pela "constituição", as avalia e propõe correções. A partir dessas correções, o modelo original é ajustado.
Fase de aprendizado por reforço com feedback de IA (RLAIF): O modelo gera pares de respostas, e o modelo-crítico seleciona a melhor delas com base na "constituição". Esses dados são usados para treinar um modelo de preferência (reward model), que então serve como sinal para ajustar o modelo principal usando algoritmos de reforço.

Contexto longo e multimodalidade

Uma das principais vantagens do Claude é sua janela de contexto muito grande. Começando com 100.000 tokens no Claude 2, ela foi aumentada para 200.000 no Claude 3 e para 1-2 milhões de tokens nas versões 3.5 e 4. Isso permite que os modelos analisem livros inteiros, bases de código ou transcrições de várias horas em uma única solicitação.

A partir da família Claude 3, os modelos se tornaram multimodais, ganhando a capacidade de processar imagens junto com texto.

Raciocínio híbrido e capacidades de agente

A partir das versões Claude 3.7 e 4, foi introduzida uma arquitetura de raciocínio híbrido. Ela permite que os modelos alternem entre dois modos:

Respostas rápidas: Modo padrão para tarefas simples.
Raciocínio estendido (Extended Thinking): Para tarefas complexas, o modelo faz uma pausa para "pensar", executando etapas internas de raciocínio, chamando ferramentas (pesquisa na web, execução de código) e formulando uma resposta mais fundamentada. Isso torna o processo mais transparente e confiável.

Evolução dos modelos Claude

Claude 1 e 2 (2023)

Claude 1 (março de 2023): Primeira versão pública. Apresentou o modelo Claude Instant para tarefas rápidas e uma versão principal com uma janela de contexto de 100.000 tokens.
Claude 2 (julho de 2023): Versão aprimorada, que se tornou publicamente acessível por meio de uma interface web. Mostrou melhorias significativas em programação (71% no Codex HumanEval) e matemática. Em novembro de 2023, foi lançada a versão Claude 2.1 com uma janela de contexto de 200.000 tokens.

Claude 3 (março de 2024)

A família que, pela primeira vez, superou o GPT-4 em vários benchmarks.

Versões: Haiku (a mais rápida), Sonnet (balanceada) e Opus (a mais poderosa).
Inovações-chave: Introdução da multimodalidade (análise de imagens), melhoria significativa no raciocínio e na programação, e redução de recusas injustificadas. O Opus alcançou 86,8% no MMLU.

Claude 3.5 (junho de 2024)

Uma geração intermediária, focada em aumentar a inteligência e a velocidade.

Claude 3.5 Sonnet: Em termos de desempenho, superou o Claude 3 Opus, sendo duas vezes mais rápido. Introduziu a função Artifacts ^[3]— um painel interativo para trabalhar com código ou documentos gerados.

Claude 3.7 e Claude 4 (2025)

Geração focada em capacidades de agente e raciocínio complexo.

Claude 3.7 Sonnet (fevereiro de 2025): Introdução do raciocínio híbrido, que permitiu ao modelo combinar respostas rápidas com raciocínios profundos e passo a passo.
Claude 4 (maio de 2025): Família principal (Opus 4 e Sonnet 4) com foco em agentes de IA autônomos. Os modelos são capazes de executar tarefas de múltiplos estágios, interagir com o sistema de arquivos (via Computer Use), chamar ferramentas e manter sessões de trabalho prolongadas (até várias horas) sem degradação de desempenho. O Opus 4 alcançou 72,5% no complexo benchmark de programação SWE-bench.

Tabela resumo das gerações do Claude

Evolução das características-chave dos modelos Claude
Geração	Ano de lançamento	Versões principais	Janela de contexto máx.	Inovações-chave
Claude 1	2023	Claude, Instant	100.000 tokens	Primeiro lançamento público, contexto grande.
Claude 2	2023	Claude 2, 2.1	200.000 tokens	Melhorias em programação e raciocínio, disponibilidade pública.
Claude 3	2024	Opus, Sonnet, Haiku	200.000+ tokens	Multimodalidade (imagens), superação do GPT-4.
Claude 3.5	2024	Sonnet, Haiku	200.000+ tokens	Aumento de velocidade e inteligência, função "Artifacts".
Claude 4 / 3.7	2025	Opus, Sonnet	200.000+ tokens	Raciocínio híbrido, capacidades de agente, uso de ferramentas.

Aplicação e disponibilidade

Os modelos Claude estão disponíveis através de vários canais:

Interface web claude.ai: Oferece acesso gratuito (ao modelo Sonnet) e assinaturas pagas (Pro, Max) com acesso a modelos mais poderosos (Opus) e limites expandidos.
API para desenvolvedores: A Anthropic fornece uma API comercial que permite integrar o Claude em aplicativos de terceiros. Os preços variam dependendo do modelo (Haiku é o mais barato, Opus é o mais caro).
Plataformas de nuvem: O Claude está disponível através do Amazon Bedrock e do Google Cloud Vertex AI, o que simplifica seu uso em ambientes corporativos.
Integrações: O Claude está integrado em serviços populares como Slack, Notion e Quora (no chatbot Poe).

Literatura

Anthropic (2022). Constitutional AI: Harmlessness from AI Feedback. arXiv:2212.08073.
Anthropic (2023). Claude’s Constitution.
Anthropic (2024, março). Introducing the next generation of Claude.
Anthropic (2025, maio). Introducing Claude 4.

Links

Literatura

Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. arXiv:2203.02155.
Bai, Y. et al. (2022). Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback. arXiv:2204.05862.
Bai, Y. et al. (2022). Constitutional AI: Harmlessness from AI Feedback. arXiv:2212.08073.
Bulatov, A. et al. (2023). Scaling Transformer to 1M Tokens and Beyond with RMT. arXiv:2304.11062.
Jimenez, C. E. et al. (2023). SWE-bench: Can Language Models Resolve Real-World GitHub Issues?. arXiv:2310.06770.
Yuan, W. et al. (2024). Self-Rewarding Language Models. arXiv:2401.10020.
Yang, A. et al. (2024). Context Parallelism for Scalable Million-Token Inference. arXiv:2411.01783.
Miranda, L. J. V. et al. (2024). Hybrid Preferences: Learning to Route Instances for Human vs AI Feedback. arXiv:2410.19133.
Chittepu, Y. et al. (2025). Reinforcement Learning from Human Feedback with High-Confidence Safety Constraints. arXiv:2506.08266.
Yuan, W. et al. (2025). Process-based Self-Rewarding Language Models. arXiv:2503.03746.
Yang, B. et al. (2025). Long Context Windows in Generative AI: An AI Atlas Report. [4] (tech-report, open review).

Referências

↑ “Dario Amodei”. Em Wikipedia [1]
↑ “Daniela Amodei”. Em Wikipedia [2]
↑ “What Are Artifacts and How Do I Use Them? | Anthropic Help Center”.[3]

[1] “Dario Amodei”. Em Wikipedia [1]

[2] “Daniela Amodei”. Em Wikipedia [2]

[3] “What Are Artifacts and How Do I Use Them? | Anthropic Help Center”.[3]

[1]

[2]

[3]

Claude (Anthropic) (PT)

Contents

História e filosofia

Fundação e missão da Anthropic

Filosofia: HHH e a IA Constitucional

Arquitetura e tecnologias-chave

Baseada na arquitetura Transformer

IA Constitucional (CAI)

Contexto longo e multimodalidade

Raciocínio híbrido e capacidades de agente

Evolução dos modelos Claude

Claude 1 e 2 (2023)

Claude 3 (março de 2024)

Claude 3.5 (junho de 2024)

Claude 3.7 e Claude 4 (2025)

Tabela resumo das gerações do Claude

Aplicação e disponibilidade

Literatura

Links

Literatura

Referências

Navigation menu

Claude (Anthropic) (PT)

História e filosofia

Fundação e missão da Anthropic

Filosofia: HHH e a IA Constitucional

Arquitetura e tecnologias-chave

Baseada na arquitetura Transformer

IA Constitucional (CAI)

Contexto longo e multimodalidade

Raciocínio híbrido e capacidades de agente

Evolução dos modelos Claude

Claude 1 e 2 (2023)

Claude 3 (março de 2024)

Claude 3.5 (junho de 2024)

Claude 3.7 e Claude 4 (2025)

Tabela resumo das gerações do Claude

Aplicação e disponibilidade

Literatura

Links

Literatura

Referências

Navigation menu

Search