Durante meses, especialistas especularam que Anthropic preparava um salto significativo em inteligência artificial. Agora, com Claude Opus 4.5, essas expectativas foram superadas. O modelo não apenas venceu outras IAs de ponta — como GPT-5.1 e Gemini 3 Pro — mas também superou engenheiros humanos em testes reais de programação. Sua capacidade de raciocinar, revisar código complexo e lidar com projetos inteiros sugere mudanças profundas no papel da IA no desenvolvimento de software.
Uma IA que derrota humanos (e outras IAs) em programação
Claude Opus 4.5 foi submetido a um exame profissional utilizado para selecionar engenheiros. O teste exigia resolver problemas avançados em Python, em no máximo duas horas.
O resultado surpreendeu: o modelo obteve pontuação superior à de todos os participantes humanos, combinando tentativas paralelas e raciocínio estruturado para chegar às melhores soluções.
Segundo a Anthropic, não se trata de marketing — os dados foram auditados internamente e comparados com resultados de seleções reais.
Uma geração projetada para entender e transformar código
Opus 4.5 é descrito pela Anthropic como “o melhor modelo do mundo para programação, agentes e computação geral”.
Nos benchmarks SWE-bench — referência para medir a capacidade de resolver problemas reais de software — ele superou GPT-5.1, Gemini 3 Pro e até o Claude Sonnet 4.5.
O modelo não apenas corrige erros:
- refatora código complexo,
- migra repositórios inteiros,
- revisa com precisão técnica,
- desenvolve ferramentas completas a partir do zero.
Um dos diferenciais é o raciocínio profundo. Opus 4.5 desmonta enunciados ambíguos, cria hipóteses, testa-as em paralelo e organiza o problema como um engenheiro experiente. A janela de contexto de 200.000 tokens permite incluir repos, documentação, longas conversas e exemplos sem perder coerência.

O modo “effort”: pensar mais fundo ou mais rápido
Uma novidade interessante é o parâmetro effort (“esforço”).
Com ele, o usuário escolhe entre velocidade ou profundidade.
No modo máximo, o modelo dedica mais tempo para testar múltiplas rotas e selecionar a ideal.
Para tarefas urgentes, basta reduzir o esforço e priorizar entregas rápidas.
A Anthropic afirma que essa combinação explica o desempenho superior em provas cronometradas.
Muito além de codificar: um assistente completo
Embora focado em engenharia, Opus 4.5 apresentou avanços marcantes em tarefas de escritório.
Segundo a Anthropic, ele melhora:
- 20% em precisão de análises financeiras,
- 15% em eficiência no Excel.
Também organiza bases de dados, monta apresentações completas, redige relatórios longos, planeja estratégias e coordena fluxos de trabalho como um agente autônomo — um passo crucial para automações de larga escala.
O golpe final: potência máxima por custo mínimo
O preço também surpreendeu: 5 dólares por milhão de tokens — extremamente baixo para um modelo topo de linha.
Essa relação desempenho/custo pode pressionar Google e OpenAI a rever suas estratégias, atraindo empresas que usam IA intensivamente.
Um recado claro para o setor tecnológico
Disponível na API, na nuvem e no app de Claude, Opus 4.5 marca um divisor de águas.
Não substitui engenheiros imediatamente, mas muda o cenário: a IA deixa de ser apenas assistente e passa a atuar como colega capaz de programar, documentar e tomar decisões com precisão inédita.
E, ao que tudo indica, este avanço não é o fim — é apenas o começo de uma nova era no desenvolvimento de software.