Pular para o conteúdo
Tecnologia

A nova IA que supera engenheiros humanos — e redefine o futuro da programação

Claude Opus 4.5, lançado pela Anthropic, atingiu um marco histórico: programar melhor que candidatos reais em testes profissionais, superar GPT-5.1 e Gemini 3 Pro e dominar benchmarks de engenharia de software. Com mais raciocínio, mais contexto e custo muito baixo, o modelo inaugura uma nova era para a computação.
Por

Tempo de leitura: 3 minutos

Durante meses, especialistas especularam que Anthropic preparava um salto significativo em inteligência artificial. Agora, com Claude Opus 4.5, essas expectativas foram superadas. O modelo não apenas venceu outras IAs de ponta — como GPT-5.1 e Gemini 3 Pro — mas também superou engenheiros humanos em testes reais de programação. Sua capacidade de raciocinar, revisar código complexo e lidar com projetos inteiros sugere mudanças profundas no papel da IA no desenvolvimento de software.

Uma IA que derrota humanos (e outras IAs) em programação

Claude Opus 4.5 foi submetido a um exame profissional utilizado para selecionar engenheiros. O teste exigia resolver problemas avançados em Python, em no máximo duas horas.
O resultado surpreendeu: o modelo obteve pontuação superior à de todos os participantes humanos, combinando tentativas paralelas e raciocínio estruturado para chegar às melhores soluções.
Segundo a Anthropic, não se trata de marketing — os dados foram auditados internamente e comparados com resultados de seleções reais.

Uma geração projetada para entender e transformar código

Opus 4.5 é descrito pela Anthropic como “o melhor modelo do mundo para programação, agentes e computação geral”.
Nos benchmarks SWE-bench — referência para medir a capacidade de resolver problemas reais de software — ele superou GPT-5.1, Gemini 3 Pro e até o Claude Sonnet 4.5.
O modelo não apenas corrige erros:

  • refatora código complexo,

  • migra repositórios inteiros,

  • revisa com precisão técnica,

  • desenvolve ferramentas completas a partir do zero.

Um dos diferenciais é o raciocínio profundo. Opus 4.5 desmonta enunciados ambíguos, cria hipóteses, testa-as em paralelo e organiza o problema como um engenheiro experiente. A janela de contexto de 200.000 tokens permite incluir repos, documentação, longas conversas e exemplos sem perder coerência.

Opus 4.5
© Anthropic

O modo “effort”: pensar mais fundo ou mais rápido

Uma novidade interessante é o parâmetro effort (“esforço”).
Com ele, o usuário escolhe entre velocidade ou profundidade.
No modo máximo, o modelo dedica mais tempo para testar múltiplas rotas e selecionar a ideal.
Para tarefas urgentes, basta reduzir o esforço e priorizar entregas rápidas.
A Anthropic afirma que essa combinação explica o desempenho superior em provas cronometradas.

Muito além de codificar: um assistente completo

Embora focado em engenharia, Opus 4.5 apresentou avanços marcantes em tarefas de escritório.
Segundo a Anthropic, ele melhora:

  • 20% em precisão de análises financeiras,

  • 15% em eficiência no Excel.

Também organiza bases de dados, monta apresentações completas, redige relatórios longos, planeja estratégias e coordena fluxos de trabalho como um agente autônomo — um passo crucial para automações de larga escala.

O golpe final: potência máxima por custo mínimo

O preço também surpreendeu: 5 dólares por milhão de tokens — extremamente baixo para um modelo topo de linha.
Essa relação desempenho/custo pode pressionar Google e OpenAI a rever suas estratégias, atraindo empresas que usam IA intensivamente.

Um recado claro para o setor tecnológico

Disponível na API, na nuvem e no app de Claude, Opus 4.5 marca um divisor de águas.
Não substitui engenheiros imediatamente, mas muda o cenário: a IA deixa de ser apenas assistente e passa a atuar como colega capaz de programar, documentar e tomar decisões com precisão inédita.
E, ao que tudo indica, este avanço não é o fim — é apenas o começo de uma nova era no desenvolvimento de software.

Partilhe este artigo

Artigos relacionados