Enquanto Google e OpenAI lutam com decimais, Anthropic faz uma tangente interessante com Claude Opus 4.5. No programa: gestão de esforços inédita, integração nativa em Excel e Chrome e, acima de tudo, capacidade de raciocínio que supera os modelos anteriores.

Em 12 de novembro, OpenAI anunciou GPT-5.1. No dia 18, o Google respondeu com Gêmeos 3. Pensávamos que tínhamos atingido o teto de vidro deste ano.

Só que Claude Sonnet 4.5, lançado em setembro, resistiu. Melhor do que isso: nas comunidades de desenvolvedores, ele ainda se manteve firme contra os novos gigantes, principalmente graças à sua formidável ferramenta Claude CLI. E a Antrópica deixou o melhor para o final.

Aqui está Claude Opus 4.5. E não é apenas uma atualização incremental para torná-lo bonito nos comunicados à imprensa. A Anthropic acaba de revisar seu exemplar em profundidade. A promessa? Uma IA que não apenas prevê a próxima palavra, mas planeja, codifica e, acima de tudo, nunca para.

Chega de “fim da discussão”

Essa foi a coisa mais frustrante sobre Claude. Você estava no meio de uma intensa sessão de trabalho e bam: “Conversa muito longa”. Tivemos que começar do zero. Acabou.

A Anthropic integrou o mecanismo que tornou sua ferramenta de desenvolvedor (Claude CLI) bem-sucedida diretamente na web e em aplicativos móveis. O princípio é inteligente: quando a janela de contexto está cheia, Claude não bloqueia mais. Ele resume automaticamente o que foi dito acima em segundo plano, “comprime” as memórias antigas para liberar espaço e continua a discussão.

Dianne Na Penn, gerente de produto, é clara: “ As janelas de contexto não são suficientes. Saber o que esquecer é tão importante quanto saber o que lembrar“. Concretamente? Agora você pode ter discussões infinito. A IA mantém o fio vermelho sem saturar sua RAM. É muito estúpido, mas com o uso muda tudo.

O rei do código (e da malandragem)

Do lado técnico, é bastante violento. No benchmark SWE-Bench verificadoque é referência em desenvolvimento de software, o Opus 4.5 é o primeiro modelo do mundo a ultrapassar a fasquia 80%. Para se ter uma ideia, este é o limite onde a IA para de apenas sugerir código e começa a resolver tickets complexos de A a Z sem interromper a produção.

Mas o que mais me interessa é a “delicadeza” do raciocínio. Veja este exemplo fascinante dado pela Anthropic: a IA, que desempenha o papel de um agente de companhia aérea, é solicitada a modificar uma passagem “Econômica” (normalmente não modificável). Uma IA clássica teria recitado estupidamente os T&Cs para você: “ Desculpe, é proibido“.

A realidade? O Opus 4.5 encontrou uma falha lógica (e legal): primeiro atualizei o bilhete em classe superior (que é autorizada), para Próximo alterar a data do voo (que passa a ser autorizada com o novo bilhete). É brilhante. Este é exatamente o tipo de raciocínio lateral que você esperaria de um ser humano inteligente.

O parâmetro “Esforço”: você assume o controle

Até agora, sofremos com a velocidade do modelo. Com o Opus 4.5, Anthropic introduz um cenário ” Esforço “ via API.

É simples:

  • Modo baixo: a IA responde rapidamente, consome pouco.
  • Modo alto: a IA reserva um tempo para “pensar”, explora vários caminhos, verifica seus erros.

No modo “Esforço Máximo”, o Opus 4.5 supera Soneto 4.5 em 4,3 pontos ao usar 48% menos tokens para alcançar o mesmo resultado. Para que ? Porque evita entrar em delírios alucinatórios que devem então ser corrigidos. Ele pensa antes de escrever.

Antrópico joga a carta da maturidade

Então, Claude Opus 4.5 enterra o Gemini 3? É difícil dizer sem um teste comparativo ao longo do tempo. Mas a estratégia da Antrópica é clara: eficiência operacional acima de tudo.

Link do YouTube Inscreva-se no Frandroid

O preço continua sendo o cerne da questão. TEM 5 dólares por milhão de entrada de tokens E 25 dólares foraé uma ferramenta de luxo. Mas a integração nativa em Excel E Cromo (disponível para contas Team/Enterprise) mostra que eles têm como alvo os profissionais.

Link do YouTube Inscreva-se no Frandroid


Fonte

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *