Sam Altman acabou de desenhar GPT-5.4uma atualização disponível nas versões Pró E Pensamento. Com um contexto de 1 milhão de fichas e eficiência formidável em tarefas complexas, a OpenAI visa claramente o mundo do trabalho.

OpenAI acaba de quebrar o silêncio com o lançamento de GPT-5.4. Esta não é apenas mais uma iteração, é uma reorganização do seu catálogo.

O modelo está agora disponível em três versões: uma versão padrão, uma versão Pró construído para desempenho e uma versão Pensamento especializado em raciocínio complexo.

A OpenAI quer transformar sua IA de conversação em uma verdadeira ferramenta de produção. A editora ChatGPT anuncia assim impressionantes ganhos de eficiência, afirmando que GPT-5.4 resolve os mesmos problemas que seus antecessores com significativamente menos tokens.

A grande novidade técnica é a explosão da janela de contexto. Passamos para 1 milhão de fichas na API (ou seja, aproximadamente 750.000 palavras).

Grave desempenho de acordo com OpenAI

Em termos de benchmarks, GPT-5.4 claro que tem argumentos. O modelo recebeu nota 83% para o teste PIBval do OpenAI, que mede a aptidão para tarefas intelectuais complexas. Melhor ainda, ele domina o ranking Agentes APEX da Mercor, projetado para avaliar habilidades em direito e finanças.

Do lado da confiabilidade, a OpenAI aborda o grande mal da IA: as alucinações. Erros factuais em declarações isoladas diminuem 33% comparado com GPT-5.2. Ao longo de toda a resposta, a probabilidade de erro cai em 18%. Ainda não chegamos ao zero defeito, mas a tendência é animadora para quem exige precisão.

Pesquisa e segurança de ferramentas

Para os desenvolvedores, a mudança mais inteligente é chamada Pesquisa de ferramentas. Até agora, quando conectávamos uma IA a ferramentas externas (pesquisa na web, calculadora, bancos de dados), tínhamos que “explicar” como todas as ferramentas funcionavam com cada solicitação. Resultado? Consumo louco de tokens. Agora o modelo irá buscar a definição da ferramenta somente quando necessário.

Por fim, a OpenAI trabalhou na segurança da versão Pensamento. O risco dos modelos que “pensam” (o famoso Cadeia de Pensamento), é que eles possam aprender a esconder seu real raciocínio para enganar o usuário. Novos testes de benchmark mostram que GPT-5.4 é incapaz de esconder a sua lógica interna. Claramente, ainda podemos monitorar o que está acontecendo em nossa “cabeça” digital.


Quer encontrar os melhores artigos do Frandroid no Google Notícias? Você pode seguir Frandroid no Google Notícias com um clique.

Fonte

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *