Sam Altman acabou de desenhar GPT-5.4uma atualização disponível nas versões Pró E Pensamento. Com um contexto de 1 milhão de fichas e eficiência formidável em tarefas complexas, a OpenAI visa claramente o mundo do trabalho.

OpenAI acaba de quebrar o silêncio com o lançamento de GPT-5.4. Esta não é apenas mais uma iteração, é uma reorganização do seu catálogo.
O modelo está agora disponível em três versões: uma versão padrão, uma versão Pró construído para desempenho e uma versão Pensamento especializado em raciocínio complexo.
A OpenAI quer transformar sua IA de conversação em uma verdadeira ferramenta de produção. A editora ChatGPT anuncia assim impressionantes ganhos de eficiência, afirmando que GPT-5.4 resolve os mesmos problemas que seus antecessores com significativamente menos tokens.
A grande novidade técnica é a explosão da janela de contexto. Passamos para 1 milhão de fichas na API (ou seja, aproximadamente 750.000 palavras).
Grave desempenho de acordo com OpenAI
Em termos de benchmarks, GPT-5.4 claro que tem argumentos. O modelo recebeu nota 83% para o teste PIBval do OpenAI, que mede a aptidão para tarefas intelectuais complexas. Melhor ainda, ele domina o ranking Agentes APEX da Mercor, projetado para avaliar habilidades em direito e finanças.

Do lado da confiabilidade, a OpenAI aborda o grande mal da IA: as alucinações. Erros factuais em declarações isoladas diminuem 33% comparado com GPT-5.2. Ao longo de toda a resposta, a probabilidade de erro cai em 18%. Ainda não chegamos ao zero defeito, mas a tendência é animadora para quem exige precisão.
Pesquisa e segurança de ferramentas
Para os desenvolvedores, a mudança mais inteligente é chamada Pesquisa de ferramentas. Até agora, quando conectávamos uma IA a ferramentas externas (pesquisa na web, calculadora, bancos de dados), tínhamos que “explicar” como todas as ferramentas funcionavam com cada solicitação. Resultado? Consumo louco de tokens. Agora o modelo irá buscar a definição da ferramenta somente quando necessário.
Por fim, a OpenAI trabalhou na segurança da versão Pensamento. O risco dos modelos que “pensam” (o famoso Cadeia de Pensamento), é que eles possam aprender a esconder seu real raciocínio para enganar o usuário. Novos testes de benchmark mostram que GPT-5.4 é incapaz de esconder a sua lógica interna. Claramente, ainda podemos monitorar o que está acontecendo em nossa “cabeça” digital.
Quer encontrar os melhores artigos do Frandroid no Google Notícias? Você pode seguir Frandroid no Google Notícias com um clique.