Aqui está o modelo totalmente novo que irá alimentar Bate-papoGPTGPT-5.5. A OpenAI deposita muita esperança nesta nova versão da sua inteligência artificial, depois de ter sido deixada para trás por alguns dos seus concorrentes. Por um lado, o Gemini 3.1 Pro é particularmente poderoso e, graças à onipresença dos produtos Googlejá está nas mãos de um número cada vez maior de usuários. Por outro lado, Claude Opus 4.7, lançado há uma semana, é bom em tarefas de codificação. E não esqueçamos Claude Mythos, “tão” poderoso que a Anthropic decidiu não abri-lo ao público.

Com o codinome “Spud”, o GPT-5.5 substitui portanto o GPT-5.4, lançado no início de março, lançado com urgência quando o ChatGPT sofria uma hemorragia de utilizadores após ter celebrado um acordo com o Pentágono para a utilização militar da sua IA. Esta nova versão é apresentada, sem surpresa, como o “ mais inteligente e intuitivo “.

Visão geral do GPT-5.5. ©OpenAI

Um modelo mais simples de usar

Tal como os seus concorrentes, a ênfase está na codificação e no seu aspecto agente, ou seja, na sua capacidade de realizar uma tarefa de forma autónoma. GPT-5.5 seria particularmente bom em “ escrever e depurar código, realizar pesquisas on-line, analisar dados, criar documentos e planilhas, testar software e navegar pelas ferramentas até concluir uma tarefa “. OpenAI afirma que se tornou mais inteligente sem perder velocidade.

Um estudo mostra que as IAs podem mentir e trapacear para salvar seus semelhantes. © XD, ChatGPT

Etiquetas:

tecnologia

Eles não estão mais apenas tentando sobreviver: essas IAs também estão começando a proteger seus semelhantes!

Leia o artigo



Com o GPT-5.5, a forma como interagimos agora é diferente, segundo a OpenAI. Não é mais necessário descrever todo o processo para concluir a tarefa. Apenas dê a ele uma meta e deixe-o descobrir, e ele deverá descobrir o método ideal sozinho.


GPT-5.5 atinge a melhor pontuação em alguns testes. ©OpenAI

OpenAI recupera a liderança em alguns rankings

As pontuações publicadas pela OpenAI mostram que o GPT-5.5 está alcançando ou até superando a concorrência. No SWE-Bench Pro, um teste de codificação, obteve pontuação de 58,6%, superando o Gemini 3.1 Pro (54,2%). No entanto, ainda não atingiu o nível de Claude Opus 4,7 (64,3%) e ainda está longe de Claude Mythos (77,8%), mesmo que este último não seja acessível ao público. Sobre O Último Exame da Humanidadeuma série de 2.500 perguntas que somente especialistas em cada área podem responder, obteve pontuação de 52,2% no uso de ferramentas, superando Gemini 3.1 Pro (51,4%), mas um pouco menos que Claude Opus 4.7 (54,7%) e Claude Mythos (64,7%).

Os indivíduos conseguiram acessar o modelo de Claude Mythos. © XD, ChatGPT

Etiquetas:

tecnologia

Claude Mythos: o modelo de IA mais perigoso já criado?

Leia o artigo



Quanto às suas capacidades de agência, ou seja, “ uso de computador », atingiu 78,7% no teste OSWorld-Verified, superando ligeiramente Claude Opus 4,7 (78,0%). Este novo modelo ainda ocupa o primeiro lugar em vários testes, como Terminal-Bench 2.0 (codificação), GDPval (validação de desempenho), CyberGym (cibersegurança) e FrontierMath (matemática de alto nível). Finalmente, desde que você não leve em conta Claude Mythos…

Nada de novo para usuários gratuitos

O GPT-5.5 vem em três versões: a versão básica, o modelo GPT-5.5 Thinking e o GPT-5.5 Pro. Eles estão disponíveis no ChatGPT agora para assinantes Plus, Pro, Business e Enterprise. GPT-5.5 estará disponível “em breve” através de a API, com um preço mais elevado. No entanto, a OpenAI afirma que é mais inteligente e eficiente com fichasentão precisará de menos.

Os usuários do ChatGPT gratuito terão, portanto, que se contentar com a versão GPT-5.3, tendo a OpenAI reservado as duas versões mais recentes de seu chatbot aos assinantes…

Fonte

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *