Segundo a Anthropic, a humanidade está entrando em uma nova era de segurança cibernética, para melhor ou para pior. A empresa acaba de anunciar uma nova versão de seu chatbot Claude, chamado Claude Mythos. Mas você não poderá testá-lo. Este novo modelo é tão poderoso que é demasiado perigoso deixá-lo nas mãos do público em geral.
As pontuações do chatbot são impressionantes. Esta não é uma pequena melhoria em relação ao seu antecessor, mas sim um verdadeiro salto gigante. Em matéria em particular na programação, área onde Claude Opus 4.6 é considerado o modelo mais avançado, suas pontuações deram um salto considerável. No benchmark de codificação SWE-bench Pro, Claude Mythos atingiu 77,8%, em comparação com 53,4% do Opus 4.6. Da mesma forma, para a versão multimodal passamos de 27,1% para 59%!

Etiquetas:
tecnologia
Realmente incrível: Claude agora pode assumir o controle do seu computador, mesmo remotamente
Leia o artigo
E esse progresso não se limita à codificação. Sobre O Último Exame da Humanidadeuma série de 2.500 perguntas que somente especialistas em cada área podem responder, obteve pontuação de 56,8% e até 64,7% usando ferramentas. Para efeito de comparação, Claude Opus 4.6 atinge 40% e 53,1%, respectivamente.

Pontuações de Claude Mythos em diferentes testes padronizados, em comparação com Claude Opus 4.6. © Antrópico
Um modelo particularmente eficaz para detectar vulnerabilidades de segurança
Em termos de segurança cibernética, Claude Mythos obtém 83,1% no teste CyberGym para análise de vulnerabilidades, em comparação com 66,6% do Opus 4.6. Chega até a 100% no Cybench CTF (Capturar o Bandeira). E isso é um problema. A Antthropic testou seu novo modelo por algumas semanas e descobriu milhares de vulnerabilidades de dia zero em vários softwares. Um deles existe há 27 anos no OpenBSD, um tipo de sistema operacional Unix conhecido por sua segurança. Outra existe há 16 anos no FFmpeg, uma ferramenta de codificação de vídeo usada em muitos programas de software. Finalmente, um terceiro exemplo diz respeito a uma falha presente há 17 anos no FreeBSD.
Pior ainda, Claude Mythos pode combinar diversas vulnerabilidades para criar ataques capazes de obter o controle total da máquina visada. Ele escreveu 181 façanhas destinadas a navegador Firefox, e pode ter comprometido bibliotecas de criptografia. A Anthropic também dá o exemplo da criação de um exploit, ou código de exploração, a partir de uma falha conhecida. O modelo demorou meio dia e teria custado menos de US$ 1.000 usando oAPI. Estaria, portanto, ao alcance de todos os grupos de hackers se o modelo fosse acessível ao público em geral.
Uma nova era de segurança cibernética
Claude Mythos poderia, portanto, iniciar uma nova era de segurança cibernética, onde as empresas podem detectar todas as falhas em seus softwares e, assim, oferecer produtos totalmente seguros. Ou significa que os cibercriminosos terão em breve acesso a este tipo de ferramentas e serão capazes de hackear até os sistemas mais seguros, descobrindo novas vulnerabilidades e desenvolvendo explorações. malware para usá-los em apenas alguns cliques.

Etiquetas:
tecnologia
O AI Claude às vezes expressa desconforto por ser um produto e se dá a probabilidade de estar consciente
Leia o artigo
Diante de tal poder, a Anthropic decidiu, portanto, limitar o acesso ao seu novo modelo. O escritório anunciou a criação do projeto Glasswing, uma iniciativa que dá acesso a Amazônia, MaçãBroadcom, Cisco, CrowdStrike, GoogleJPMorganChase, o Linux Fundação, MicrosoftNvidia e Palo Alto Networks. Estes parceiros, bem como 40 organizações adicionais, poderão utilizar Claude Mythos para analisar o seu próprio software, a fim de detectar e corrigir falhas. Eles também poderão utilizá-lo em projetos de licença aberta que não tenham acesso a este modelo e assim contribuir com seu código. Esta é uma excelente notícia no curto prazo, pois fará com que muitos softwares código aberto muito mais seguros e devem encorajar a sua adopção.
Porém, se a Antrópica alcançou esse resultado, é apenas uma questão de tempo até que outros modelos atinjam o mesmo patamar ou o superem e caiam nas mãos de grupos mal intencionados.