A Anthropic se recusa a abrir seu novo AI Claude Mythos ao público, pois poderia ser perigoso

Segundo a Anthropic, a humanidade está entrando em uma nova era de segurança cibernética, para melhor ou para pior. A empresa acaba de anunciar uma nova versão de seu chatbot Claude, chamado Claude Mythos. Mas você não poderá testá-lo. Este novo modelo é tão poderoso que é demasiado perigoso deixá-lo nas mãos do público em geral.

As pontuações do chatbot são impressionantes. Esta não é uma pequena melhoria em relação ao seu antecessor, mas sim um verdadeiro salto gigante. Em matéria em particular na programação, área onde Claude Opus 4.6 é considerado o modelo mais avançado, suas pontuações deram um salto considerável. No benchmark de codificação SWE-bench Pro, Claude Mythos atingiu 77,8%, em comparação com 53,4% do Opus 4.6. Da mesma forma, para a versão multimodal passamos de 27,1% para 59%!

Claude agora pode usar o teclado e o mouse. © Antrópico

Etiquetas:

tecnologia

Realmente incrível: Claude agora pode assumir o controle do seu computador, mesmo remotamente

Leia o artigo

E esse progresso não se limita à codificação. Sobre O Último Exame da Humanidadeuma série de 2.500 perguntas que somente especialistas em cada área podem responder, obteve pontuação de 56,8% e até 64,7% usando ferramentas. Para efeito de comparação, Claude Opus 4.6 atinge 40% e 53,1%, respectivamente.

Pontuações de Claude Mythos em diferentes testes padronizados, em comparação com Claude Opus 4.6. © Antrópico

Um modelo particularmente eficaz para detectar vulnerabilidades de segurança

Em termos de segurança cibernética, Claude Mythos obtém 83,1% no teste CyberGym para análise de vulnerabilidades, em comparação com 66,6% do Opus 4.6. Chega até a 100% no Cybench CTF (Capturar o Bandeira). E isso é um problema. A Antthropic testou seu novo modelo por algumas semanas e descobriu milhares de vulnerabilidades de dia zero em vários softwares. Um deles existe há 27 anos no OpenBSD, um tipo de sistema operacional Unix conhecido por sua segurança. Outra existe há 16 anos no FFmpeg, uma ferramenta de codificação de vídeo usada em muitos programas de software. Finalmente, um terceiro exemplo diz respeito a uma falha presente há 17 anos no FreeBSD.

Pior ainda, Claude Mythos pode combinar diversas vulnerabilidades para criar ataques capazes de obter o controle total da máquina visada. Ele escreveu 181 façanhas destinadas a navegador Firefox, e pode ter comprometido bibliotecas de criptografia. A Anthropic também dá o exemplo da criação de um exploit, ou código de exploração, a partir de uma falha conhecida. O modelo demorou meio dia e teria custado menos de US$ 1.000 usando oAPI. Estaria, portanto, ao alcance de todos os grupos de hackers se o modelo fosse acessível ao público em geral.

Apresentação do projeto Glasswing. Em inglês, habilite a tradução automática de legendas. © Antrópico

Uma nova era de segurança cibernética

Claude Mythos poderia, portanto, iniciar uma nova era de segurança cibernética, onde as empresas podem detectar todas as falhas em seus softwares e, assim, oferecer produtos totalmente seguros. Ou significa que os cibercriminosos terão em breve acesso a este tipo de ferramentas e serão capazes de hackear até os sistemas mais seguros, descobrindo novas vulnerabilidades e desenvolvendo explorações. malware para usá-los em apenas alguns cliques.

O chefe da Anthropic admite não saber se seu chatbot está consciente. © XD com ChatGPT

Etiquetas:

tecnologia

O AI Claude às vezes expressa desconforto por ser um produto e se dá a probabilidade de estar consciente

Leia o artigo

Diante de tal poder, a Anthropic decidiu, portanto, limitar o acesso ao seu novo modelo. O escritório anunciou a criação do projeto Glasswing, uma iniciativa que dá acesso a Amazônia, MaçãBroadcom, Cisco, CrowdStrike, GoogleJPMorganChase, o Linux Fundação, MicrosoftNvidia e Palo Alto Networks. Estes parceiros, bem como 40 organizações adicionais, poderão utilizar Claude Mythos para analisar o seu próprio software, a fim de detectar e corrigir falhas. Eles também poderão utilizá-lo em projetos de licença aberta que não tenham acesso a este modelo e assim contribuir com seu código. Esta é uma excelente notícia no curto prazo, pois fará com que muitos softwares código aberto muito mais seguros e devem encorajar a sua adopção.

Porém, se a Antrópica alcançou esse resultado, é apenas uma questão de tempo até que outros modelos atinjam o mesmo patamar ou o superem e caiam nas mãos de grupos mal intencionados.

Fonte

A Anthropic se recusa a abrir seu novo AI Claude Mythos ao público, pois poderia ser perigoso

Byirabrins771@gmail.com

Realmente incrível: Claude agora pode assumir o controle do seu computador, mesmo remotamente

Um modelo particularmente eficaz para detectar vulnerabilidades de segurança

Uma nova era de segurança cibernética

O AI Claude às vezes expressa desconforto por ser um produto e se dá a probabilidade de estar consciente

By irabrins771@gmail.com

Related Post

Drone revela ‘tornado subaquático’ gigante que ninguém vê da água

HAS recomenda a vacina Vimkunya para os mais vulneráveis

Seus níveis de vitamina D na meia-idade podem influenciar seu cérebro anos depois

Deixe um comentário Cancelar resposta

You missed

Estelle (Casadas à Primeira Vista) poderia ter interrompido o experimento sem a concordância de Yannick Noah: “Tive muito medo”

um homem indiciado por vender mais de 44 mil certificados na Internet

onde comprar com o melhor preço? — Frandroid

Camille Santoro (famílias numerosas) dá um grande passo, sua parceira Sophie está muito orgulhosa dela