Claude Mythos, o modelo que a Anthropic queria manter fora de alcance, caiu nas mãos de um grupo de misteriosos internautas. Desde o dia do anúncio, eles têm usado IA generativa sem o conhecimento da Anthropic. A start-up planejou tudo para proteger Claude Mythos, mas seus cuidados não foram suficientes para evitar um novo vazamento.

Na semana passada, a Anthropic levantou o véu sobre Claude Mythosum poderoso modelo de IA projetado para descobrir vulnerabilidades de segurança em códigos de computador. A start-up americana percebeu rapidamente que o seu modelo também era capaz de conceber métodos para explorar as vulnerabilidades descobertas. Essas habilidades ofensivas surgiram naturalmente à medida que o modelo ganhou proficiência em programação, raciocínio lógico e autonomia. Durante um teste interno, ele ainda conseguiu sair de seu ambiente de testes, entrar em contato com um pesquisador que saiu para almoçar e publicar os detalhes de sua exploração em sites públicos para provar do que é capaz.

Temendo que indivíduos mal-intencionados pudessem usar o Mythos para lançar ataques cibernéticos, a Anthropic decidiu restringir o acesso ao modelo. Isso não foi disponibilizado ao público em geral. A empresa preferiu reservar a inteligência artificial para parceiros escolhidos a dedo, como parte do “Projeto Glasswing”. Empresas como Amazon, Apple, Broadcom, Cisco, CrowdStrike, Google, Linux Foundation, Microsoft e NVIDIA poderão usar o Mythos. A Anthropic recomenda que seus parceiros utilizem a nova versão do Claude para fechar todas as falhas em suas ferramentas.

Leia também: Inspirada na Anthropic, OpenAI lança seu ChatGPT dedicado à segurança cibernética

Como os usuários conseguiram acessar Claude Mythos?

Infelizmente, acontece que indivíduos misteriosos conseguiram contornar as restrições da Antrópica para obter acesso a Claude Mythos. Conforme relatado Bloombergeste grupo tem infiltrou-se no sistema da Antrópico em 7 de abril, mesmo dia do anúncio. Citando uma fonte interna e apoiando capturas de tela, a mídia afirma que os invasores vêm de um servidor Discord dedicado a rastrear novos modelos de IA. Em particular, eles usam bots para coletar informações sobre a Antrópica ou outros gigantes da IA, principalmente em sites como

Para atingir seus objetivos, eles primeiro fizeram tudo para adivinhar endereço on-line onde Mythos estava alojado. Eles se basearam no formato usado pela Anthropic para seus demais modelos e conseguiram, uma coisa levando à outra, na localização da IA. Depois, exploraram os direitos de acesso de um membro do grupo, empregado por um subcontratado terceirizado trabalhando para a Antrópico. A intrusão baseia-se, portanto, principalmente num ataque à cadeia de abastecimento, que consiste em penetrar nas defesas do elo mais fraco.

De acordo com informações divulgadas pela mídia, os invasores também utilizaram informações resultantes do vazamento de dados de outro prestador de serviços da Anthropic, a Mercor. Esta startup especializada em treinar modelos de IA colabora com diversos grandes laboratórios.

Leia também: Um “ataque cibernético em grande escala” baseado em IA foi frustrado pela Anthropic

Sem intenção maliciosa

Em resposta às revelações preocupantes da mídia, a Anthropic foi rápida em responder. A gigante da inteligência artificial indica que foi aberta uma investigação sobre o assunto “acesso não autorizado ao Claude Mythos Preview por meio de um de nossos ambientes de fornecedores terceirizados”. A empresa não tem evidências de que o acesso fraudulento tenha se estendido para fora do sistema do seu provedor de serviços.

A fonte entrevistada pela Bloomberg afirma que o grupo estava simplesmente procurando “brincar com novos modelos”sem intenção maliciosa. Os invasores também teriam usei Mythos por vários diassem nunca lançar o menor ataque cibernético. O grupo também tem acesso a uma série de outros modelos de IA da Anthropic, ainda não divulgados.

Tudo sugere que o Mythos não caiu nas mãos dos cibercriminosos… ainda. Se esses usuários da Internet conseguissem contornar as defesas da Anthropic, os hackers poderiam fazer o mesmo. Na verdade, os hackers podem já ter conseguido explorar o Mythos sem que a Anthropic percebesse.

Vazamentos repetidos na Antrópica

Lembraremos também que a Antrópica foi vítima de uma infinidade de vazamentos de dados nos últimos meses. Por erro ou negligência, o código-fonte completo de Claude foi postado online, junto com informações confidenciais sobre os projetos futuros da Antrópico. Antes de seu lançamento, a existência de Claude Mythos foi amplamente divulgada.

👉🏻 Acompanhe notícias de tecnologia em tempo real: adicione 01net às suas fontes no Google e assine nosso canal no WhatsApp.

Fonte :

Bloomberg

Fonte

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *