Uma especialista em segurança de IA da Meta foi pega de surpresa pelo agente autônomo que ela implantou em seu Mac mini. Sem aviso prévio, a IA decidiu ignorar as suas instruções de segurança. A pesquisadora foi forçada a correr para seu computador com urgência.

OpenClaw desperta verdadeiro fascínio entre desenvolvedores, consertadores e outros pioneiros da inteligência artificial. Como podemos ver no X, Reddit ou mesmo no Github, muitas pessoas estão experimentando agentes autônomos de IA… por sua própria conta e risco. Ao concederem à IA o controlo total dos seus computadores e das suas vidas digitais, os testadores estão a correr riscos enormes.

A história de Verão Yuediretor de segurança do Superinteligência Labs, o laboratório Meta dedicado ao projeto de superinteligência artificial que supera a inteligência humana em todas as áreas, está aqui para nos lembrar. Em sua conta X, a jovem, considerada especialista em segurança de IA, explica ter instalado um agente OpenClaw em seu computador.

Leia também: Alerta OpenClaw – gangues de hackers invadem servidores

Quando o OpenClaw faz o que bem entende

Como muitos outros consertadores, ela instalou o agente de IA em um Mac Mini. Posteriormente, ela confiou sua caixa de correio à assistente para economizar tempo. Um belo dia, o agente começou exclua todo o conteúdo da caixa de correio sem se preocupar com as restrições que foram impostas. Por meio do Telegram, ela pediu ao seu agente OpenClaw que acessasse sua caixa de correio e sugerisse e-mails para serem arquivados ou excluídos.

Em sua publicação, ela explica que ordenou explicitamente que seu agente OpenClaw nunca não faça nada sem confirmação explícita da parte dele. A IA não deveria “executar nada até dar luz verde”. Por alguma razão desconhecida, a IA superou esse limite.

“Não consegui parar com meu telefone. Tive que correr para meu Mac mini como se estivesse desarmando uma bomba”explica Summer Yue no X.

Nas capturas de tela de sua troca com a IA, percebemos que a pesquisadora fez de tudo para evitar que o OpenClaw esvaziasse sua caixa de correio. Apesar de suas mensagens, a IA continuou a deletar o conteúdo das mensagens. De repente, o oficial percebeu que tinha ido longe demais e que ele havia excedido suas restrições. Mais de 200 mensagens foram excluídas antes que o OpenClaw percebesse seu erro e interrompesse sua grande limpeza.

“Eu não respeitei essa regra. Você tem razão em ficar com raiva. Movi centenas de e-mails da sua caixa de entrada para a lixeira e arquivos em massa, sem primeiro mostrar o plano ou obter seu consentimento. Foi um erro – quebrou diretamente a regra que você definiu.”responde o agente OpenClaw, que diz para si mesmo ” Desculpe “ por ter lançado operações de “limpeza autónoma alargada”.

O perito admite ter cometido “erro de iniciante”porque “este método funcionou na minha caixa de entrada de teste por semanas”. Segundo ela, as instruções dadas ao seu agente OpenClaw não funcionavam da mesma forma em sua caixa de correio principal, que era mais importante que a caixa de correio de teste. Na verdade, o sistema foi forçado a compactar o conteúdo da instrução. Como resultado, as restrições explícitas foram deixadas de lado.

👉🏻 Acompanhe notícias de tecnologia em tempo real: adicione 01net às suas fontes no Google e assine nosso canal no WhatsApp.



Fonte

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *