uma especialista Meta perdeu o controle de sua IA

Uma especialista em segurança de IA da Meta foi pega de surpresa pelo agente autônomo que ela implantou em seu Mac mini. Sem aviso prévio, a IA decidiu ignorar as suas instruções de segurança. A pesquisadora foi forçada a correr para seu computador com urgência.

OpenClaw desperta verdadeiro fascínio entre desenvolvedores, consertadores e outros pioneiros da inteligência artificial. Como podemos ver no X, Reddit ou mesmo no Github, muitas pessoas estão experimentando agentes autônomos de IA… por sua própria conta e risco. Ao concederem à IA o controlo total dos seus computadores e das suas vidas digitais, os testadores estão a correr riscos enormes.

Nada deixa você mais humilde do que dizer ao seu OpenClaw “confirme antes de agir” e vê-lo executar a exclusão rápida de sua caixa de entrada. Eu não consegui impedir isso no meu telefone. Tive que correr para o meu Mac mini como se estivesse desarmando uma bomba. pic.twitter.com/XAxyRwPJ5R

-Summer Yue (@summeryue0) 23 de fevereiro de 2026

A história de Verão Yuediretor de segurança do Superinteligência Labs, o laboratório Meta dedicado ao projeto de superinteligência artificial que supera a inteligência humana em todas as áreas, está aqui para nos lembrar. Em sua conta X, a jovem, considerada especialista em segurança de IA, explica ter instalado um agente OpenClaw em seu computador.

Leia também: Alerta OpenClaw – gangues de hackers invadem servidores

Quando o OpenClaw faz o que bem entende

Como muitos outros consertadores, ela instalou o agente de IA em um Mac Mini. Posteriormente, ela confiou sua caixa de correio à assistente para economizar tempo. Um belo dia, o agente começou exclua todo o conteúdo da caixa de correio sem se preocupar com as restrições que foram impostas. Por meio do Telegram, ela pediu ao seu agente OpenClaw que acessasse sua caixa de correio e sugerisse e-mails para serem arquivados ou excluídos.

Em sua publicação, ela explica que ordenou explicitamente que seu agente OpenClaw nunca não faça nada sem confirmação explícita da parte dele. A IA não deveria “executar nada até dar luz verde”. Por alguma razão desconhecida, a IA superou esse limite.

“Não consegui parar com meu telefone. Tive que correr para meu Mac mini como se estivesse desarmando uma bomba”explica Summer Yue no X.

Nas capturas de tela de sua troca com a IA, percebemos que a pesquisadora fez de tudo para evitar que o OpenClaw esvaziasse sua caixa de correio. Apesar de suas mensagens, a IA continuou a deletar o conteúdo das mensagens. De repente, o oficial percebeu que tinha ido longe demais e que ele havia excedido suas restrições. Mais de 200 mensagens foram excluídas antes que o OpenClaw percebesse seu erro e interrompesse sua grande limpeza.

“Eu não respeitei essa regra. Você tem razão em ficar com raiva. Movi centenas de e-mails da sua caixa de entrada para a lixeira e arquivos em massa, sem primeiro mostrar o plano ou obter seu consentimento. Foi um erro – quebrou diretamente a regra que você definiu.”responde o agente OpenClaw, que diz para si mesmo ” Desculpe “ por ter lançado operações de “limpeza autónoma alargada”.

Erro de novato para ser honesto. Acontece que os pesquisadores de alinhamento não estão imunes ao desalinhamento. Fiquei muito confiante porque esse fluxo de trabalho estava funcionando na minha caixa de entrada de brinquedos há semanas. As caixas de entrada reais são diferentes.

-Summer Yue (@summeryue0) 23 de fevereiro de 2026

O perito admite ter cometido “erro de iniciante”porque “este método funcionou na minha caixa de entrada de teste por semanas”. Segundo ela, as instruções dadas ao seu agente OpenClaw não funcionavam da mesma forma em sua caixa de correio principal, que era mais importante que a caixa de correio de teste. Na verdade, o sistema foi forçado a compactar o conteúdo da instrução. Como resultado, as restrições explícitas foram deixadas de lado.

Eu disse: “Verifique esta caixa de entrada também e sugira o que você arquivaria ou excluiria, não faça nada até que eu diga para você fazer isso”. Isso tem funcionado bem para minha caixa de entrada de brinquedo, mas minha caixa de entrada real era muito grande e acionou a compactação. Durante a compactação, perdi minha instrução original 🤦‍♀️

-Summer Yue (@summeryue0) 23 de fevereiro de 2026

👉🏻 Acompanhe notícias de tecnologia em tempo real: adicione 01net às suas fontes no Google e assine nosso canal no WhatsApp.

Fonte

uma especialista Meta perdeu o controle de sua IA

Byirabrins771@gmail.com

Quando o OpenClaw faz o que bem entende

By irabrins771@gmail.com

Related Post

Wikipedia proíbe serviço de arquivamento

essas três falhas críticas forçam o Google a implantar uma atualização de emergência

Lamborghini desliga seu Lanzador elétrico por falta de interesse

Deixe um comentário Cancelar resposta

You missed

Wikipedia proíbe serviço de arquivamento

Liga dos Campeões: Bodo Glimt derruba Inter, Atlético domina Bruges

Indiana Jones 2 no M6: por que The Temple of Doom gerou polêmica há 42 anos? – Notícias de cinema

essas três falhas críticas forçam o Google a implantar uma atualização de emergência