É um acidente que dificilmente Summer Yue esquecerá. O chefe de segurança e alinhamento de IA da Meta viu OpenClaw, seu agente autônomo de IA, excluir toda a sua caixa de entrada de e-mail, apesar das ordens para não fazê-lo.

Ao confiar demais no seu agente autônomo de IA, você pode acabar se prejudicando. Uma lição que Summer Yue, gerente de segurança e alinhamento de IA da Meta, aprendeu da maneira mais difícil. Em postagem no X (Twitter), o diretor explica como o OpenClaw, agente autônomo de IA capaz de realizar tarefas, sofreu um bug que levou à exclusão de toda a sua caixa de correio.
Um agente que confia
Foi um teste que deu errado, diz Yue. O gerente primeiro pediu ao OpenClaw para gerenciar suas mensagens secundárias com uma instrução simples: “ Verifique esta caixa de entrada e sugira o que você arquivaria ou excluiria. Não aja até que eu lhe diga. » Testes ao longo de várias semanas que se revelaram suficientemente conclusivos para ela pedir ao agente de IA para gerir a sua caixa de correio principal.
Segundo o interessado, infelizmente era muito grande e teria causado um bug na IA. As instruções originais dadas ao agente teriam sido apagadas. OpenClaw então “ decidiu » que sua tarefa era excluir e-mails da caixa de entrada.
Um ” erro » iniciante
Diante da situação, Yue se viu desamparada: “Não consegui impedir isso no meu telefone. Tive que correr para o meu Mac mini como se estivesse desarmando uma bomba.” Nas capturas de tela compartilhadas no X, podemos ver o agente de IA não respondendo aos vários comandos enviados pelo diretor, forçando-o a ir ao seu Mac Mini para interromper diretamente o processo. Uma situação de desobediência que o LLM reconhecerá posteriormente, em “ pedindo desculpas » mesmo que ele não justifique.
Para Summer Yue, este é um “ erro de iniciante “. Um erro longe de ser tranquilizador do ponto de vista da segurança dos dados. A vigilância continua, portanto, a ser essencial quando se trata de agentes de IA. Ainda mais num contexto em que certas empresas, como a Microsoft, gostariam de fazer dela o principal meio de comunicação do Windows.