É um acidente que dificilmente Summer Yue esquecerá. O chefe de segurança e alinhamento de IA da Meta viu OpenClaw, seu agente autônomo de IA, excluir toda a sua caixa de entrada de e-mail, apesar das ordens para não fazê-lo.

Meta logo para ilustração // Fonte: Mariia Shalabaieva para Unsplash

Ao confiar demais no seu agente autônomo de IA, você pode acabar se prejudicando. Uma lição que Summer Yue, gerente de segurança e alinhamento de IA da Meta, aprendeu da maneira mais difícil. Em postagem no X (Twitter), o diretor explica como o OpenClaw, agente autônomo de IA capaz de realizar tarefas, sofreu um bug que levou à exclusão de toda a sua caixa de correio.

Um agente que confia

Foi um teste que deu errado, diz Yue. O gerente primeiro pediu ao OpenClaw para gerenciar suas mensagens secundárias com uma instrução simples: “ Verifique esta caixa de entrada e sugira o que você arquivaria ou excluiria. Não aja até que eu lhe diga. » Testes ao longo de várias semanas que se revelaram suficientemente conclusivos para ela pedir ao agente de IA para gerir a sua caixa de correio principal.

Segundo o interessado, infelizmente era muito grande e teria causado um bug na IA. As instruções originais dadas ao agente teriam sido apagadas. OpenClaw então “ decidiu » que sua tarefa era excluir e-mails da caixa de entrada.

Um ” erro » iniciante

Diante da situação, Yue se viu desamparada: “Não consegui impedir isso no meu telefone. Tive que correr para o meu Mac mini como se estivesse desarmando uma bomba.” Nas capturas de tela compartilhadas no X, podemos ver o agente de IA não respondendo aos vários comandos enviados pelo diretor, forçando-o a ir ao seu Mac Mini para interromper diretamente o processo. Uma situação de desobediência que o LLM reconhecerá posteriormente, em “ pedindo desculpas » mesmo que ele não justifique.

Para Summer Yue, este é um “ erro de iniciante “. Um erro longe de ser tranquilizador do ponto de vista da segurança dos dados. A vigilância continua, portanto, a ser essencial quando se trata de agentes de IA. Ainda mais num contexto em que certas empresas, como a Microsoft, gostariam de fazer dela o principal meio de comunicação do Windows.


Fonte

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *