OpenAI reconhece que seu navegador Atlase por extensão todos os agentes de IA, manterão um calcanhar de Aquiles permanente: injeções imediatas. A empresa está trazendo artilharia pesada para se defender, mas já alerta: nunca baixe a guarda.

Antes de falar em falhas, devemos entender o que colocamos nas mãos dessas IAs. Observe que não estamos falando aqui de ter um pequeno painel lateral ChatGPT para resumir um PDF. Isso é inofensivo.

UM “Agente de IA” (como Atlas em agente de moda), é uma IA à qual você dá chaves de casa. Concretamente, o navegador já não se limita a exibir uma página web: ele “lê-a”, compreende-a e pode interagir com. Ele pode clicar em botões, preencher formulários, fazer login para você e efetuar pagamentos.

A OpenAI está trabalhando duro para proteger seu navegador de IA, Atlascontra ataques cibernéticos. Mas a empresa fala sobre um fenômeno preocupante em seu blog: injeções imediatas. Kezako? É uma técnica que manipula a IA através de instruções ocultas. E é um risco que nunca irá desaparecer.

Aqui está um exemplo fornecido pela OpenAI, a injeção é feita diretamente em um prompt para criar um email

A OpenAI compara esse problema diretamente aos golpes e à engenharia social na web: nunca poderemos “resolver” o problema, apenas contê-lo.

A empresa americana admite mesmo que o “modo agente” do ChatGPT Atlas expande significativamente a “superfície de ameaça”. Resumidamente? Quanto mais sua IA for capaz de agir por você, mais vulnerável ela será.

O jogo de gato e rato, com um gato AI

OpenAI lançou o navegador ChatGPT Atlas em outubro. Poucas horas depois, os pesquisadores de segurança já estavam se divertindo sequestrando o comportamento do navegador simplesmente escrevendo algumas palavras fortes em um formato Documento Google. É assustadoramente fácil. E a OpenAI não está sozinha nessa bagunça: Corajoso E Perplexidade Cometa enfrentam os mesmos desafios estruturais.

O problema é sistêmico. O Centro Nacional de Segurança Cibernética do Reino Unido também alertou: estes ataques “nunca serão completamente atenuados”. Devemos aprender a conviver com o risco em vez de esperar eliminá-lo.

Para tentar tapar as violações antes que sejam exploradas, a OpenAI desenvolveu um “atacante automatizado baseado em um LLM”. É um bot treinado por reforço para bancar o hacker. Ele passa seus dias em simulação tentando capturar o agente de IA, analisando suas reações e refinando seus ataques.

A ideia é atraente no papel: usar a IA para quebrar a IA, mais rápido que um ser humano. A OpenAI afirma que este sistema já permitiu descobrir novas estratégias de ataque, que nem mesmo as suas equipas “red teaming” (os amigáveis ​​​​hackers humanos) tinham visto.

Para ir mais longe
O navegador Opera Neon com tecnologia de IA está disponível em versão de teste, com uma condição

Por que este é um problema insolúvel

A raiz do problema não é a velocidade de detecção de vulnerabilidades. Esta é a própria natureza da ferramenta. Na realidade, o risco de um sistema de IA é o produto da sua autonomia multiplicado por seu acesso.

Navegadores de agentes como o Atlas estão em uma zona vermelha: eles têm um autonomia moderada mas um acesso muito alto aos seus dados (e-mails, pagamentos, formulários). Em uma demonstração, a OpenAI mostrou como seu invasor automatizado conseguiu inserir um e-mail malicioso na caixa de entrada de um usuário.

O agente leu as instruções ocultas e enviou uma carta de demissão em vez de uma resposta automática de ausência. Muito engraçado para a demonstração, catastrófico na vida real.

O modo agente é problemático

OpenAI promete que seu “modo agente” detecta melhor esses ataques após a atualização. Aconselham limitar o acesso, solicitar confirmações manuais para ações sensíveis (pagamentos, envio de mensagens) e evitar instruções vagas como “faça a coisa certa”.

Mas se você usar um navegador de IA, estará andando na corda bamba. A tecnologia é impressionante, mas depende de uma arquitetura inerentemente manipulável. Enquanto a IA processar instruções (o código) e dados (o conteúdo de uma página web) no mesmo fluxo, o risco de injeção persistirá. Tenha cuidado, portanto.

Para ir mais longe
“O Firefox se tornará um navegador de IA”: os usuários estão decepcionados e procuram alternativas, e esta é a óbvia


Fonte

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *