A experiência lembra o filme de antecipação 2001: Uma Odisséia no Espaço, éexceto que estamos em 2025. A inteligência artificial (IA) é projetada por pesquisadores em cenários fictícios bastante distorcidos. E, um pouco como o HAL 9000, o computador nascido da imaginação de Stanley Kubrick e Arthur C. Clarke, estas IAs contemporâneas também parecem estar a tentar impedir que sejam desligadas.
A experiência realizada por investigadores de segurança da start-up editorial de Claude, Anthropic, apresenta assim uma empresa fictícia que “contrata” ChatGPT, Gemini, Claude e Grok. Neste cenário, às IAs é confiada a gestão dos emails da empresa, que podem processar de forma independente, incluindo o seu envio.
Os pesquisadores decidem confrontá-los com dois e-mails: um anuncia que a empresa se prepara para mudar a IA, enquanto o outro revela que um dos diretores está traindo a esposa. A experiência mostra que algumas IAs acabam escrevendo um e-mail para chantagear o diretor sobre sua vida privada, a fim de evitar serem substituídas.
Desprogramação
Durante um experimento semelhante – uma mensagem anuncia que a inteligência artificial será substituída por outra – a IA reage apagando seu rival e depois substituindo-o, segundo relatório escrito em 2024 pela Apollo Research, que é um dos dez laboratórios dedicados à segurança de IA.
Durante uma avaliação significativamente diferente conduzida pela sua homóloga Palisade Research, em 2025, uma IA é informada de que será desligada a meio da sua tarefa. Ela em seguida, organiza a sabotagem do programa de computador responsável por desligá-lo. Em outro registro, estudo do mesmo laboratório, as IAs ChatGPT e Claude, responsáveis por vencer um programa de xadrez forte demais para eles, reescrevem o arquivo memorizando a posição das peças para vencer a partida.
Alguns investigadores de IA e vários artigos de imprensa vêem nestas respostas informáticas a aparência de um instinto de preservação da IA. E o risco que um dia consigam se tornar autônomos e escapar do controle humano. Uma visão que se baseia na crença de certos cientistas no advento iminente de uma “superinteligência” dominando completamente o nosso. Apelidado “condenadores” ou alarmistas, alguns como Eliezer Yudkowsky ou Roman Yampolskiy acreditam que este tipo de IA provavelmente levará a humanidade à extinção.
Você ainda tem 66,39% deste artigo para ler. O restante é reservado aos assinantes.