
Em 2024, Google revelou a Genie, uma inteligência artificial especializada em criar videogames a partir de uma simples imagem. Esta primeira versão era extremamente limitada, podendo gerar apenas jogos de plataforma. Porém, em um ano e meio essa tecnologia evoluiu muito, e o Google acaba de anunciar o Project Genie, sua ferramenta para geração de mundos interativos infinitos.
Genie é um modelo mundial, ou modelo mundial. Ao contrário dos grandes modelos de linguagem (LLM) usados para chatbots, os modelos mundiais são capazes de simular um ambiente físico. Esta é outra abordagem à IA, na qual Yann LeCun, um dos fundadores da IA moderna, acredita. Recentemente, ele deixou a Meta para se concentrar em modelos mundiais, que ele acredita que irão muito além dos LLMs.
Mundos efêmeros que duram apenas um minuto
O Project Genie é baseado no Genie 3, revelado em agosto passado, e também se baseia no Nano Banana Pro e Gemini. Basta fornecer uma imagem ou um texto simples e ele gera um mundo. É possível gerar seu personagem e escolher como você se movimenta, andando ou voando, por exemplo. A ferramenta utiliza Nano Banana Pro para gerar uma primeira visualização estática, e oferece a possibilidade de modificá-la antes de gerar o mundo e começar a explorar.
O movimento no mundo 3D é feito através do teclado, e o mundo é gerado em tempo real, à medida que as ações ocorrem. O mundo é exibido com definição HD (1280 x 720 pixels) e 24 quadros por segundo. Um dos problemas regularmente encontrados com este tipo de modelo é que ele não consegue memorizar o mundo por muito tempo. Lembramos particularmente do GameNGen do Google em 2024 que era capaz de gerar o jogo Doom, mas só tinha memória de três segundos. Gaste um portavire-se e a porta não existe mais… O Genie 3 é um pouco mais avançado, e consegue manter o mundo por vários minutos, mas o Google limitou o Project Genie a apenas 60 segundos para evitar problemas.
Mundos virtuais que não respeitam direitos autorais
A beira conseguiu testar a ferramenta e criou diversos mundos baseados em videogames. O artigo apresenta diversos vídeos imitando Super Mário 64, Metroid Primeou mesmo A lenda de Zelda: Breath of the Wild. Estamos, portanto, mais uma vez perante uma IA treinada em obras protegidas e capaz de infringir direitos de autor em grande escala. Já tínhamos visto o caso da OpenAI e da sua rede social Sora que gerou imagens do Bob Esponja como nazi ou do Pikachu a roubar uma loja. No entanto, o Google parece ter intervindo e bloqueado a geração de mundos baseados em determinados títulos.
O Google especifica que o Projeto Genie ainda está em fase experimental. Quem conseguiu testá-lo indica que os controles reagem lentamente e que depois do “efeito uau” a experiência é bastante decepcionante. Às vezes, o personagem é impossível de controlar, e muitos insetos surgem aleatoriamente. Porém, esta nova versão mostra como a tecnologia está evoluindo muito rapidamente e poderá ser viável em alguns anos. Enquanto isso, não espere testá-lo tão cedo. O acesso é limitado aos Estados Unidos e requer uma assinatura do Google AI Ultra (a 140 euros por mês).