Yann LeCun, francês considerado um dos pais da IA moderna, revela LeWorldModel com sua equipe. Os primeiros testes são muito encorajadores.

Fale sobreinteligência artificialsignifica aproximar-se em um momento ou outro do que chamamos de gótimos modelos de linguagem (LLM). Esses são os sistemas que irão analisar um grande número de dados textuais e então ser capazes de gerá-los.
Eles estão por trás dos robôs conversacionais que você conhece: Bate-papoGPT, Gêmeos, Cláudio… Cada vez que você faz uma solicitação, são eles que permitem ao programa escrever uma resposta “ humano “. Pelo menos na aparência.
Mas embora os modelos linguísticos sejam amplamente utilizados hoje em dia, algumas pessoas acreditam que estamos a seguir o caminho errado. É o caso de Yann LeCun, ex-Meta e considerado um dos pais da inteligência artificial moderna.
Para ele, o LLM apenas imita a linguagem, sem verdadeiro raciocínio. É por isso que ele se concentra em “ modelos mundiais “, Ou ” modelos mundiais », capaz de prever a física circundante. Conforme relata Numerama, ele e sua equipe acabam de revelar um: OModelo Mundial (LeWM).
O WorldModel de Yann LeCun promete fazer melhor que a IA atual e com menos recursos
A inteligência artificial em questão aqui é baseada no JEPA, para “ Arquitetura Preditiva de Incorporação Conjunta “. Não é novo, mas até agora essa arquitetura atingiu rapidamente seus limites. TheWorldModel é diferente.
Entre seus pontos fortes, destacamos queele analisa diretamente pixels brutos para estruturar seu ambiente. Ao contrário dos modelos de linguagem, não é necessário que o LeWM entenda a priori o que é mostrado.
Seu maior trunfo está nos recursos de que necessita. Ele gerencia 15 milhões de parâmetros, muito menos que os LLMs que às vezes ultrapassam um bilhão. Resultado: uma GPU disponível comercialmente é suficiente para seu treinamento. Quando sabemos que a crise de RAM é causada pelas necessidades de memória da IA, este é um excelente ponto.
Os testes iniciais são muito encorajadores. LeWM foi capaz de planejar suas ações (empurrar um objeto, navegar por uma sala) 48 vezes mais rápido do que os modelos existentes. Tenha cuidado para não gritar revolução imediatamente, dito isso. São resultados obtidos em situações muito controladas e ainda estamos longe de um anúncio ao público em geral.