
O próximo estágio da inteligência artificial será a IA material, ou “IA Física”. Em outras palavras, terá uma presença físico graças aos robôs. Porém, quando a IA tiver rosto, ela terá que aprender um novo talento para poder interagir com os humanos de maneira fluida: mover os lábios para dar a impressão de estar falando.
Em um novo estudo publicado na revista Robótica Científicapesquisadores da Universidade de Columbia, nos Estados Unidos, ensinaram um robô a dominar a sincronização labial, ou sincronização labialgraças a YouTube. O robô está equipado com uma face flexível, contendo 26 motores que lhe permitem criar diferentes expressões.
Ele foi colocado pela primeira vez na frente de um espelho para permitir que ele aprenda como seu rosto se distorce, como uma criança. Ele se baseia em um modelo de visão-linguagem-ação (VLA) e, portanto, aprendeu a criar diferentes expressões.
Superando o mal-estar do “vale misterioso”
Após esta primeira fase, o robô assistiu a vídeos de seres humanos falando ou cantando para aprender o movimentos lábios dependendo dos sons emitidos. Ele foi exposto a vários sons e línguas, bem como a canções. Os pesquisadores divulgaram um vídeo bastante convincente do robô falando em diferentes idiomas, incluindo inglês, francês, japonês, coreano, espanhol, italiano e alemão.
Os resultados ainda não são perfeitos. O robô tem dificuldade especial com determinados sons, como B ou W. No entanto, os pesquisadores acreditam que seu desempenho melhorará com o treinamento.
“ Quando a capacidade de sincronização labial é combinada com IA de conversação, como Bate-papoGPT ou Gêmeos, o efeito adiciona uma profundidade totalmente nova à conexão que o robô faz com o ser humano “, diz Yuhang Hu, um dos autores. Quanto mais ele interagir com os humanos, mais realista ele parecerá. Os pesquisadores esperam aliviar o problema do vale misterioso, ou vale misteriosoem que um robô imitando imperfeitamente um humano causa rejeição e sentimento de desconforto.