En un nuevo paso que acerca a los robots al mundo humano, investigadores han anunciado un logro tecnológico notable: el desarrollo de un robot capaz de aprender y dominar uno de los movimientos faciales humanos más complejos: el movimiento de los labios al hablar y cantar.

Este avance podría representar un punto de inflexión en el futuro de los robots humanoides, sobre todo porque casi la mitad de la atención humana durante una interacción directa se centra en las expresiones faciales y el movimiento labial, lo que nos hace muy sensibles a cualquier fallo o falta de armonía en estos movimientos.

Hasta hace poco, los robots tenían una gran dificultad para imitar la forma natural en que los humanos mueven los labios, a menudo pareciendo descoordinados o «extraños».

Este fenómeno se conoce científicamente como el «valle inquietante», la sensación de desasosiego que invade a una persona al ver algo que parece casi humano pero no se mueve o se comporta de una manera completamente natural. Sin embargo, esta realidad podría cambiar pronto.

¿Cómo aprendió el robot a mover los labios?

El miércoles, ingenieros presentaron un nuevo robot que, por primera vez, logró aprender y reproducir los movimientos labiales humanos durante el habla e incluso el canto.

El robot aprendió a usar 26 motores en su cara viendo horas de vídeo en YouTube, y luego practicó imitar el movimiento labial humano observando su reflejo en un espejo.

En un estudio, los investigadores demostraron cómo el robot se volvió capaz de pronunciar palabras en múltiples idiomas, e incluso de cantar una canción completa de su primer álbum titulado «hello world», creado con inteligencia artificial.

Un robot moviendo los labios, hablando y cantando como un humano
Un robot moviendo los labios, hablando y cantando como un humano

Los ingenieros confirman que el rendimiento del robot mejorará con el tiempo, afirmando: «Cuanto más interactúe con humanos, mejor será su desempeño».

A pesar de este progreso notable, el equipo de investigación reconoce que el movimiento labial aún no es perfecto. El robot tuvo dificultades con algunos sonidos fuertes como la letra «B», y aquellos que requieren el cierre de los labios como la letra «W», pero se cree que estos problemas mejorarán con más entrenamiento y aprendizaje.

Se observa que gran parte de la investigación actual en robots humanoides se centra en el movimiento de piernas y manos para caminar o agarrar objetos, pero expresar emociones a través del rostro no es menos importante, especialmente en aplicaciones que requieren interacción directa con humanos.

Integrar la capacidad de sincronización labial con sistemas de IA interactivos podría añadir una dimensión completamente nueva a la relación humano-robot, haciendo la interacción más natural y humana.

Los investigadores esperan que estos robots con «rostros vivos» encuentren amplias aplicaciones en campos como:

  • Entretenimiento.
  • Educación.
  • Medicina.
  • Cuidado de ancianos.

Algunos economistas estiman que se podrían fabricar más de mil millones de robots humanoides en la próxima década.

Un comentario afirma: «No hay futuro en el que los robots humanoides carezcan de rostro. Y si sus ojos y labios no se mueven correctamente, permanecerán extraños para siempre».

Este proyecto es parte de un largo viaje de investigación que abarca más de diez años, con el objetivo de hacer que los robots aprendan a comunicarse con humanos en lugar de ser programados con reglas rígidas.

La declaración concluye: «Hay algo fascinante que sucede cuando un robot aprende a sonreír o hablar simplemente observando y escuchando a los humanos. Incluso como un robótico experimentado, no puedo evitar sonreír cuando el robot me sonríe espontáneamente».

YouTube

YouTube es una plataforma gratuita en línea para compartir vídeos, fundada en 2005, que permite a los usuarios subir, ver y compartir contenido. Revolucionó el consumo de medios al permitir contenido generado por usuarios a escala global, pasando de una simple startup a una fuerza cultural dominante propiedad de Google. Históricamente, ha transformado el entretenimiento, la educación y el discurso público al hacer la transmisión de vídeo accesible para cualquiera con conexión a internet.

Valle inquietante

El «valle inquietante» no es un lugar físico, sino un concepto de la robótica y los gráficos por computadora que describe la sensación de desasosiego que experimentan las personas cuando un robot humanoide o un personaje digital se ve casi, pero no perfectamente, humano. El término fue acuñado por el robótico japonés Masahiro Mori en 1970, quien propuso que, a medida que las imitaciones artificiales se vuelven más realistas, la respuesta emocional se vuelve positiva hasta alcanzar un punto de gran incomodidad, antes de que la aceptación regrese para un realismo perfecto.