In un nuovo passo che avvicina i robot al mondo umano, i ricercatori hanno annunciato un notevole traguardo tecnologico: lo sviluppo di un robot capace di apprendere e padroneggiare uno dei movimenti facciali umani più complessi: il movimento delle labbra durante la parola e il canto.

Questo progresso potrebbe rappresentare una svolta per il futuro dei robot umanoidi, soprattutto considerando che quasi metà dell’attenzione umana durante un’interazione diretta è focalizzata sulle espressioni facciali e sul movimento labiale, rendendoci estremamente sensibili a qualsiasi difetto o mancanza di armonia in questi movimenti.

Fino a poco tempo fa, i robot incontravano grandi difficoltà nel mimare il modo naturale in cui gli umani muovono le labbra, apparendo spesso scoordinati o “strani”.

Questo fenomeno è scientificamente noto come “valle inquietante”, la sensazione di disagio che coglie una persona quando vede qualcosa che appare quasi umano ma non si muove o si comporta in modo completamente naturale. Tuttavia, questa realtà potrebbe presto cambiare.

Come ha fatto il robot a imparare a muovere le labbra?

Mercoledì, gli ingegneri hanno presentato un nuovo robot che, per la prima volta, è riuscito ad apprendere e riprodurre i movimenti labiali umani durante la parola e persino il canto.

Il robot ha imparato a usare i 26 motori del suo volto guardando ore di video su YouTube, per poi esercitarsi a imitare il movimento labiale umano osservando il proprio riflesso in uno specchio.

In uno studio, i ricercatori hanno dimostrato come il robot sia diventato capace di pronunciare parole in più lingue, e persino di cantare un intero brano del suo primo album intitolato “hello world”, creato utilizzando l’intelligenza artificiale.

Un robot che muove le labbra, parla e canta come un umano
Un robot che muove le labbra, parla e canta come un umano

Gli ingegneri confermano che le prestazioni del robot miglioreranno nel tempo, affermando: “Più interagisce con gli umani, migliori diventano le sue prestazioni.”

Nonostante questo progresso notevole, il team di ricerca riconosce che il movimento labiale non è ancora perfetto. Il robot ha avuto difficoltà con alcuni suoni forti come la lettera “B”, e quelli che richiedono la chiusura delle labbra come la “W”, ma si ritiene che questi problemi miglioreranno con ulteriore addestramento e apprendimento.

Si nota che gran parte della ricerca attuale sui robot umanoidi si concentra sul movimento di gambe e mani per camminare o afferrare oggetti, ma esprimere emozioni attraverso il volto non è meno importante, specialmente nelle applicazioni che richiedono interazione diretta con gli umani.

Integrare la capacità di sincronizzazione labiale con sistemi di IA interattivi potrebbe aggiungere una dimensione completamente nuova alla relazione uomo-robot, rendendo l’interazione più naturale e umana.

I ricercatori si aspettano che questi robot con “volti viventi” trovino ampie applicazioni in settori come:

  • Intrattenimento.
  • Educazione.
  • Medicina.
  • Assistenza agli anziani.

Alcuni economisti stimano che nel prossimo decennio potrebbero essere prodotti oltre un miliardo di robot umanoidi.

Un commento afferma: “Non esiste un futuro in cui i robot umanoidi siano senza volto. E se i loro occhi e le loro labbra non si muovono correttamente, rimarranno per sempre strani.”

Questo progetto fa parte di un lungo percorso di ricerca durato oltre dieci anni, che mira a far sì che i robot imparino a comunicare con gli umani invece di essere programmati con regole rigide.

La dichiarazione conclude: “C’è qualcosa di incantevole che accade quando un robot impara a sorridere o parlare semplicemente guardando e ascoltando gli umani. Anche come roboticista esperto, non posso fare a meno di sorridere quando il robot mi sorride spontaneamente.”

YouTube

YouTube è una piattaforma online gratuita per la condivisione di video, fondata nel 2005, che consente agli utenti di caricare, visualizzare e condividere contenuti. Ha rivoluzionato il consumo mediatico rendendo possibile la diffusione globale di contenuti generati dagli utenti, crescendo da una semplice startup a una forza culturale dominante di proprietà di Google. Storicamente, ha trasformato l’intrattenimento, l’educazione e il discorso pubblico rendendo la trasmissione video accessibile a chiunque abbia una connessione internet.

Valle inquietante

La “valle inquietante” non è un luogo fisico ma un concetto della robotica e della computer grafica che descrive la sensazione di disagio provata dalle persone quando un robot umanoide o un personaggio digitale appare quasi, ma non perfettamente, umano. Il termine è stato coniato dal roboticista giapponese Masahiro Mori nel 1970, il quale propose che, man mano che le somiglianze artificiali diventano più realistiche, la risposta emotiva diventa positiva fino a un punto di estremo disagio, prima di tornare ad essere di accettazione per un realismo perfetto.