В новом шаге, приближающем роботов к человеческому миру, исследователи объявили о заметном технологическом достижении: создании робота, способного обучаться и осваивать одно из самых сложных движений человеческого лица — движение губ во время речи и пения.
Этот прогресс может стать поворотным моментом в будущем человекоподобных роботов, тем более что почти половина человеческого внимания при прямом взаимодействии сосредоточена на мимике и движении губ, делая нас чрезвычайно чувствительными к любым изъянам или неестественности в этих движениях.
До недавнего времени роботы сталкивались со значительными трудностями в имитации естественной манеры движения человеческих губ, часто выглядя несогласованно или «странно».
Это явление научно известно как «эффект зловещей долины» — чувство беспокойства, которое охватывает человека при виде чего-то, что выглядит почти как человек, но движется или ведёт себя не совсем естественно. Однако эта реальность может скоро измениться.
Как робот научился двигать губами?
В среду инженеры представили нового робота, которому впервые удалось обучиться и воспроизводить человеческие движения губ во время речи и даже пения.
Робот научился использовать 26 моторов в своём лице, просматривая часы видео на YouTube, а затем тренируясь в имитации движения губ, наблюдая за своим отражением в зеркале.
В исследовании учёные продемонстрировали, как робот стал способен произносить слова на нескольких языках и даже исполнить целую песню из своего первого альбома под названием «hello world», созданного с помощью искусственного интеллекта.

Инженеры подтверждают, что производительность робота будет улучшаться со временем, заявляя: «Чем больше он взаимодействует с людьми, тем лучше становятся его результаты».
Несмотря на этот заметный прогресс, исследовательская группа признаёт, что движение губ пока не идеально. У робота возникли трудности с некоторыми сильными звуками, например, с буквой «Б», и теми, что требуют смыкания губ, как буква «В», но считается, что эти проблемы улучшатся с дальнейшими тренировками и обучением.
Отмечается, что многие текущие исследования в области человекоподобных роботов сосредоточены на движении ног и рук для ходьбы или захвата предметов, но выражение эмоций с помощью лица не менее важно, особенно в приложениях, требующих прямого взаимодействия с людьми.
Интеграция способности к синхронизации губ с интерактивными системами ИИ может добавить совершенно новое измерение в отношения человека и робота, делая взаимодействие более естественным и человечным.
Исследователи ожидают, что эти роботы с «живыми лицами» найдут широкое применение в таких областях, как:
- Развлечения.
- Образование.
- Медицина.
- Уход за пожилыми людьми.
По оценкам некоторых экономистов, в следующем десятилетии может быть произведено более миллиарда человекоподобных роботов.
Один из комментариев гласит: «Нет будущего, в котором человекоподобные роботы были бы без лиц. И если их глаза и губы не будут двигаться правильно, они навсегда останутся странными».
Этот проект является частью долгого исследовательского пути, длящегося более десяти лет, цель которого — заставить роботов учиться общению с людьми вместо того, чтобы быть запрограммированными по жёстким правилам.
В заключение говорится: «Есть что-то завораживающее в том, что происходит, когда робот учится улыбаться или говорить, просто наблюдая за людьми и слушая их. Даже будучи опытным робототехником, я не могу не улыбнуться, когда робот спонтанно улыбается мне».