В новом шаге, приближающем роботов к человеческому миру, исследователи объявили о заметном технологическом достижении: создании робота, способного обучаться и осваивать одно из самых сложных движений человеческого лица — движение губ во время речи и пения.

Этот прогресс может стать поворотным моментом в будущем человекоподобных роботов, тем более что почти половина человеческого внимания при прямом взаимодействии сосредоточена на мимике и движении губ, делая нас чрезвычайно чувствительными к любым изъянам или неестественности в этих движениях.

До недавнего времени роботы сталкивались со значительными трудностями в имитации естественной манеры движения человеческих губ, часто выглядя несогласованно или «странно».

Это явление научно известно как «эффект зловещей долины» — чувство беспокойства, которое охватывает человека при виде чего-то, что выглядит почти как человек, но движется или ведёт себя не совсем естественно. Однако эта реальность может скоро измениться.

Как робот научился двигать губами?

В среду инженеры представили нового робота, которому впервые удалось обучиться и воспроизводить человеческие движения губ во время речи и даже пения.

Робот научился использовать 26 моторов в своём лице, просматривая часы видео на YouTube, а затем тренируясь в имитации движения губ, наблюдая за своим отражением в зеркале.

В исследовании учёные продемонстрировали, как робот стал способен произносить слова на нескольких языках и даже исполнить целую песню из своего первого альбома под названием «hello world», созданного с помощью искусственного интеллекта.

Робот двигает губами, говорит и поёт как человек
Робот двигает губами, говорит и поёт как человек

Инженеры подтверждают, что производительность робота будет улучшаться со временем, заявляя: «Чем больше он взаимодействует с людьми, тем лучше становятся его результаты».

Несмотря на этот заметный прогресс, исследовательская группа признаёт, что движение губ пока не идеально. У робота возникли трудности с некоторыми сильными звуками, например, с буквой «Б», и теми, что требуют смыкания губ, как буква «В», но считается, что эти проблемы улучшатся с дальнейшими тренировками и обучением.

Отмечается, что многие текущие исследования в области человекоподобных роботов сосредоточены на движении ног и рук для ходьбы или захвата предметов, но выражение эмоций с помощью лица не менее важно, особенно в приложениях, требующих прямого взаимодействия с людьми.

Интеграция способности к синхронизации губ с интерактивными системами ИИ может добавить совершенно новое измерение в отношения человека и робота, делая взаимодействие более естественным и человечным.

Исследователи ожидают, что эти роботы с «живыми лицами» найдут широкое применение в таких областях, как:

  • Развлечения.
  • Образование.
  • Медицина.
  • Уход за пожилыми людьми.

По оценкам некоторых экономистов, в следующем десятилетии может быть произведено более миллиарда человекоподобных роботов.

Один из комментариев гласит: «Нет будущего, в котором человекоподобные роботы были бы без лиц. И если их глаза и губы не будут двигаться правильно, они навсегда останутся странными».

Этот проект является частью долгого исследовательского пути, длящегося более десяти лет, цель которого — заставить роботов учиться общению с людьми вместо того, чтобы быть запрограммированными по жёстким правилам.

В заключение говорится: «Есть что-то завораживающее в том, что происходит, когда робот учится улыбаться или говорить, просто наблюдая за людьми и слушая их. Даже будучи опытным робототехником, я не могу не улыбнуться, когда робот спонтанно улыбается мне».

YouTube

YouTube — это бесплатная онлайн-платформа для обмена видео, основанная в 2005 году, которая позволяет пользователям загружать, просматривать и делиться контентом. Она произвела революцию в потреблении медиа, сделав пользовательский контент доступным в глобальном масштабе, превратившись из простого стартапа в доминирующую культурную силу под управлением Google. Исторически она изменила сферы развлечений, образования и публичного дискурса, сделав видеовещание доступным для любого, у кого есть подключение к интернету.

Эффект зловещей долины

«Эффект зловещей долины» — это не физическое место, а концепция из робототехники и компьютерной графики, описывающая неприятное чувство, которое люди испытывают, когда человекоподобный робот или цифровой персонаж выглядит почти, но не совсем как человек. Термин был введён японским робототехником Масахиро Мори в 1970 году. Он предположил, что по мере того, как искусственные подобия становятся более реалистичными, эмоциональная реакция становится положительной до тех пор, пока не достигается точка крайнего беспокойства, после чего принятие возвращается только при достижении полного реализма.