Dalam langkah baru yang mendekatkan robot ke dunia manusia, para peneliti mengumumkan pencapaian teknologi yang menonjol: pengembangan robot yang mampu mempelajari dan menguasai salah satu gerakan wajah manusia paling kompleks: gerakan bibir saat berbicara dan bernyanyi.

Kemajuan ini bisa menjadi titik balik bagi masa depan robot humanoid, terlebih karena hampir setengah perhatian manusia selama interaksi langsung terfokus pada ekspresi wajah dan gerak bibir, membuat kita sangat sensitif terhadap cacat atau ketidakselarasan dalam gerakan tersebut.

Hingga saat ini, robot menghadapi kesulitan besar dalam meniru cara alami manusia menggerakkan bibir, sering kali terlihat tidak terkoordinasi atau “aneh”.

Fenomena ini secara ilmiah dikenal sebagai “uncanny valley” (lembah keanehan), perasaan tidak nyaman yang muncul saat seseorang melihat sesuatu yang tampak hampir manusiawi tetapi tidak bergerak atau berperilaku secara alami. Namun, realitas ini mungkin segera berubah.

Bagaimana robot belajar menggerakkan bibir?

Pada hari Rabu, para insinyur memperkenalkan robot baru yang, untuk pertama kalinya, berhasil mempelajari dan mereproduksi gerakan bibir manusia saat berbicara bahkan bernyanyi.

Robot itu belajar menggunakan 26 motor di wajahnya dengan menonton berjam-jam video di YouTube, lalu berlatih meniru gerakan bibir manusia dengan mengamati bayangannya di cermin.

Dalam sebuah studi, para peneliti menunjukkan bagaimana robot menjadi mampu mengucapkan kata-kata dalam berbagai bahasa, bahkan menyanyikan lagu lengkap dari album pertamanya berjudul “hello world”, yang dibuat menggunakan kecerdasan buatan.

Robot menggerakkan bibir, berbicara, dan bernyanyi seperti manusia
Robot menggerakkan bibir, berbicara, dan bernyanyi seperti manusia

Para insinyur memastikan bahwa kinerja robot akan meningkat seiring waktu, dengan menyatakan, “Semakin banyak ia berinteraksi dengan manusia, semakin baik kinerjanya.”

Terlepas dari kemajuan yang signifikan ini, tim peneliti mengakui bahwa gerakan bibirnya belum sempurna. Robot mengalami kesulitan dengan beberapa suara keras seperti huruf “B”, dan suara yang memerlukan penutupan bibir seperti huruf “W”, tetapi diyakini masalah ini akan membaik dengan lebih banyak pelatihan dan pembelajaran.

Perlu dicatat bahwa banyak penelitian robot humanoid saat ini berfokus pada gerakan kaki dan tangan untuk berjalan atau menggenggam benda, tetapi mengekspresikan emosi melalui wajah tidak kalah pentingnya, terutama dalam aplikasi yang memerlukan interaksi langsung dengan manusia.

Integrasi kemampuan sinkronisasi bibir dengan sistem AI interaktif dapat menambah dimensi baru dalam hubungan manusia-robot, membuat interaksi lebih alami dan manusiawi.

Para peneliti memperkirakan robot dengan “wajah hidup” ini akan menemukan aplikasi luas di bidang-bidang seperti:

  • Hiburan.
  • Pendidikan.
  • Kedokteran.
  • Perawatan lansia.

Beberapa ekonom memperkirakan lebih dari satu miliar robot humanoid bisa diproduksi dalam dekade mendatang.

Satu komentar menyatakan: “Tidak ada masa depan di mana robot humanoid tanpa wajah. Dan jika mata dan bibir mereka tidak bergerak dengan benar, mereka akan tetap terasa aneh selamanya.”

Proyek ini adalah bagian dari perjalanan penelitian panjang yang berlangsung lebih dari sepuluh tahun, bertujuan membuat robot belajar berkomunikasi dengan manusia alih-alih diprogram dengan aturan kaku.

Pernyataan itu menyimpulkan: “Ada sesuatu yang memesona yang terjadi ketika robot belajar tersenyum atau berbicara hanya dengan menonton dan mendengarkan manusia. Bahkan sebagai seorang roboticist berpengalaman, saya tidak bisa tidak tersenyum ketika robot tersenyum kepada saya secara spontan.”

YouTube

YouTube adalah platform berbagi video online gratis yang didirikan pada 2005, memungkinkan pengguna mengunggah, menonton, dan membagikan konten. Platform ini merevolusi konsumsi media dengan memungkinkan konten buatan pengguna dalam skala global, berkembang dari startup sederhana menjadi kekuatan budaya dominan yang dimiliki Google. Secara historis, YouTube telah mengubah hiburan, pendidikan, dan wacana publik dengan membuat siaran video dapat diakses siapa pun yang memiliki koneksi internet.

Uncanny Valley (Lembah Keanehan)

“Uncanny valley” (lembah keanehan) bukanlah tempat fisik, melainkan konsep dalam robotika dan grafis komputer yang menggambarkan perasaan tidak nyaman yang dialami orang ketika robot humanoid atau karakter digital terlihat hampir, tetapi tidak sempurna, seperti manusia. Istilah ini dicetuskan oleh roboticist Jepang Masahiro Mori pada 1970, yang mengusulkan bahwa ketika kemiripan buatan menjadi lebih realistis, respons emosional menjadi positif hingga mencapai titik ketidaknyamanan ekstrem, sebelum penerimaan kembali terjadi untuk realisme sempurna.