Sonantic siap meyakinkan pendengar bahwa suara sintetis bisa menangis

Sonantic siap meyakinkan pendengar sehingga suara sintetis bisa menangis

 

Sonantic siap meyakinkan pendengar bahwa suara sintetis bisa menangis

Sonantic siap meyakinkan pendengar bahwa suara sintetis bisa menangis

Ketika Anda memikirkan asisten suara seperti Amazon Alexa dan Apple Siri, kata-kata “emosional” dan “ekspresif” mungkin tidak muncul di benak Anda. Sebaliknya, ada suara datar dan sopan yang dikenali, tanpa semua pengaruh – yang baik untuk asisten, tetapi tidak akan berfungsi jika Anda ingin menggunakan suara-suara sintetis dalam permainan, film dan media penceritaan lainnya.

Itu sebabnya sebuah startup bernama Sonantic sedang mencoba untuk menciptakan AI yang meyakinkan dapat menangis dan menyampaikan “emosi manusia yang mendalam.” Startup yang berbasis di Inggris mengumumkan bulan lalu bahwa mereka telah mengumpulkan € 2.3 juta dana yang dipimpin oleh EQT Ventures , dan hari ini merilis video yang menunjukkan kemampuan teknologi yang dimilikinya.

Anda dapat menilai hasilnya sendiri di video di bawah ini; Sonanticmengatakan semua suara diciptakan oleh teknologinya. Secara pribadi, saya tidak yakin saya akan mengatakan pertunjukan itu dapat dipertukarkan dengan aktor suara manusia yang berbakat – tetapi mereka tentu lebih mengesankan daripada apa pun sintetis yang pernah saya dengar sebelumnya.

Produk sebenarnya Sonantic adalah editor audio yang sudah diuji dengan pembuat

game. Editor menyertakan berbagai model suara yang berbeda, dan salah satu pendiri dan CEO Zeena Qureshi mengatakan model-model tersebut didasarkan dan dikembangkan dengan aktor suara yang sebenarnya, yang kemudian mendapat bagian dalam keuntungan.

“Kami mempelajari detail suara, nuansa napas,” kata Qureshi. “Suara itu sendiri perlu menceritakan sebuah kisah.”

Co-founder dan CTO John Flynn menambahkan bahwa studio game adalah titik awal yang jelas, karena mereka sering perlu merekam puluhan ribu garis dialog. Ini dapat memungkinkan mereka untuk beralih lebih cepat, katanya, untuk mengubah suara untuk keadaan dalam game yang berbeda (seperti ketika karakter berjalan dan harus terdengar seperti mereka kehabisan napas) dan untuk menghindari ketegangan suara ketika karakter seharusnya melakukan hal-hal seperti menangis atau berteriak.

Pada saat yang sama, Flynn berasal dari dunia pasca-produksi film, dan ia menyarankan bahwa teknologi ini berlaku untuk banyak industri di luar game. Tujuannya bukan untuk menggantikan aktor, tetapi untuk mengeksplorasi jenis peluang bercerita yang baru.

“Lihat seberapa banyak teknologi CGI telah mendukung film aksi langsung,” katanya.

“Ini bukan-atau-itu. Teknologi baru memungkinkan Anda untuk menceritakan kisah baru dengan cara yang fantastis. ”

Sonantic juga menghubungkan saya dengan Arabella Day, salah satu aktor yang membantu mengembangkan model suara awal. Day ingat menghabiskan waktu berjam-jam merekam saluran yang berbeda, lalu akhirnya menerima panggilan telepon dari Flynn, yang kemudian memainkannya versi sintetis dari suaranya sendiri.

“Saya berkata kepadanya, ‘Apakah itu saya? Apakah saya merekamnya? ‘ ”Kenangnya.

Dia menggambarkan pekerjaan dengan Sonantic sebagai “kemitraan nyata,” di mana dia memberikan rekaman dan umpan balik baru untuk terus meningkatkan model (tampaknya karya terbarunya melibatkan aksen Amerika). Dia mengatakan perusahaan ingin dia merasa nyaman dengan bagaimana suaranya dapat digunakan, bahkan bertanya apakah ada perusahaan yang dia ingin daftar hitam.

“Sebagai seorang aktor, saya sama sekali tidak berpikir bahwa masa depan akting

adalah AI,” kata Day. “Saya berharap ini adalah salah satu komponen dari apa yang saya lakukan, keunggulan tambahan yang mungkin saya miliki.”

Pada saat yang sama, dia mengatakan bahwa ada kekhawatiran “sah” di banyak bidang tentang AI menggantikan pekerja manusia.

“Jika itu akan menjadi masa depan hiburan, saya ingin menjadi bagian dari itu,” katanya. “Tapi aku ingin menjadi bagian dari itu dan bekerja dengannya.”

Baca Juga: