Pesan Populer

Pilihan Editor - 2019

Membuat TV Anda lebih memahami Anda

Anonim

Penelitian baru dari University of Waterloo telah menemukan cara untuk meningkatkan kemampuan pemahaman permintaan suara dari platform hiburan rumah.

iklan


Penelitian ini, bekerja sama dengan Universitas Maryland dan Comcast Applied AI Research Lab, menggunakan teknologi kecerdasan buatan (AI) untuk mencapai interaksi berbasis percakapan yang paling alami dengan TV hingga saat ini.

"Hari ini, kami sudah terbiasa berbicara dengan agen cerdas yang melakukan penawaran kami - dari Siri di ponsel ke Alexa di rumah. Mengapa kami tidak bisa melakukan hal yang sama dengan TV?" tanya Jimmy Lin, seorang profesor di University of Waterloo dan David R. Cheriton Chair di David R. Cheriton School of Computer Science.

"Comcast's Xfinity X1 bertujuan untuk melakukan hal itu - platform dilengkapi dengan 'voice remote' yang menerima pertanyaan yang diucapkan. Keinginan Anda adalah perintahnya - beri tahu TV Anda untuk mengubah saluran, tanyakan tentang film anak-anak gratis, dan bahkan tentang ramalan cuaca."

Dalam menangani masalah rumit dalam memahami pertanyaan suara, para peneliti memiliki gagasan untuk memanfaatkan teknologi AI terbaru - teknik yang dikenal sebagai jaringan saraf berulang hirarkis - untuk konteks model yang lebih baik dan meningkatkan akurasi sistem.

Pada Januari 2018, model jaringan saraf baru para peneliti dikerahkan dalam produksi untuk menjawab pertanyaan dari pengguna nyata. Tidak seperti sistem sebelumnya, yang bingung oleh sekitar delapan persen pertanyaan, model baru menangani sebagian besar pertanyaan yang sangat rumit secara tepat, sangat meningkatkan pengalaman pengguna.

"Jika pemirsa meminta 'Chicago Fire, ' yang mengacu pada serial drama dan tim sepak bola, sistem ini mampu menguraikan apa yang benar-benar Anda inginkan, " kata Lin. "Apa yang istimewa dari pendekatan ini adalah kami memanfaatkan konteks - seperti acara yang sebelumnya ditonton dan saluran favorit - untuk mempersonalisasi hasil, sehingga meningkatkan akurasi."

Para peneliti mulai bekerja mengembangkan model yang lebih kaya. Intuisi adalah bahwa dengan menganalisis pertanyaan dari berbagai perspektif, sistem dapat lebih memahami apa yang dikatakan pemirsa.

Makalah ini, Multi-Task Learning dengan Neural Networks untuk Voice Query Understanding Entertainment Platform, dipresentasikan pada Konferensi Internasional ACM SIGKDD 24 pada Penemuan Pengetahuan & Penambangan Data yang diadakan baru-baru ini di Inggris. Penelitian ini dilakukan oleh Jinfeng Rao, seorang lulusan PhD dari Universitas Maryland, penasihatnya Lin, dan mentor Ferhan Ture, seorang peneliti di Comcast Applied AI Research Lab.

iklan



Sumber Cerita:

Materi yang disediakan oleh University of Waterloo . Catatan: Konten dapat diedit untuk gaya dan panjang.