Pentingnya integrasi multimodal ini juga terlihat dalam penggunaan AI untuk meningkatkan pengalaman pengguna dalam sektor perawatan kesehatan, terutama dalam terapi jarak jauh. Dalam beberapa aplikasi, seperti Ginger dan Talkspace, teknologi pengenalan suara dan ekspresi wajah digunakan untuk memberikan terapi yang lebih personal dan responsif, yang meningkatkan kemungkinan keberhasilan perawatan jangka panjang bagi pasien dengan masalah kesehatan mental.
Melihat kemajuan yang pesat ini, semakin jelas bahwa pengembangan AI multimodal yang mampu memahami emosi manusia dengan lebih mendalam membuka pintu bagi aplikasi yang lebih canggih dan berempati. Namun, meskipun ada banyak kemajuan yang menjanjikan, tantangan terkait akurasi, etika, dan privasi data tetap menjadi hambatan yang perlu diatasi agar teknologi ini dapat berkembang lebih lanjut.
Tantangan dan Masalah
Meskipun kemajuan teknologi dalam AI multimodal telah menunjukkan potensi yang signifikan, masih terdapat berbagai tantangan yang perlu diatasi agar sistem ini dapat berfungsi secara optimal dan etis. Tantangan tersebut tidak hanya berkaitan dengan masalah teknis, tetapi juga melibatkan pertimbangan etika, privasi, serta efisiensi energi yang harus diperhatikan dalam pengembangan lebih lanjut. Dalam bagian ini, kita akan menguraikan berbagai masalah utama yang terkait dengan pengembangan dan penerapan AI multimodal yang empatik.
1. Teknis
Salah satu tantangan terbesar dalam pengembangan AI multimodal adalah skala data yang besar dan kompleksitas pemrosesan multimodal. AI yang berempati membutuhkan data dari berbagai sumber---teks, suara, gambar, dan bahkan gerakan tubuh---untuk memahami emosi manusia secara holistik. Mengintegrasikan dan menganalisis data dari berbagai modalitas ini bukanlah hal yang mudah. Menurut laporan oleh McKinsey (2022), 63% dari perusahaan yang mengimplementasikan AI multimodal mengakui bahwa pengolahan data dalam skala besar menjadi tantangan utama. Integrasi data dari berbagai sumber seringkali menimbulkan masalah dalam hal konsistensi dan keakuratan informasi, yang dapat mempengaruhi kemampuan AI dalam membuat keputusan yang tepat.
Selain itu, akurasi dalam memahami emosi yang bersifat ambigu atau kompleks juga menjadi masalah yang signifikan. Emosi manusia seringkali kompleks dan tidak dapat dipahami hanya dengan satu modalitas. Sebagai contoh, analisis sentimen dalam teks bisa saja gagal dalam memahami ironi atau sindiran, sementara analisis suara bisa kesulitan dalam mengenali perasaan dalam konteks yang sangat subtil. Penelitian oleh Li et al. (2021) menunjukkan bahwa meskipun teknologi pengenalan suara semakin maju, banyak sistem AI yang masih kesulitan dalam mendeteksi emosi dalam situasi yang penuh nuansa, seperti perasaan cemas atau kebingungan yang tidak selalu tercermin jelas dalam suara atau kata-kata.
Selain itu, pengenalan mikro ekspresi wajah dan gestur tubuh, yang dapat memberikan wawasan mendalam tentang perasaan seseorang, seringkali terhambat oleh keterbatasan perangkat keras dan software yang digunakan. Misalnya, dalam pengenalan ekspresi wajah, tingkat kesalahan yang terjadi dapat meningkat dalam kondisi pencahayaan yang buruk atau ketika individu mengenakan masker wajah, yang menjadi sangat relevan di era pasca-pandemi. Menurut penelitian oleh Mollahosseini et al. (2017), teknologi pengenalan wajah dapat kehilangan akurasi lebih dari 20% dalam kondisi tersebut.
2. Etika dan Privasi
Masalah etika dan privasi adalah tantangan yang tidak dapat diabaikan dalam pengembangan AI multimodal, terutama ketika sistem ini mulai mengakses dan menganalisis data sensitif yang berkaitan dengan emosi dan perilaku manusia. Pengumpulan data seperti ekspresi wajah, suara, dan bahkan perilaku tubuh menimbulkan kekhawatiran terkait dengan pelanggaran privasi individu. Dalam laporan yang diterbitkan oleh The European Data Protection Supervisor (2020), ada peningkatan kekhawatiran terkait dengan pengumpulan data biometrik tanpa izin yang jelas, yang dapat digunakan untuk manipulasi psikologis atau pengawasan yang berlebihan.
Risiko penyalahgunaan data emosional sangat besar, terutama dalam konteks iklan digital, politik, dan keamanan. Sebagai contoh, analisis emosi berbasis AI dapat digunakan untuk memanipulasi keputusan konsumen atau pemilih dengan cara yang tidak etis, seperti yang terjadi dalam beberapa skandal pengaruh politik yang melibatkan data pengguna di media sosial. Hal ini menuntut pembuat kebijakan dan pengembang untuk memperkenalkan regulasi yang ketat dan transparansi dalam pengumpulan serta penggunaan data sensitif.