Jadi LLaVa ini memang AI yang secara khusus menjelaskan tentang gambar apapun yang diunggah oleh penggunanya ke lamannya. Tapi sekali lagi ini baru versi yang saat ini, bisa jadi pengembangan berikutnya akan mampu menelusuri suatu foto ke search engines.
Kalau LLaVa bisa melakukan itu, wah sungguh mantap. LLaVA bakal mampu menyimpulkan sebuah gambar real atau fake, hingga mengidentifikasi disinformasi dan hoaks.
Selain Bahasa Inggris, LLaVa juga bisa menjelaskan dalam Bahasa Indonesia. Ini karena LLaVa merupakan mutilingual model yang mampu memahami banyak bahasa. Tinggal menyapanya dalam bahasa tertentu, maka LLaVa akan meresponnya dengan bahasa yang kita pilih. Hebat, bukan?
Riset LLaVa masih terus dilakukan dan pastinya bakal ada pemutakhiran teknologi di masa depan. Saya membayangkan kalau aplikasi ini di masa depan bakal sangat bermanfaat untuk membantu orang-orang misalnya penyandang tunanetra. Apabila LLaVa dikoneksikan dengan aplikasi text-to-speech, mereka pastinya akan sangat terbantu.
Kedepannya lagi, aplikasi ini juga mungkin akan dikoneksikan dengan teknologi robotika agar robot memiliki kemampuan mengenali obyek tertentu. Setelah mampu menginterpretasi gambar atau foto, bisa jadi pengembangan berikutnya adalah mengenali citra bergerak seperti video.
***
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H