Mohon tunggu...
Bisnis Digital 2022D
Bisnis Digital 2022D Mohon Tunggu... Mahasiswa - Universitas Negeri Surabaya

Untuk Keperluan Mata Kuliah Manajemen Operasi yang di ajar Renny Sari Dewi, S.Kom., M.Kom.

Selanjutnya

Tutup

Artificial intelligence

Dari Teks ke Visual: Menjelajahi Kekuatan AI dalam Representasi Gambar

20 November 2023   13:45 Diperbarui: 28 November 2023   18:10 174
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Bagikan ide kreativitasmu dalam bentuk konten di Kompasiana | Sumber gambar: Freepik

Ditulis oleh: Wisnu Adi Pratama

Di era digital, di mana visual dan teks bercampur dengan mulus, memahami persimpangan dari kedua medium ini lebih penting dari sebelumnya. Artikel penelitian "Picture it in your mind: generating high level visual representations from textual descriptions" oleh Fabio Carrara dan timnya membuka jendela ke dunia yang menarik ini. Di sini, kita akan mengeksplorasi karya terobosan mereka, yang menjembatani kesenjangan antara deskripsi teksual dan representasi visual.

Tantangan Penerjemahan Teks ke Gambar

Era digital telah menyaksikan peningkatan eksponensial dalam konten multimedia, di mana gambar dan teks hidup bersama dalam ekosistem yang kompleks. Tantangan utama yang diatasi oleh Carrara dan timnya adalah menerjemahkan deskripsi teksual menjadi representasi visual. Proses ini vital untuk meningkatkan mesin pencari gambar dan aplikasi multimedia, di mana efisiensi dan akurasi dalam mengambil gambar yang tepat berdasarkan kueri teks sangat penting.

Inovasi dengan Neural Networks

Inti dari penelitian Carrara et al. berputar di sekitar model jaringan saraf inovatif. Model-model ini dirancang untuk memprediksi fitur visual (mirip dengan yang diekstraksi oleh deep Convolutional Neural Networks) dari teks. Studi ini memperkenalkan tiga model yang berbeda:

  1. S-Text2Vis: Menggunakan representasi teks yang jarang seperti kantong kata dan kantong bigram.

  2. D-Text2Vis: Menggunakan representasi yang padat melalui penyematan kata, memanfaatkan jaringan berulang dalam.

  3. W&D-Text2Vis: Pendekatan hibrida yang menggabungkan representasi teks yang jarang dan padat.

Setiap model menawarkan jalur unik untuk memahami dan menerjemahkan nuansa data teksual menjadi bentuk visual.

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Artificial intelligence Selengkapnya
Lihat Artificial intelligence Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun