Mohon tunggu...
Zeanonim
Zeanonim Mohon Tunggu... -

commoner yang terjebak di belantara Ibukota, mencari sesuap nasi melalui hal-hal ghaib (IT) dan penikmat keindahan dari secercah cahaya (photography)

Selanjutnya

Tutup

Inovasi Pilihan

Visualisasi Artikel

13 Januari 2017   16:23 Diperbarui: 14 Januari 2017   10:39 410
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
hash : 0f3f1dcf9f83d34fe3adff85fb41c09ab3affd28e338e3fdf914f3b1ef09ef52

Bagaimana jadinya apabila sebuah tulisan (artikel/text) dapat diproyeksikan ke dalam sebuah gambar? Tulisan ini misalnya. Kira - kira wujudnya akan seperti gambar diatas

Kebetulan saat ini saya sedang banyak berinteraksi dengan teknik komputasi untuk mencari gambar yang serupa untuk keperluan tertentu dengan algoritma yang dinamakan perceptual hashing. Apabila algoritma hash yang umum dipakai seperti MD5, SHA, Blake2 sangat sensitive terhadap sedikit perbedaan (baik isi maupun urutan data), maka justru sebaliknya algoritma perceptual hash sangat dapat mengkompensasi perbedaan - perbedaan yang tidak signifikan, karena itu algoritma ini sangat cocok untuk menghitung kemiripan dua data yang berbeda

Dari pekerjaan ini, saya terfikir, mengapa tidak menggunakan teknik yang sama untuk mencari kemiripan data tekstual? Sayangnya algoritma ini tidak dapat digunakan begitu saja untuk memproses data textual, karena algoritma ini bekerja untuk data binary seperti pixel atau suara. Maka tantangannya adalah bagaimana memproyeksikan suatu teks menjadi sebuah gambar, dengan begitu gambar akan dapat diproses menggunakan teknik perceptual hash yang selama ini saya gunakan.

Setelah melalui serangkaian percobaan, saya mendapatkan bentuk gambar yang berguna (workable), dan gambar diatas adalah salah satu contohnya.

Manfaat

Anda mungkin bertanya - tanya apa gunanya memproyeksikan data tekstual menjadi sebuah gambar? Beberapa kegunaan yang terfikir oleh saya dan dapat dikembangkan lagi adalah diantaranya untuk mendeteksi plagiarisme, kemudian bisa juga digunakan sebagai semacam "sidik jari" artikel, yang apabila dikaitkan dengan trend "hoax" maka dapat dikembangkan untuk mendeteksi artikel - artikel yang mengandung hoax.

Manfaat lain adalah sebagai input deep learning yang menggunakan model ImageNet atau semacamnya, kemudian dengan tambahan pemetaan kamus dapat juga untuk memvisualisasi kecenderungan sebuah tulisan terhadap sebuah sentimen (negatif atau positif) dan lain - lain

Perlu diingat, bahwa ini masih dalam tahap gagasan, meskipun saya sudah membuat demonstrasinya, namun validitasnya masih perlu dikaji dengan data - data real.Berikut adalah visualisasi dari beberapa artikel yang saya ambil dari headline kompas.com hari ini

Note : Ukuran gambar aslinya adalah 256 x 256, gambar yang ditayangkan sudah melalui perbesaran secara digital

hash : 4cf7788f3ddcd49ace27f044e9833bd1bdf1fda0dcb8bc6af993c149bdd74a57
hash : 4cf7788f3ddcd49ace27f044e9833bd1bdf1fda0dcb8bc6af993c149bdd74a57
Diambil dari artikel ini

hash : 6fedf59d07e885f38f87fec7fce0fd28be2be5f8ffd8c9c4fe0fff19e38153c3
hash : 6fedf59d07e885f38f87fec7fce0fd28be2be5f8ffd8c9c4fe0fff19e38153c3
diambil dari artikel ini

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Inovasi Selengkapnya
Lihat Inovasi Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun