Bagaimana jadinya apabila sebuah tulisan (artikel/text) dapat diproyeksikan ke dalam sebuah gambar? Tulisan ini misalnya. Kira - kira wujudnya akan seperti gambar diatas
Kebetulan saat ini saya sedang banyak berinteraksi dengan teknik komputasi untuk mencari gambar yang serupa untuk keperluan tertentu dengan algoritma yang dinamakan perceptual hashing. Apabila algoritma hash yang umum dipakai seperti MD5, SHA, Blake2 sangat sensitive terhadap sedikit perbedaan (baik isi maupun urutan data), maka justru sebaliknya algoritma perceptual hash sangat dapat mengkompensasi perbedaan - perbedaan yang tidak signifikan, karena itu algoritma ini sangat cocok untuk menghitung kemiripan dua data yang berbeda
Dari pekerjaan ini, saya terfikir, mengapa tidak menggunakan teknik yang sama untuk mencari kemiripan data tekstual? Sayangnya algoritma ini tidak dapat digunakan begitu saja untuk memproses data textual, karena algoritma ini bekerja untuk data binary seperti pixel atau suara. Maka tantangannya adalah bagaimana memproyeksikan suatu teks menjadi sebuah gambar, dengan begitu gambar akan dapat diproses menggunakan teknik perceptual hash yang selama ini saya gunakan.
Setelah melalui serangkaian percobaan, saya mendapatkan bentuk gambar yang berguna (workable), dan gambar diatas adalah salah satu contohnya.
Manfaat
Anda mungkin bertanya - tanya apa gunanya memproyeksikan data tekstual menjadi sebuah gambar? Beberapa kegunaan yang terfikir oleh saya dan dapat dikembangkan lagi adalah diantaranya untuk mendeteksi plagiarisme, kemudian bisa juga digunakan sebagai semacam "sidik jari" artikel, yang apabila dikaitkan dengan trend "hoax" maka dapat dikembangkan untuk mendeteksi artikel - artikel yang mengandung hoax.
Manfaat lain adalah sebagai input deep learning yang menggunakan model ImageNet atau semacamnya, kemudian dengan tambahan pemetaan kamus dapat juga untuk memvisualisasi kecenderungan sebuah tulisan terhadap sebuah sentimen (negatif atau positif) dan lain - lain
Perlu diingat, bahwa ini masih dalam tahap gagasan, meskipun saya sudah membuat demonstrasinya, namun validitasnya masih perlu dikaji dengan data - data real.Berikut adalah visualisasi dari beberapa artikel yang saya ambil dari headline kompas.com hari ini
Note : Ukuran gambar aslinya adalah 256 x 256, gambar yang ditayangkan sudah melalui perbesaran secara digital