Sebagai seorang game designer dan toys designer, saya selalu membutuhkan referensi visual pada tahap pembuatan prototype untuk menunjang visualisasi yang mendekati hasil akhir.
Saya akan membuat artikel berseri seputar artificial intelligence khususnya dalam penerapan di bidang industri kreatif, jadi jangan lupa follow akun ini dan beri komentar. Sebagian besar gambar atau ilustrasi dalam artikel yang ditulis akan banyak menggunakan hasil dari mesin kecerdasan buatan.
Kehadiran kecerdasan buatan sangat membantu pekerjaan saya. Dari beberapa alternatif kecerdasan buatan penciptaan gambar yang telah saya observasi dan uji coba maka pilihannya jatuh pada Midjourney (MJ) dan Stable Difusion (SD).
Kedua kecerdasan buatan ini mampu menghasilkan visual gambar yang sangat realistis. Yang membedakan keduanya adalah MJ bersifat berbayar dan tertutup sumbernya dan SD ada versi berbasar dan versi sumber terbuka atau open source.
Tentu SD yang bersifat terbuka ini menjadi sangat progresif pengembangannya, bahkan dalam hitungan minggu sudah muncul update terbaru dengan melibatkan komunitas dari seluruh dunia.
Kecerdasan Buatan (Artificial Intelligence/AI) merupakan suatu teknologi yang mampu memberikan kemampuan pada mesin untuk melakukan tugas yang sebelumnya hanya bisa dilakukan oleh manusia, seperti pengenalan gambar atau bahasa alami.
Salah satu aplikasi dari AI yang sedang berkembang pesat adalah dalam pembuatan gambar, di mana mesin dapat "menggambar" sendiri dengan menggunakan algoritma yang telah diprogram sebelumnya.
Dalam artikel ini, kita akan membahas cara kerja dua model AI populer, yaitu Midjourney dan Stable Diffusion, dalam menghasilkan gambar.
Midjourney
Midjourney adalah model AI yang dikembangkan oleh para peneliti di Microsoft Research Asia. Model ini memanfaatkan teknologi deep learning, yaitu suatu metode pembelajaran mesin yang menggunakan jaringan saraf tiruan yang terdiri dari banyak lapisan neuron.
Midjourney difokuskan pada masalah penggambaran objek tiga dimensi secara realistis dalam gambar dua dimensi. Model ini memungkinkan pengguna untuk memasukkan sketsa atau gambar kasar sebagai input dan kemudian menghasilkan gambar yang lebih detail dan realistis sebagai output.
Cara kerja Midjourney dimulai dengan pengolahan gambar atau sketsa awal sebagai input. Setelah itu, gambar tersebut akan melalui serangkaian lapisan jaringan saraf tiruan yang akan memprosesnya dan menghasilkan gambar yang lebih detail.
Proses ini disebut sebagai "rekonstruksi" atau "pemulihan citra" (image inpainting). Selama proses rekonstruksi, model akan memperbaiki citra input yang kasar dengan menambahkan detail yang hilang dan menghasilkan gambar yang lebih realistis.