Mohon tunggu...
Adhicipta Wirawan
Adhicipta Wirawan Mohon Tunggu... Desainer - AI Enthusiast, Dosen International Program Digital Media Petra Christian University (PCU), Penulis Buku Yuk Bikin Board Game Edukasi: https://bit.ly/bukubikinboardgame

Ciptakan Pendidikan yang Mudah dan Menyenangkan

Selanjutnya

Tutup

Artificial intelligence Pilihan

Kenali Midjourney dan Stable Diffusion: Kecerdasan Buatan untuk Menciptakan Gambar Realistis

19 April 2023   06:14 Diperbarui: 9 Juni 2023   11:26 1136
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Contoh ilustrasi Kecerdasan Buatan menguasai umat Manusia yang saya buat menggunakan Stable Diffusion (Sumber: pribadi)

Sebagai seorang game designer dan toys designer, saya selalu membutuhkan referensi visual pada tahap pembuatan prototype untuk menunjang visualisasi yang mendekati hasil akhir.

Saya akan membuat artikel berseri seputar artificial intelligence khususnya dalam penerapan di bidang industri kreatif, jadi jangan lupa follow akun ini dan beri komentar. Sebagian besar gambar atau ilustrasi dalam artikel yang ditulis akan banyak menggunakan hasil dari mesin kecerdasan buatan.

Kehadiran kecerdasan buatan sangat membantu pekerjaan saya. Dari beberapa alternatif kecerdasan buatan penciptaan gambar yang telah saya observasi dan uji coba maka pilihannya jatuh pada Midjourney (MJ) dan Stable Difusion (SD).

Kedua kecerdasan buatan ini mampu menghasilkan visual gambar yang sangat realistis. Yang membedakan keduanya adalah MJ bersifat berbayar dan tertutup sumbernya dan SD ada versi berbasar dan versi sumber terbuka atau open source.

Tentu SD yang bersifat terbuka ini menjadi sangat progresif pengembangannya, bahkan dalam hitungan minggu sudah muncul update terbaru dengan melibatkan komunitas dari seluruh dunia.

Kecerdasan Buatan (Artificial Intelligence/AI) merupakan suatu teknologi yang mampu memberikan kemampuan pada mesin untuk melakukan tugas yang sebelumnya hanya bisa dilakukan oleh manusia, seperti pengenalan gambar atau bahasa alami. 

Salah satu aplikasi dari AI yang sedang berkembang pesat adalah dalam pembuatan gambar, di mana mesin dapat "menggambar" sendiri dengan menggunakan algoritma yang telah diprogram sebelumnya. 

Dalam artikel ini, kita akan membahas cara kerja dua model AI populer, yaitu Midjourney dan Stable Diffusion, dalam menghasilkan gambar.

Midjourney

Midjourney adalah model AI yang dikembangkan oleh para peneliti di Microsoft Research Asia. Model ini memanfaatkan teknologi deep learning, yaitu suatu metode pembelajaran mesin yang menggunakan jaringan saraf tiruan yang terdiri dari banyak lapisan neuron. 

Midjourney difokuskan pada masalah penggambaran objek tiga dimensi secara realistis dalam gambar dua dimensi. Model ini memungkinkan pengguna untuk memasukkan sketsa atau gambar kasar sebagai input dan kemudian menghasilkan gambar yang lebih detail dan realistis sebagai output.

Cara kerja Midjourney dimulai dengan pengolahan gambar atau sketsa awal sebagai input. Setelah itu, gambar tersebut akan melalui serangkaian lapisan jaringan saraf tiruan yang akan memprosesnya dan menghasilkan gambar yang lebih detail. 

Proses ini disebut sebagai "rekonstruksi" atau "pemulihan citra" (image inpainting). Selama proses rekonstruksi, model akan memperbaiki citra input yang kasar dengan menambahkan detail yang hilang dan menghasilkan gambar yang lebih realistis.

Untuk menghasilkan gambar yang lebih realistis, Midjourney menggunakan teknik pembelajaran tanpa pengawasan (unsupervised learning) yang dikenal sebagai "kontrastif learning". Kontrastif learning adalah suatu teknik pembelajaran mesin di mana model belajar untuk membedakan antara gambar asli dengan gambar palsu atau gambar yang "diacak". 

Dengan menggunakan teknik ini, Midjourney dapat menghasilkan gambar yang lebih realistis dan mempertahankan konsistensi objek dalam gambar yang dihasilkan.

Stable Diffusion

Stable Diffusion adalah model AI yang dikembangkan oleh OpenAI. Model ini menggunakan teknologi pembelajaran mesin yang disebut sebagai "diffusion models". 

Diffusion models adalah suatu teknik pembelajaran mesin di mana model belajar untuk menghasilkan gambar dengan cara menghitung probabilitas dari gambar itu sendiri.

Cara kerja Stable Diffusion dimulai dengan pengolahan gambar acak sebagai input. Setelah itu, gambar tersebut akan melalui serangkaian lapisan jaringan saraf tiruan yang akan menghitung probabilitas dari gambar tersebut. 

Proses ini disebut sebagai "diffusion process". Selama proses ini, model akan menghitung probabilitas dari gambar tersebut pada setiap iterasi dan secara bertahap meningkatkan kualitas gambar tersebut.

Untuk menghasilkan gambar yang lebih realistis, Stable Diffusion menggunakan teknik "noise injection". Teknik ini melibatkan penambahan "dalam menghasilkan gambar yang lebih realistis. 

Model akan menambahkan kebisingan (noise) pada gambar pada setiap iterasi, yang kemudian akan dihilangkan pada tahap akhir untuk menghasilkan gambar yang lebih halus dan realistis. Teknik ini juga memungkinkan model untuk menangani variasi yang lebih besar dalam data latih dan menghasilkan gambar yang lebih divers.

Kesimpulan

Kecerdasan buatan telah mengalami kemajuan pesat dalam beberapa tahun terakhir dan telah diterapkan dalam banyak aplikasi, termasuk pembuatan gambar. Midjourney dan Stable Diffusion adalah dua model AI populer dalam pembuatan gambar, dan keduanya menggunakan teknologi deep learning dan pembelajaran mesin yang canggih.

Midjourney difokuskan pada penggambaran objek tiga dimensi secara realistis dalam gambar dua dimensi. Model ini dapat menghasilkan gambar yang lebih realistis dengan memperbaiki citra input yang kasar dan menambahkan detail yang hilang. 

Midjourney menggunakan teknik kontrastif learning untuk menghasilkan gambar yang lebih realistis dan mempertahankan konsistensi objek dalam gambar yang dihasilkan.

Stable Diffusion, di sisi lain, menggunakan teknologi diffusion models untuk menghasilkan gambar dengan cara menghitung probabilitas dari gambar itu sendiri. Model ini menggunakan teknik noise injection untuk menghasilkan gambar yang lebih halus dan realistis dan dapat menangani variasi yang lebih besar dalam data latih.

Keduanya memiliki kelebihan dan kekurangan masing-masing, tergantung pada tujuan dan kebutuhan pengguna. Namun, keduanya menunjukkan potensi yang besar dalam pembuatan gambar dan terus berkembang dengan penelitian lebih lanjut dan pengembangan teknologi. 

Dengan adanya kemajuan teknologi AI yang semakin pesat, diharapkan akan muncul inovasi-inovasi baru dalam pembuatan gambar yang dapat membantu manusia dalam berbagai bidang.

HALAMAN :
  1. 1
  2. 2
  3. 3
Mohon tunggu...

Lihat Konten Artificial intelligence Selengkapnya
Lihat Artificial intelligence Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun