Perkembangan Artificial Intelligence yang semakin pesat belakangan ini membuat banyak institusi atau universitas yang mulai menelaah cara kerja model kecerdasan buatan generatif seperti Chat GPT dan Gemini.
Untuk menerapkan hasil penelitian tersebut telah dibuat sebuah alat pendeteksi konten kecerdasan buatan atau biasa disebut AI Detector, utamanya AI Detector yang berfokus pada deteksi konten berbasis teks.
AI Detector sangat bermanfaat, alat ini berguna terutama untuk para tenaga pengajar yang ingin memastikan apakah muridnya benar-benar mengerjakan tugasnya secara mandiri.
Bagaimanapun AI Detector masih cukup baru dan masih dalam proses pengembangan, sehingga masih banyak yang belum percaya dengan akurasinya. Seperti namanya, AI Detector adalah sebuah perangkat lunak yang dibuat untuk mendeteksi apakah sebuah konten seperti teks, gambar, bahkan video ataupun audio dibuat menggunakan kecerdasan buatan.
Cara kerja dari AI Detector mendeteksi tingkat keaslian sebuah teks sebenarnya cukup beragam. AI Detector biasanya didasarkan pada model kecerdasan buatan yang digunakan dalam pembuatan teks itu sendiri, biasanya melalui percobaan deteksi model secara otomatis menggunakan algoritma yang memperhatikan pola-pola tertentu.
Setelah proses deteksi, model akan mempertanyakan "Apakah teks ini adalah sesuatu yang mungkin saya buat ?", jika jawabannya "iya" maka konten tersebut kemungkinan bukan buatan asli manusia.
Pertanyaan tersebut dijawab oleh model dengan memperhatikan dua aspek dari teks : ketidakpastian sintaksis atau gramatikal dan pola penyusunan kalimat.
1. Ketidakpastian
Ketidakpastian yang dimaksud adalah seberapa tidak pasti atau acak suatu teks. Ini merujuk pada tingkat ketidakpastian dalam prediksi kata yang muncul atau seberapa besar kemungkinan teks dapat membingungkan pembacanya.
Model generative AI diprogram untuk membuat teks yang lebih masuk akal dan mudah dipahami oleh manusia, hal ini membuat teks yang dibuat oleh kecerdasan buatan memiliki alur pemilihan kata yang lebih mudah diprediksi, sedangkan teks yang dibuat manusia memiliki alur pemilihan kata yang lebih kreatif, lebih banyak kesalahan penulisan dan pada suatu titik bisa membuat pembaca merasa bingung.
Sekedar informasi, proses pemilihan kata pada generative AI seperti Chat GPT bekerja dengan memprediksi kata yang alaminya muncul dalam suatu kalimat dalam suatu konteks tertentu.
Sebagai contoh, sebuah kalimat "Saya pergi ke pasar untuk membeli ..." memiliki beberapa kemungkinan lanjutan sebagai berikut:
"Saya pergi ke pasar untuk membeli apel." : Ini adalah kelanjutan yang paling sederhana dan bisa diprediksi. Tidak ada kejutan atau variasi, sehingga tingkat ketidakpastian sangat rendah.
"Saya pergi ke pasar untuk membeli apel dan jeruk." : Masih bisa diprediksi, tetapi ada tambahan variasi dengan menyebutkan lebih dari satu jenis buah. Ini meningkatkan kompleksitas, tetapi masih dalam batas normal. ketidakpastian rendah ke sedang
"Saya pergi ke pasar untuk membeli apel, tetapi akhirnya juga membeli roti dan susu." : Ada sedikit perubahan arah dalam tindakan pembelian. Ini membuat kalimat lebih kompleks dan memunculkan variasi yang lebih tinggi. Secara logis masih masuk akal, tetapi sudah lebih kreatif. ketidakpastian sedang.
"Saya pergi ke pasar untuk membeli apel, tetapi saat tiba di sana, saya malah ingat bahwa saya lupa mematikan kompor, jadi saya langsung pulang.": Kelanjutan yang tidak dapat diprediksi sama sekali. Terdapat perubahan yang tiba-tiba dalam cerita yang sulit ditebak oleh model AI. Kalimat ini memiliki ketidakpastian tinggi dengan variasi yang lebih kompleks dan tidak linier.
Pada intinya, tingkat ketidakpastian yang rendah menunjukkan bahwa suatu teks dibuat oleh kecerdasan buatan.
2. Pola penyusunan kalimat
Untuk menentukan keunikan penyusunan kalimat dari sebuah teks, biasanya akan digunakan suatu variabel yang disebut “ledakan”, apanya yang meledak?
Sebenarnya variabel ini tidak ada hubungannya dengan reaksi ledakan, tetapi “ledakan” ini merujuk pada banyaknya variasi kata pada suatu struktur dan panjang kalimat, mirip dengan ketidakpastian pemilihan kata, tapi pada tingkatan kalimat.
Teks yang dibuat oleh Artificial Intelligence biasanya memiliki pola susunan kalimat yang lebih mudah diprediksi, itu karena seperti yang sudah dijelaskan pada poin sebelumnya, model kecerdasan buatan bahasa selalu memilih kata melalui prediksi dan prediksi tersebut selalu memilih kata dalam kalimat yang memiliki struktur konvensional atau struktur yang biasa digunakan oleh banyak orang.
Selain itu, beberapa kecerdasan buatan generatif biasanya memproduksi kalimat yang terdiri dari jumlah kata tertentu, seperti contohnya rata-rata kata dalam kalimat yang di generate oleh Chat GPT pada hasil prompt umum berkisar antara 10 sampai 20 kata. Inilah alasan kenapa suatu teks yang dibuat oleh kecerdasan buatan kadang terasa predictable dan monoton.
3. Alternatif: Watermark
Maraknya penyalahgunaan kecerdasan buatan saat ini, beberapa perusahaan besar seperti OpenAI dan Google sedang merancang sebuah sistem “watermarking”, yang mana teks yang dibuat oleh kecerdasan buatan yang mereka buat memiliki sistem penanda tidak terlihat yang bisa dideteksi oleh berbagai sistem untuk memastikan bahwa sebuah teks AI generated atau tidak.
Bagaimanapun layaknya AI Detector yang masih dikembangkan oleh berbagai institusi saat ini, fitur ini juga masih dalam proses pengembangan yang detail cara kerjanya dan cara identifikasinya pun masih belum dipublikasikan. Kita juga tidak tahu apabila watermark ini akan tetap terdeteksi setelah sebuah teks diparafrase.
Jadi meskipun fitur bawaan dari suatu kecerdasan buatan yang masih dikembangkan ini cukup menjanjikan, kita masih belum bisa sepenuhnya berharap.
Sebagai sebuah perangkat yang masih dalam fase uji coba, AI Detector telah menunjukkan hasil yang positif dalam mengidentifikasi konten yang dihasilkan oleh kecerdasan buatan, terutama dalam analisis teks dengan panjang ratusan hingga ribuan kata.
Di dunia yang kian tergantung pada kecerdasan buatan, perangkat ini menjadi sarana yang sangat bermanfaat bagi pengajar, editor, serta profesional lainnya yang ingin menjamin keaslian suatu karya tulis.
AI Detector dianggap sangat efisien untuk pemakaian jangka pendek dan menengah, menghasilkan hasil yang tepat dalam mengidentifikasi teks yang dibuat oleh Artificial Intelligence.
Namun, untuk dapat diandalkan dalam teks yang lebih panjang, seperti jurnal ilmiah atau buku, AI Detector masih memerlukan pengembangan algoritma yang lebih kokoh dan metode deteksi yang lebih mendalam.
Tantangan lain yang dihadapi adalah kemungkinan AI Detector bisa dibohongi dengan penggunaan metode prompt yang lebih canggih atau dengan parafrase.
Beberapa contoh bahkan memperlihatkan kekurangan dalam akurasi, contohnya terjadi kesalahan pengenalan pada teks yang sepenuhnya ditulis oleh manusia. Walaupun demikian, keberadaan AI Detector tetap memberikan keuntungan nyata, dan seiring kemajuan teknologi, diharapkan akurasinya akan semakin meningkat dalam beberapa tahun ke depan.
Sumber :
Caulfield, Jack. May 1, 2023. How Do AI Detectors Work? | Methods & Reliability. Diakses dari https://www.scribbr.com/ai-tools/how-do-ai-detectors-work/
Bruns, JW. September 28, 2024. Pros and Cons of Using AI Detector Tools in Journalism. Diakses dari https://www.companionlink.com/blog/2024/09/pros-and-cons-of-using-ai-detector-tools-in-journalism/
Hareesh. July 12, 2023. AI-Generated vs. Human-Written Text: Technical Analysis. Diakses dari https://hackernoon.com/ai-generated-vs-human-written-text-technical-analysis
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H