Jika kita tilik lebih jauh, hasil dari ChatGPT terlihat natural karena saat pemrosesan, kalimat akan diurai menjadi kata, dan kemudian diurai lagi menjadi unit  lebih kecil disebut "token".
Satu kalimat utuh, dipenggal dalam beberapa token, yang bentuknya bisa berupa kata tunggal, pecahan suku kata, karakter huruf, tanda baca, dan sebagainya.
Kumpulan token kemudian diproses menggunakan model transformer, untuk menghasilkan kalimat sesuai dengan pertanyaan atau input pada antarmuka ChatGPT berbasis web (biasa juga disebut prompt).
Ada banyak proses lain yang tidak akan saya tulis karena nanti terlalu detail. Misalnya, untuk menghasilkan jawaban natural, perlu juga dilakukan penghitungan probabilitas untuk memprediksi token selanjutnya berdasarkan konteks.
Termasuk penggunaan parameter agar model dapat memprediksi dan memberikan jawaban yang bisa memberikan kesan alamiah, proses pelatihan menggunakan teks dalam jumlah besar, pengaturan kompleksitas, dan hal-hal lain.
Baiklah, kita kembali lagi pada pokok bahasan. Pada tulisan kali ini, saya akan menuliskan tiga kesamaan antara ChatGPT dan rumpi.
Pertama, ChatGPT dan rumpi itu sebenarnya sama-sama tergantung pada sumber data (lingkungan). Kita tinjau ChatGPT dahulu.
Untuk menghasilkan jawaban tepat dan alami, maka ChatGPT membutuhkan "latihan" untuk belajar pola-pola data (informasi) yang masing-masing berdiri sendiri dan tak saling berkaitan. Kemudian kumpulan sumber informasi sedapat mungkin berasal dari berbagai macam sumber.
Ini untuk menjamin bahwa jawaban nantinya tidak melenceng jauh, dan terutama tak condong kepada hal (pendapat) tertentu. Dengan kata lain, melalui sumber data yang lebih bervariasi dan independen, maka jawaban akan lebih objektif dan dapat diandalkan.
Kalau sumber data yang digunakan untuk latihan ternyata condong kepada hal tertentu (misalnya afiliasi politik tertentu) dan sumbernya juga tak variatif, maka jawaban tentu saja bisa tidak valid dan kurang dipercaya.
Sama halnya pada rumpi. Orang-orang yang merumpi pada lingkungan sama, cenderung mempunyai pola dan perilaku sama. Jika suka merumpi tentang gosip, maka kita hanya  mendapat hal-hal tentang gosip saja. Tidak ada lainnya.