Saya sedang melakukan pengembangan kecerdasan buatan yang selaras dengan penerapan semantic relatedness untuk suatu keperluan pengambilan informasi (Concept Based IR - Information Retrieval)
Secara mendasar, kecerdasan buatan dibuat dengan beberapa struktur. Struktur utama dan struktur luar. Dimana struktur utama dan yang paling mendasar merupakan pengetahuan yang bersifat a priori (a priori knowledge, knowledge base). Pengetahuan ini dibuat sebagai suatu struktur hirarki.
Lebih lanjut, kita melakukan input sebagai suatu bentuk perintah menggunakan format bahasa komunikasi, untuk kemudian dicarikan kesesuaian pada basis data. Masukan keyword akan dipetakan ke hierarchical knowledge base untuk dianalisa nilai relevansinya (semantic relatedness). Ini dapat dilakukan melalui analisa keterhubungan pada struktur pohon (tree). Ini adalah metode non-linear.
Berbeda dengan metode lainnya yang cenderung menggunakan metode linear, dimana format hirarki tidak dilibatkan. Metode yang populer digunakan untuk mencari relevansi di antara dua kata adalah ESA (Explicit Semantic Analysis).
Metode ESA menegaskan perlunya nilai suatu kata dari suatu dokumen. Kata "kuda" boleh jadi bukan merupakan pokok utama pembahasan dari suatu dokumen karena nilai relevansinya sedemikian kecil. Menentukan beratnya nilai relevansi dari suatu kata, disarankan dengan menghitung berapa banyak jumlah kata tersebut mengalami pengulangan dari suatu dokumen dibandingkan dengan jumlah keseluruhan kata dari suatu dokumen tersebut. Terdapat 10 kata "kuda" berulang di suatu dokumen dengan total jumlah kata keseluruhan adalah 100, maka nilai tf (term frequency) adalah 10/100 = 0.1.
Masih diperlukan lagi satu dimensi perhitungan, yaitu dengan menghitung jumlah seluruh dokumen yang memuat kata "kuda". Dari 10 dokumen, terdapat 5 dokumen memuat kata "kuda", maka nilai idf (inverse document frequency) adalah 10/5 = 2. Nilai ini dijumlahkan dengan nilai tf, menjadi 0.1 x 2 = 0.2. Semakin besar nilainya, maka semakin besar kemungkinan suatu kata "kuda" menjadi salah satu kata tema dari suatu dokumen. Kurang lebihnya demikian.
Ini masih ditambah lagi dengan bantuan untuk sistem kesesuaian yang bersifat kamus - persamaan kata atau makna - dapat mudah ditemukan melalui modul wordnet. Dimana wordnet digunakan sebagai sarana yang memperluas makna kata, sehingga kemungkinan kesesuaian suatu kata terhadap suatu konsep dapat lebih mudah dikenali
Sebenarnya, neural network atau yang sejenisnya, telah cukup memadai untuk membentuk otak digital. Salah satunya melalui pemrograman prolog. Dan pada umumnya pihak yang menguasai kecerdasan buatan, mereka mampu membuat jaringan otak digital yang terprogram.
Jaringan terstruktur sebenarnya tidak memiliki kemampuan apapun di dalam unjuk kerja kecerdasan buatan, tetapi bagaimana struktur tersebut dipergunakan melalui cara tertentu yang menentukan suatu struktur memiliki pola unjuk kerja kecerdasan buatan.
Itu sebabnya, kekuatan utama (setelah adanya terlebih dahulu struktur kecerdasan buatan), adalah pada kemampuan penelusuran data pada suatu struktur pengetahuan. Hal ini membuat dua struktur kecerdasan buatan yang sama, akan dapat menghasilkan suatu fungsi penalaran yang berbeda.
Riset pengembangan kecerdasan buatan yang sedang saya lakukan, mampu mengatasi kelemahan yang pada ESA dan sistem non-linear (Tree). Dimana knowledge base dibuat menggunakan spreadsheet. Dan ini memiliki keterbatasan dalam hal ketidakmampuan menampung banyak data dan kecepatan akses. Tetapi ini sudah cukup sebagai model awal dari suatu gagasan dan implementasi yang lebih lengkap. Berikut contoh bagaimana suatu knowledge base dibuat dalam format spreadsheet contoh sederhana struktur dari sejumlah prosedural.
Jika ada pihak yang berminat untuk bergabung, dipersilakan menghubungi email: seremonia@gmail.com
Link terkait: A map of the brain, How brains learn to see, VektoQual White Paper, Comparison for Expert System and Artificial Intelligence (Watson) , Artificial Intelligence Layers