Pendahuluan
Istilah pada judul di atas sudah muncul di tengah dunia akademik mulai beberapa tahun lalu. Awalnya memang agak samar-samar, tetapi makin lama makin santer terdengar. Kosa kata “pembelajaran mesin” atau machine learning bagi banyak orang cukup mengganggu. Ada yang menganggap ini tentang orang mempelajari mengenai mesin, atau bahkan ada yang menganggap mesin untuk belajar. Sebagian orang menyangka seseorang yang belajar mirip dengan mesin. Marilah kita mendiskusikan tentang topik ini sebelum membuat interpretasi yang lebih lebar lagi.
Kecerdasan Buatan
Ide tentang kecerdasan buatan (KB) sudah muncul cukup lama, yaitu mulai sekitar tahun 1950-an, namun pada periode selanjutnya mengalami kemunduran karena terbentur masalah ekspektasi penelitian. Tahun 1980-an merupakan awal dari kebangkitan kembali ide kecerdasan buatan sekaligus pembelajaran mesin, yang ditandai dengan kebangkitan penggunaan metode jaringan syaraf tiruan (JST). Ada beberapa jenis JST yang berkembang untuk mendukung implementasi sistem kecerdasan buatan.
Lebih jauh lagi ke belakang, Mesin Turing hasil pemikiran Alan Turing di usia sekitar 24 tahun, pada tahun 1936, merupakan cikal bakal bagaimana orang ingin menciptakan sebuah mesin yang memiliki kecerdasan. Mesin Turing adalah konsep suatu mesin yang memiliki sebuah kepala baca-tulis (read-write head) yang bisa bergerak ke kanan-kiri pada sebuah pita panjang. Kepala baca-tulis tersebut pada setiap saat mampu membaca atau menulis sebuah simbol antara 0, 1, dan spasi pada pita.
Untuk merealisasikan konsep mesin Turing sebagai sebuah mesin, tidak serta merta terwujud, bahkan ternyata harus menunggu beberapa tahun. Sebagai realisasi dari ide mesin Turing, barulah pada tahun 1945 von Neumann berhasil membuat rancangan konsep sebuah komputer, yakni mesin yang terdiri dari pemroses utama (berisi unit kendali, register, unit aritmetika dan logika), memori (mencakup memori primer dan sekunder), dan alat-alat input-output. Arsitektur komputer ini sampai sekarang masih diterapkan di dalam komputer-komputer digital masa kini. Jangan Anda bayangkan mesin ini sebesar telepon pintar sekarang, perwujudan ini pertama ini sebesar rumah sangat besar.
Seiring dengan lahirnya mesin komputer dengan kemampuan menghitung cepat dan berulang-ulang, muncul konsep kecerdasan buatan (terjemahan dari artificial intelligence, AI). AI merupakan suatu sistem komputer yang berusaha meniru cara manusia dalam memberikan tanggapan dan berperilaku, memecahkan masalah, dan mengambil keputusan, serta mampu mengoptimasi dalam pengambilan keputusan.
Pada tahun 1957, Frank Rosenblatt menemukan Perceptron, sekaligus mengawali penggunaan model jaringan syaraf tiruan (JST). Perceptron merupakan salah satu dari jenis JST yang digunakan untuk mengenali pola secara visual. Sebagian informasi yang “hilang” oleh sebab tertentu, berusaha dipersepsi dan direkonstruksi melalui sejumlah langkah untuk mendapatkan kembali pola yang sesuai. Pada periode selanjutnya ditemukan beberapa model dari JST dengan berbagai jenis, mulai dari karakteristik dan teknik-teknik pembelajaran, misalnya Feedforward, Recurrent, Self-Organizing Maps, AutoEncoders, Boltzmann Machines, Capsule Network, dan sebagainya.
Machine Learning
Machine Learning (ML) atau dalam bahasa Indonesia “Pembelajaran Mesin” merupakan pelaksanaan dari konsep kecerdasan buatan. Untuk mencapai tujuan tertentu di dalam KB membutuhkan model, serangkaian algoritma, dan teknik-teknik yang efisien. ML mengandung sekumpulan algoritma dan teknik untuk memecahkan masalah tertentu secara efisien. Sebagai contoh sederhana, apabila tersedia 2 kelompok data, sebut saja kelompok X dan kelompok Y, maka ML bertugas untuk mencari adanya keterkaitan dari kedua kelompok data tersebut. Adakah hubungan linier dari kedua kelompok data? Berapa besar keterkaitan serta berapa nilai koefisiennya.
Salah satu kunci dari penerapan ML adalah ketersediaan data. Data ini digunakan untuk menjalankan proses pembelajaran bagi mesin. Hasil akhir dari pelaksanaan pembelajaran adalah mesin memiliki suatu “pengetahuan.” Pada langkah selanjutnya memungkinkan mesin untuk diaplikasikan pada data lain.
Metode pembelajaran ada 2 jenis, yaitu diawasi (supervised learning) dan tidak diawasi (unsupervised learning). Metode pembelajaran diawasi membutuhkan pasangan data input dan output untuk membentuk “pengetahuan” bagi mesin. Setelah pembentukan pengetahuan selanjutnya mesin dapat digunakan untuk mengaplikasikan pengetahuan pada data input lain. Sebagai contoh pada aplikasi pengenalan wajah, ML diberikan banyak sekali gambar wajah sebagai bahan pelatihan. Selanjutnya ML diminta untuk mengenali suatu gambar wajah tertentu yang diberikan berdasarkan pengetahuan yang telah dikumpulkan.
Sementara pada jenis pembelajaran tidak diawasi, ML membangun pengetahuan dengan membuat kelompok, klasifikasi, pelabelan, dan sebagainya dari data pembelajaran sebagai bahan pengetahuan bagi mesin. Setelah melakukan eksplorasi data, selanjutnya ML dapat digunakan pada data lain untuk menghasilkan sebuah kesimpulan tertentu. Misalnya ML diminta membaca sebuah teks atau buku yang berisi berbagai jenis satwa. Sebagai hasil pembelajaran ML akan mempunyai pengetahuan di antaranya berupa kategori dari satwa-satwa yang ada.
Sebetulnya ada metode pembelajaran ketiga, yaitu penguatan (reinforcement), yang dapat dianggap sebagai kombinasi dari keduanya. Contoh, pada sebuah robot yang telah menjalani proses pembelajaran sehingga robot sudah memiliki pengetahuan. Pada saat melakukan aksi tertentu, ternyata aksi tersebut dianggap salah, maka aksi ini harus menjadi bahan pembelajaran baru bagi robot. Saat robot mendapati keadaan demikian seperti itu, maka seharusnya robot tidak lagi membuat kesalahan yang sama.
Ada banyak sekali teknik dan algoritma yang digunakan di dalam ML. Berikut ini beberapa contoh algoritma yang terkenal di dalam masing-masing kelompok pembelajaran:
Kelompok Pembelajaran Diawasi:
- Regresi linier; memprediksi hubungan 2 kelompok data.
- Regresi logistik; digunakan dalam klasifikasi biner.
- Pohon keputusan; membuat keputusan berdasarkan sekumpulan aturan logika yang bercabang.
- Support Vector Machines (SVM); memisahkan kelas-kelas data menggunakan potongan-potongan bidang secara melintang.
- k-Nearest Neighbors; melakukan klasifikasi kelompok data berdasarkan mayoritas tetangga terdekat.
- Jaringan syaraf; menemukan pola dasar menggunakan banyak lapisan jaringan syaraf.
Pembelajaran Tidak Diawasi:
- Pengklasteran hirarki, k-Means, DBSCAN; mengelompokkan data berdasarkan teknik tertentu.
- Pengurangan dimensi; mengurangi dimensi kumpulan data menggunakan teknik tertentu, misalnya PCA, ICA, LDA, dan sebagainya.
- Aturan asosiasi; menemukan aturan asosiasi di dalam kumpulan data tertentu, misalnya secara apriori, Eclat, FP growth, dan sebagainya.
Di dalam ML tercakup beberapa hal terkait dengan fungsi. Pertama, konsep rekayasa fitur untuk memilih, mengubah, dan menciptakan fitur dari data mentah. Yang kedua, melakukan evaluasi atas kinerja dari model yang dipilih, dan ketiga, menggabungkan beberapa model sekaligus, sedemikian rupa untuk meningkatkan kinerja keseluruhan.
Lingkungan Pembelajaran Mesin
Berbagai algoritma dan teknik untuk menjalankan ML umumnya membutuhkan sumber daya komputer yang cukup besar, misalnya pemroses utama, memori, dan penyimpanan luar, termasuk kemampuan grafik yang cukup. Untuk itu pastikan bahwa perangkat keras komputer yang digunakan sesuai dengan kebutuhan.
Dari ketersediaan paket atau modul-modul, untuk menjalankan ML disarankan menggunakan bahasa pemrograman mendukung dengan baik, paling tidak saat ini, yaitu bahasa Python dan R. Adapun kerangka kerja (framework) pada saat ini tersedia antara lain TensorFlow yang dikembangkan oleh Google dan bersifat sumber terbuka (open source). Di samping itu tersedia PyTorch yang dikembangkan oleh Facebook, dan Scikit-learn berbasis bahasa Python.
Anda juga membutuhkan peralatan seperti Jupyter Notebook, Docker, ataupun Kubernetes sebagai lingkungan pengembangan yang memang mendukung penggunaan ML dalam mengakses berbagai fasilitas maupun paket-paketnya.
Apabila menghendaki lingkungan berbasis awan (cloud), Anda bisa memilih layanan dari Google Cloud AI Platform, Amazon SageMaker, atau Microsoft Azure Machine Learning. Tentu saja terdapat kelebihan dan kekurangan masing-masing dari pilihan-pilihan di atas. Dengan melakukan eksplorasi, dan selanjutnya dengan memahaminya, dapat menentukan pilihan sendiri dengan lebih bijaksana. Aspek penting yang lain adalah fleksibilitas namun tanpa mengorbankan faktor keamanan dan privasi data.
Tantangan Pembelajaran Mesin
Masih banyak tantangan bagi keberhasilan implementasi bagi pembelajaran mesin, antara lain ketersediaan dan kualitas, ketidakseimbangan, maupun bias data. Faktor data menjadi sangat penting karena sebuah sistem pembelajaran mesin sangat bergantung pada data, baik untuk pembelajaran maupun mengambil kesimpulan.
Selain dari masalah data juga pada algoritma itu sendiri agar menghindari bias dari pemilihan model sekaligus algoritma. Isu tentang underfitting dan overfitting serta robustness model adalah hal yang segera dicari solusi di dalam aplikasi nyata.
Selain itu masalah privasi dan etik di dalam pembelajaran mesin juga merupakan faktor yang harus didiskusikan sejak awal. Hal ini dilakukan karena ML tidak saja menyangkut aspek teknologi, tetapi juga kepentingan yang lebih luas dari beberapa pihak.
Aspek yang tidak kalah penting untuk diperhatikan adalah, bahwa hampir semua teknik dan algoritma di dalam ML membutuhkan dasar pengetahuan matematika dan statistika yang baik. Untuk itu dalam hal pengembangan suatu ML dasar ini tidak bisa ditawar sebagai pondasi pemecahan masalah di dalamnya.
Penutup
Pembelajaran mesin telah menjadi topik penting dalam beberapa tahun terakhir. Seiring dengan perkembangan teknologi penerapannya meluas di berbagai industri. Meskipun masih menyisakan berbagai tantangan, seperti bias data, transparansi model, dan kebutuhan akan sumber daya komputasi yang besar, potensi teknologi ini mampu mendorong inovasi.
Keberhasilan masa depan pembelajaran mesin akan bergantung pada upaya kolaboratif untuk mengatasi hambatan-hambatan ini dengan solusi yang etis, efisien, dan berkelanjutan. Dengan pendekatan yang tepat, pembelajaran mesin akan terus membuka peluang baru untuk transformasi digital di seluruh dunia.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H