Ancaman Siber di Era IoT: Solusi IDS Berbasis Pembelajaran Mesin
Dalam era digital saat ini, keamanan siber menjadi salah satu isu krusial yang harus dihadapi oleh organisasi di seluruh dunia. Seiring dengan peningkatan pesat penggunaan internet dan teknologi seperti Internet of Things (IoT), ancaman terhadap jaringan siber pun meningkat secara signifikan. Data dari DataReportal menunjukkan bahwa setiap hari, satu juta pengguna baru internet ditambahkan secara global, mencerminkan peningkatan penggunaan internet yang eksponensial(kilincer2021). Namun, peningkatan ini tidak hanya mendatangkan manfaat, tetapi juga memperluas ruang serangan bagi aktor jahat. Kerentanan jaringan yang terbuka ini menimbulkan kebutuhan mendesak untuk sistem keamanan yang lebih canggih, salah satunya adalah Intrusion Detection System (IDS).
IDS merupakan sistem yang digunakan untuk mendeteksi potensi pelanggaran keamanan dengan menganalisis lalu lintas jaringan. Dalam konteks ini, metode pembelajaran mesin (machine learning) mulai banyak digunakan sebagai salah satu solusi untuk meningkatkan efektivitas deteksi serangan. Berdasarkan laporan yang diterbitkan oleh Crystal Market Research, pasar keamanan siber diperkirakan akan meningkat dari $58,13 miliar pada tahun 2012 menjadi $173,57 miliar pada tahun 2022(kilincer2021). Angka ini menekankan pentingnya investasi besar-besaran di sektor keamanan siber, terutama dalam pengembangan IDS berbasis kecerdasan buatan dan pembelajaran mesin.
Artikel berjudul Machine Learning Methods for Cyber Security Intrusion Detection: Datasets and Comparative Study karya Kilincer, Ertam, dan Sengur (2021), membahas penggunaan berbagai metode pembelajaran mesin seperti Support Vector Machine (SVM), K-Nearest Neighbor (KNN), dan Decision Tree (DT) dalam deteksi intrusi keamanan siber. Dalam artikel ini, para peneliti melakukan analisis komparatif pada lima dataset publik utama yang sering digunakan dalam pengembangan IDS, termasuk UNSW-NB15 dan NSL-KDD. Artikel ini memberikan gambaran mendalam tentang efektivitas metode pembelajaran mesin dalam mendeteksi serangan siber yang semakin kompleks. Dengan meningkatnya serangan setiap tahun, seperti yang tercatat oleh Skybox Security, terdapat 17.220 kerentanan baru yang ditemukan pada tahun 2019, meningkat 3,8% dibandingkan tahun sebelumnya(kilincer2021). Data ini menyoroti pentingnya terus meningkatkan sistem deteksi dan keamanan siber.
Artikel Kilincer, Ertam, dan Sengur (2021) melakukan evaluasi komprehensif terhadap metode pembelajaran mesin yang digunakan dalam Intrusion Detection Systems (IDS). Para peneliti fokus pada algoritma populer seperti Support Vector Machine (SVM), K-Nearest Neighbor (KNN), dan Decision Tree (DT) untuk membandingkan kinerja mereka dalam mendeteksi ancaman siber. Penggunaan metode pembelajaran mesin pada IDS ini memberikan keuntungan signifikan, terutama dalam hal kemampuan untuk mendeteksi pola serangan baru dan tidak dikenal. Artikel ini memanfaatkan lima dataset IDS publik yang sering digunakan dalam penelitian keamanan siber: UNSW-NB15, NSL-KDD, CSE-CIC-IDS2018, ISCX 2012, dan CIDDS-001.
Penelitian menunjukkan bahwa metode pembelajaran mesin ini efektif dalam mendeteksi berbagai jenis serangan, dengan beberapa algoritma menunjukkan performa lebih baik pada dataset tertentu. Misalnya, penggunaan SVM pada dataset CSE-CIC-IDS2018 menghasilkan akurasi tertinggi, mencapai 99,81% dengan model kuadratik. Sedangkan pada dataset UNSW-NB15, metode Decision Tree menunjukkan akurasi sebesar 85,56%(kilincer2021). SVM menunjukkan kinerja yang sangat baik, terutama dalam hal presisi dan recall, menjadikannya algoritma yang ideal untuk mendeteksi ancaman berisiko tinggi dengan tingkat false positive yang rendah.
Salah satu tantangan utama yang dihadapi oleh IDS berbasis pembelajaran mesin adalah ketergantungan pada dataset yang berkualitas tinggi. Dalam studi ini, penulis menyoroti bagaimana dataset seperti NSL-KDD yang lebih kecil cenderung memberikan hasil yang kurang optimal dibandingkan dengan dataset yang lebih besar dan lebih bervariasi seperti UNSW-NB15. Peneliti juga menyarankan bahwa metode normalisasi data, seperti min-max normalization yang diterapkan dalam penelitian ini, dapat membantu meningkatkan akurasi klasifikasi. Namun, mereka mencatat bahwa metode ini tidak selalu meningkatkan performa pada semua dataset, terutama ketika data tersebut mengandung banyak outliers atau nilai ekstrim.
Perbandingan yang dilakukan oleh penulis juga menekankan pentingnya memilih algoritma pembelajaran mesin yang tepat berdasarkan karakteristik dataset yang digunakan. KNN, meskipun relatif lebih mudah diterapkan, menunjukkan kinerja yang kurang baik pada dataset yang lebih besar seperti UNSW-NB15, dengan akurasi hanya sekitar 71,87% pada pengaturan klasifikasi menengah. Sementara itu, Decision Tree dan SVM memberikan hasil yang lebih stabil pada dataset yang kompleks seperti CSE-CIC-IDS2018, di mana metode ini berhasil mendeteksi berbagai jenis serangan seperti DoS dan DDoS dengan tingkat akurasi yang sangat tinggi, mencapai hampir 100% dalam beberapa kasus(kilincer2021).
Secara keseluruhan, artikel ini memberikan panduan berharga bagi para peneliti dan praktisi dalam memilih metode pembelajaran mesin yang paling sesuai untuk diterapkan dalam IDS. Hasil penelitian menunjukkan bahwa tidak ada satu pun algoritma yang dapat menjadi solusi universal untuk semua dataset dan jenis serangan, namun pendekatan komparatif ini memberikan wawasan yang sangat penting tentang kekuatan dan kelemahan masing-masing metode dalam konteks keamanan siber.
Penelitian yang dilakukan oleh Kilincer, Ertam, dan Sengur (2021) menegaskan pentingnya pemanfaatan metode pembelajaran mesin dalam mendeteksi serangan siber yang semakin kompleks. Meskipun ada banyak algoritma yang bisa digunakan, seperti yang ditunjukkan dalam penelitian ini, pemilihan metode yang tepat sangat bergantung pada karakteristik dataset dan jenis serangan yang ingin dideteksi. Algoritma seperti SVM dan Decision Tree terbukti memberikan hasil yang lebih baik dibandingkan dengan KNN pada dataset tertentu. Dengan akurasi mencapai hampir 100% pada beberapa skenario, algoritma-algoritma ini memperlihatkan potensi besar untuk diterapkan dalam lingkungan yang membutuhkan deteksi serangan siber secara real-time dan efisien(kilincer2021).
Namun, salah satu tantangan utama yang dihadapi adalah kebutuhan untuk terus memperbarui dan meningkatkan dataset yang digunakan dalam pelatihan algoritma ini. Dataset yang lebih besar dan beragam seperti UNSW-NB15 dan CSE-CIC-IDS2018 memungkinkan pengujian lebih komprehensif terhadap algoritma pembelajaran mesin, sementara dataset yang lebih kecil dan kurang representatif seperti NSL-KDD dapat membatasi efektivitas sistem deteksi intrusi. Oleh karena itu, penelitian masa depan harus berfokus pada pengembangan dataset yang lebih realistis dan terstruktur untuk menanggapi ancaman yang terus berkembang di dunia siber.