GMM bekerja dengan mengasumsikan bahwa data berasal dari beberapa distribusi Gaussian yang berbeda. Model ini dapat menangkap hubungan kompleks antar fitur jaringan dan lebih efektif dalam mendeteksi anomali dibandingkan K-Means.
Dengan menggunakan algoritma clustering, sistem dapat mendeteksi lalu lintas yang berbeda dari pola normal, seperti lonjakan aktivitas yang tidak biasa atau koneksi mencurigakan ke alamat IP tertentu.
Implementasi Deteksi Anomali Jaringan
Untuk menerapkan deteksi anomali jaringan menggunakan clustering, langkah-langkah berikut dapat dilakukan:
-
Pengumpulan Data Jaringan
Menggunakan log aktivitas jaringan dari firewall, router, atau sensor IDS.
Data mencakup informasi seperti alamat IP sumber dan tujuan, jumlah paket, durasi koneksi, dan jenis protokol yang digunakan.
Pra-pemrosesan Data
Membersihkan data dari duplikasi dan nilai yang hilang.
Normalisasi fitur untuk memastikan bahwa semua fitur memiliki skala yang sama.
Penerapan Algoritma Clustering