Perubahan pola dan perilaku penggunaan internet yang semakin masif sejak pandemi COVID-19 membuat para hacker mempunyai berbagai cara kejahatan dunia maya untuk mengelabui korbannya. Beberapa cara yang masih dilakukan para hacker adalah penipuan dengan memanfaatkan data pengguna dengan website palsu (phishing) yang menyerupai website aslinya. Tampilan dan URL website yang menipu target atau calon korban merupakan trik penipuan untuk mendapatkan kepercayaan dari target.Â
Oleh karena itu, kami memutuskan untuk melakukan penelitian dengan membangun sistem pendeteksi URL dengan karakteristik penipuan, phishing, dan scam berbasis website menggunakan machine learning. Karena sistem ini bersifat preventif berupa proteksi, maka diciptakanlah nama yang mudah digunakan yaitu Protective URL Detector (PROCTOR).Â
PROCTOR menggunakan 52 fitur standar protokol keamanan situs web dan dilatih untuk memanfaatkan data penipuan, phishing, dan penipuan di Indonesia dengan model pembelajaran mesin random forest (RF). Setelah pelatihan, model diuji dan dievaluasi dengan data baru menggunakan metode evaluasi klasifikasi matriks konfusi.Â
Model paling optimal dicapai oleh model RF dengan akurasi pelatihan sebesar 99,91% dibandingkan model ML lainnya (KNN dan SVM). Model terbaik RF kemudian diimplementasikan menggunakan Python versi 3.10.6 pada container Docker dengan layanan web Flask API sebagai antarmuka situs web sistem pengguna/klien. Docker adalah teknologi yang menggabungkan aplikasi-aplikasi terkait ketergantungan, dan perpustakaan sistem terorganisir yang akan dibangun dalam wadah. Flask adalah kerangka web mikro yang ditulis Python dan berdasarkan pada toolkit WSGI dan template Jinja 2 mesin yang memungkinkan pengembang membangun aplikasi web cepat.Â
Kombinasi ini sangat cocok untuk tahap pengembangan model AI untuk web aplikasi sebagai Protective URL Detector (PROCTOR). Pada tahap ini sistem menggunakan proses metode Flask dan beberapa fitur tambahan. Sebelum menerapkan model AI terbaik ke dalam antarmuka pengguna, kita perlu mengonversinya model ke dalam perpustakaan bernama pickle (.pkl).
Skenario pengujian dilakukan pada URL bit(*)ly/shopeebigsale662, dan menampilkan informasinya seperti yang ditunjukkan pada Gambar diatas. Klasifikasi juga menunjukkan website "terindikasi tidak aman" dengan URL asli-nya adalah https(:)//shopeebigsale662.blogspot(*)com, namun dengan tambahan 99,98% informasi persentase probabilitas prediksi.
Artikel ilmiah ini dapat dilihat dan diunduh pada International Journal of Computing and Digital Systems University of Bahrain.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H