Pengguna dapat berbagi pesan melalui tweet berkat 400 juta pengguna harian Twitter dan lebih dari 500 juta pengguna aktif. Pengguna Twitter berdiskusi kegiatan sehari-hari mereka, mendiskusikan peristiwa terkini, dan bertukar pendapat tentang banyak hal. Pengguna internet sering beralih dari blog atau milis ke layanan microblogging karena mudah diakses dari berbagai platform. Akibatnya, semakin banyak pengguna Twitter yang menulis ulasan tentang barang dan jasa yang mereka gunakan untuk membagikan pendapat mereka.
Aktivitas spam dilakukan karena berbagai alasan. Tujuan komersial, seperti iklan dan promosi, adalah salah satunya. Spam ditransmisikan dengan biaya operasional yang sangat rendah karena tidak memerlukan milis untuk menjangkau klien yang ditargetkan. Sebagian besar pesan singkat atau tautan yang disematkan spam tidak fokus pada konten posting yang disediakan, tetapi jika dilakukan berulang kali, itu akan menghambat pengguna yang menerima atau sudah menyeberang. Secara teknis, mengirim pesan terus menerus dan sekaligus menggunakan banyak sumber daya, termasuk kapasitas server dan bandwidth, dan dapat menyebabkan beban server yang signifikan yang dapat menurunkan server.
Pengguna Twitter dapat dibagi menjadi tiga kelompok: pengguna manusia sebenarnya, android, dan bot. Fitur-fitur di Twitter yang dapat digunakan untuk membedakan orang, cyborg, dan bot antara lain saat pengguna memublikasikan tweet, konten tweet tersebut, dan atribut akun. Waktu unggah pengguna adalah salah satu fitur yang dapat digunakan untuk menentukan interval entropi. Membandingkan interval entropi ini dengan fitur dalam konten tweet dan data akun dapat memberikan hasil dengan tingkat akurasi yang tinggi.
Teknik unik yang menggabungkan SA berbasis emosi dengan TIE untuk membedakan antara bot spam dan pengguna sebenarnya. Analisis sentimen (SA) digunakan untuk mengidentifikasi berbagai sentimen atau sudut pandang dalam tweet. Sementara TIE digunakan untuk mencatat konsistensi waktu post-tweet yang menunjukkan tweet auto-upload. Untuk menilai keefektifan strategi yang disarankan, sejumlah pengujian telah dilakukan. Dengan tingkat presisi dan recall masing-masing 83% dan 91%, temuan eksperimen menunjukkan bahwa kombinasi SA dan TIE dapat mengoptimalkan kinerja sistem secara keseluruhan dalam mengenali bot spammer.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H