YOLOv5 dan Jetson Nano: Paduan Sempurna untuk Deteksi Masker Real-Time
Di era pandemi global, teknologi deep learning berkembang pesat, terutama dalam sektor machine vision yang mendukung deteksi objek dalam berbagai situasi nyata. Salah satu penerapan yang signifikan adalah penggunaan algoritma YOLO (You Only Look Once) untuk mendeteksi penggunaan masker wajah di ruang publik, sebagaimana dipaparkan dalam artikel oleh Al-Selwi et al. (2023). Teknologi ini bukan hanya sekedar kemajuan dalam machine vision, tetapi juga memainkan peran penting dalam menjaga kesehatan masyarakat, terutama dalam menekan penyebaran virus COVID-19. Deteksi penggunaan masker wajah telah menjadi isu kritis di berbagai tempat umum, seperti kantor, sekolah, dan tempat ibadah, di mana protokol kesehatan harus diikuti dengan ketat.
Penggunaan YOLOv5 dalam penelitian ini didasarkan pada kemampuan algoritma ini dalam melakukan deteksi objek dengan cepat dan akurat, dibandingkan dengan metode lain seperti Faster R-CNN. Kecepatan deteksi YOLOv5 yang mencapai 120 frame per detik (FPS) pada GPU Nvidia GTX 1660 dan 20 FPS pada Jetson Nano menjadikannya solusi yang ideal untuk perangkat dengan daya rendah. Selain itu, dataset yang digunakan dalam penelitian ini terdiri dari 2034 gambar dengan berbagai kondisi, termasuk orang yang menggunakan masker dengan benar, tanpa masker, dan penggunaan masker yang salah. Al-Selwi et al. (2023) juga menunjukkan bahwa model ini mampu mencapai mean Average Precision (mAP) sebesar 0,70, yang lebih tinggi dibandingkan dengan metode lain seperti SSD MobileNet yang hanya mencapai 0,61. Fakta ini menunjukkan betapa pentingnya inovasi dalam deep learning untuk mengatasi tantangan di lapangan.
Artikel oleh Al-Selwi et al. (2023) menyoroti bagaimana YOLOv5, sebuah algoritma deep learning berbasis machine vision, berhasil mengatasi tantangan deteksi masker wajah dalam berbagai situasi nyata. Salah satu poin penting yang diungkapkan adalah kecepatan deteksi yang sangat tinggi. YOLOv5, dengan 120 FPS pada Nvidia GTX 1660 dan 20 FPS pada Jetson Nano, menawarkan solusi cepat dan efisien untuk deteksi real-time di ruang publik. Ini sangat penting, terutama di tempat-tempat di mana banyak orang berkumpul dan pengawasan harus dilakukan secara konstan. Jika dibandingkan dengan metode seperti Faster R-CNN, yang umumnya memiliki kecepatan lebih lambat, jelas bahwa YOLOv5 unggul dalam efisiensi waktu.
Selain kecepatan, aspek lain yang disorot adalah tingkat akurasi. Dengan mAP sebesar 0,70, YOLOv5 mengungguli berbagai metode deteksi lainnya, termasuk SSD MobileNet dengan mAP 0,61 dan Faster R-CNN dengan 0,59. Ini menunjukkan bahwa YOLOv5 mampu mendeteksi orang dengan masker, tanpa masker, dan yang menggunakan masker secara tidak benar dengan akurasi yang lebih tinggi. Dalam konteks aplikasi praktis, tingkat akurasi ini sangat penting, terutama ketika jumlah orang yang terlibat sangat besar. Misalnya, di area tertutup seperti kantor atau tempat ibadah, di mana protokol kesehatan seperti penggunaan masker harus dipatuhi secara ketat, kesalahan dalam mendeteksi bisa memiliki konsekuensi serius.
Salah satu keunikan YOLOv5 yang diangkat oleh penulis adalah kemampuannya untuk beroperasi pada perangkat dengan daya rendah, seperti Jetson Nano. Jetson Nano, dengan arsitektur CPU-GPU yang memungkinkan pemrosesan paralel, memberikan solusi yang ideal untuk implementasi di lingkungan di mana daya dan ruang menjadi kendala. Hal ini menunjukkan bahwa tidak hanya akurasi dan kecepatan yang menjadi keunggulan utama YOLOv5, tetapi juga fleksibilitas dan skalabilitasnya.
Dalam penelitian ini, dataset yang digunakan diambil dari Kaggle dan mencakup total 2034 gambar setelah proses augmentasi. Dataset ini terdiri dari gambar orang dengan masker, tanpa masker, dan masker yang digunakan dengan salah. Dengan pembagian 87% untuk pelatihan, 8% untuk validasi, dan 4% untuk pengujian, penelitian ini memastikan bahwa model yang dilatih memiliki robustitas yang tinggi dalam berbagai kondisi. Salah satu tantangan utama yang dihadapi adalah tingginya tingkat kesalahan dalam mendeteksi orang yang menggunakan masker dengan tidak benar, di mana tingkat kebingungan mencapai 43%. Meskipun demikian, kesalahan deteksi ini diimbangi dengan kemampuan tinggi model untuk mendeteksi orang yang memakai masker dan tidak memakai masker dengan baik, dengan tingkat kesalahan hanya 2%.
Penelitian yang dilakukan oleh Al-Selwi et al. (2023) menunjukkan bahwa YOLOv5 adalah solusi unggul untuk deteksi masker wajah di ruang publik, berkat kecepatan, akurasi, dan efisiensi daya yang ditawarkannya. Algoritma ini tidak hanya mampu beroperasi pada perangkat dengan daya rendah seperti Jetson Nano, tetapi juga memberikan hasil deteksi yang akurat dengan mAP 0,70, jauh di atas metode lainnya. Dengan 120 FPS di GPU Nvidia GTX dan 20 FPS di Jetson Nano, YOLOv5 menawarkan kinerja real-time yang sangat dibutuhkan dalam situasi pengawasan massal selama pandemi.
Namun, tantangan tetap ada, seperti tingkat kebingungan 43% dalam mendeteksi penggunaan masker yang salah. Meskipun demikian, solusi ini dapat diimplementasikan di berbagai tempat seperti kantor dan sekolah untuk memantau kepatuhan terhadap protokol kesehatan. Dengan beberapa perbaikan, sistem ini dapat berperan besar dalam mencegah penyebaran penyakit menular di masa mendatang.
Referensi
Al-Selwi, H. F., Hassan, N., Ghani, H. B. A., Hamzah, N. A. b. A., & Aziz, A. B. A. (2023). Face mask detection and counting using you only look once algorithm with Jetson Nano and NVIDIA giga texel shader extreme. IAES International Journal of Artificial Intelligence (IJ-AI), 12(3), 1169-1177. https://doi.org/10.11591/ijai.v12.i3.pp1169-1177
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H