Inkonsistensi SWQAT: Tantangan dan Solusi untuk Pengambilan Keputusan yang Lebih Baik
Dalam era perkembangan teknologi yang pesat, kualitas perangkat lunak memainkan peran penting dalam menentukan kesuksesan sebuah sistem informasi. Seiring dengan meningkatnya kompleksitas perangkat lunak, perusahaan semakin bergantung pada alat bantu penilaian kualitas perangkat lunak otomatis atau Software Quality Assessment Tools (SWQAT). Alat ini membantu organisasi untuk memonitor aspek-aspek teknis seperti maintainability, keandalan, dan keamanan perangkat lunak. Namun, meski SWQAT telah menjadi standar dalam banyak proyek pengembangan dan pemeliharaan perangkat lunak, ada tantangan besar dalam menggunakannya sebagai dasar pengambilan keputusan. Artikel ilmiah oleh Pfeiffer dan Aaen (2024) mengidentifikasi lima tantangan utama dalam penerapan SWQAT di berbagai organisasi. Melalui studi komprehensif yang dilakukan di IT University of Copenhagen, mereka mengevaluasi enam alat SWQAT yang sering digunakan oleh perusahaan-perusahaan besar seperti DHL, Philips, dan Coca-Cola (Pfeiffer & Aaen, 2024). Hasil penelitian ini menyoroti perbedaan signifikan dalam cara SWQAT menilai kualitas perangkat lunak, yang berpotensi menciptakan inkonsistensi dalam pengambilan keputusan terkait proyek teknologi informasi. Misalnya, satu alat mungkin memberikan skor tinggi pada satu aspek kualitas, sementara alat lain memberikan hasil yang sebaliknya. Dengan semakin luasnya penggunaan SWQAT dalam proyek pengembangan perangkat lunak skala besar, pemahaman mendalam tentang keterbatasan alat ini sangatlah krusial. Artikel ini memunculkan perdebatan penting mengenai efektivitas SWQAT dan menekankan kebutuhan akan penilaian yang lebih terukur dan kontekstual dalam sistem informasi masa depan.Â
Salah satu tantangan terbesar yang diidentifikasi oleh Pfeiffer dan Aaen (2024) adalah bahwa SWQAT hanya fokus pada analisis statis kode sumber, sementara kualitas perangkat lunak adalah konsep multidimensional. Dalam evaluasi enam SWQAT terkenal, seperti Better Code Hub dan SonarQube, ditemukan bahwa alat-alat ini hanya menilai karakteristik internal perangkat lunak, seperti struktur dan kompleksitas kode. Misalnya, SWQAT 1, Better Code Hub, menggunakan 10 metrik untuk menilai kualitas kode, sementara SonarQube (SWQAT 6) menggunakan lebih dari 2.500 metrik. Namun, meski perbedaannya mencolok, kedua alat tersebut gagal memperhitungkan bagaimana perangkat lunak tersebut berfungsi dalam konteks lingkungan pengguna, seperti bagaimana aplikasi berinteraksi dengan sistem lain, atau apakah perangkat lunak tersebut sesuai dengan kebutuhan pengguna (Pfeiffer & Aaen, 2024).
Tantangan lain adalah inkonsistensi hasil penilaian di antara alat-alat tersebut. Sebagai contoh, saat menilai kompleksitas perangkat lunak, alat SWQAT 3 (Codacy) memberikan skor 2%, sementara SWQAT 4 (Codebeat) memberikan angka yang jauh lebih tinggi, yaitu 541 unit kompleksitas. Hal ini menunjukkan bahwa perusahaan yang bergantung hanya pada satu alat dapat membuat keputusan yang salah terkait proyek perangkat lunak mereka. Bahkan, perbedaan dalam skala penilaian juga menjadi masalah. SWQAT 2 (CAST Highlight), misalnya, menggunakan skala tiga langkah untuk kualitas keseluruhan (rendah, sedang, tinggi), sementara SWQAT 3 menggunakan enam langkah (A hingga F).
Pfeiffer dan Aaen juga menemukan bahwa SWQAT dapat "dimanipulasi" atau dipilih sesuai kebutuhan untuk menghasilkan hasil yang diinginkan. Misalnya, sistem perangkat lunak yang sama dinilai memiliki tingkat maintainability tertinggi oleh SonarQube (A rating), tetapi oleh CAST Highlight, perangkat tersebut dianggap memiliki maintainability rendah. Dalam konteks kontrak atau perselisihan hukum, perusahaan dapat dengan mudah memilih alat yang memberikan hasil yang paling menguntungkan bagi mereka (Pfeiffer & Aaen, 2024).
Artikel ini jelas memperlihatkan bahwa alat-alat SWQAT memiliki keterbatasan besar yang dapat menyesatkan pengambilan keputusan. Untuk mengatasi hal ini, penulis mengusulkan solusi SWQAT yang dapat disesuaikan, di mana alat ini harus dapat memperhitungkan lebih banyak faktor konteks spesifik dan menyertakan input dari pengguna selain hanya kode sumber.
Dari evaluasi yang dilakukan oleh Pfeiffer dan Aaen (2024), jelas bahwa alat SWQAT saat ini, meskipun penting, masih memiliki banyak keterbatasan dalam menilai kualitas perangkat lunak secara menyeluruh. Inkonsistensi penilaian, fokus pada aspek internal kode, serta kemungkinan "memanipulasi" hasil untuk keuntungan tertentu menjadi masalah utama yang perlu diperhatikan oleh organisasi. Oleh karena itu, mereka menyarankan penggunaan SWQAT yang lebih fleksibel dan dapat disesuaikan untuk memenuhi kebutuhan kontekstual setiap proyek. Dengan begitu, penilaian kualitas perangkat lunak tidak hanya mengandalkan metrik standar, tetapi juga mempertimbangkan faktor eksternal yang relevan dengan lingkungan dan pengguna perangkat lunak.
Penelitian ini menekankan pentingnya transparansi dan keterlibatan pengguna dalam proses penilaian kualitas perangkat lunak. Implikasi utama bagi industri adalah bahwa organisasi perlu mempertimbangkan lebih dari satu alat SWQAT dan melihat hasil dengan kritis, terutama ketika digunakan untuk membuat keputusan strategis. Dengan mengintegrasikan masukan dari pengguna dan mempertimbangkan konteks spesifik proyek, penilaian kualitas perangkat lunak dapat menjadi lebih akurat dan bermanfaat dalam jangka panjang.
Referensi:
Pfeiffer, R.-H., & Aaen, J. (2024). Tools for monitoring software quality in information systems development and maintenance: Five key challenges and a design proposal. International Journal of Information Systems and Project Management, 12(1), 19--40. https://doi.org/10.12821/ijispm120102Â