***
Penelitian ini menyimpulkan bahwa kurangnya transparansi dan dokumentasi yang memadai dalam penggunaan dataset AI menimbulkan krisis yang serius, terutama dalam hal lisensi dan atribusi. Artikel ini menyarankan penggunaan alat seperti Data Provenance Explorer untuk membantu para pengembang dan peneliti melacak asal-usul dataset dan memastikan bahwa dataset tersebut digunakan sesuai dengan ketentuan lisensinya. Penelitian ini juga menekankan pentingnya kolaborasi antara pakar hukum dan komunitas AI untuk mengurangi risiko hukum dan etika di masa mendatang.
Implikasi dari penelitian ini sangat signifikan bagi komunitas AI dan pengembangan kebijakan data. Dengan mengidentifikasi masalah mendasar dalam dokumentasi lisensi dataset, penelitian ini membuka jalan bagi regulasi yang lebih jelas dan praktik penggunaan data yang lebih bertanggung jawab. Dalam jangka panjang, penelitian ini dapat mempengaruhi bagaimana dataset digunakan dalam pengembangan model AI, serta membantu menciptakan lingkungan yang lebih transparan dan adil dalam pengembangan teknologi kecerdasan buatan.
REFRENSI :
Longpre, S., Mahari, R., Chen, A., Obeng-Marnu, N., Sileo, D., Brannon, W., Muennighoff, N., Khazam, N., Kabbara, J., Perisetla, K., Wu, X., Shippole, E., Bollacker, K., Wu, T., Villa, L., Pentland, S., & Hooker, S. (2024). A large-scale audit of dataset licensing and attribution in AI. Nature Machine Intelligence, 6(8), 975--987. https://doi.org/10.1038/s42256-024-00878-8
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H