Berdasarkan hasil uji, dataset situs kursus database menunjukkan bahwa 97,53% query melibatkan seleksi (selection predicates), sementara dataset Bus Tracker memiliki distribusi sebesar 95,21%. Ini mengindikasikan bahwa algoritma prediksi harus berfokus pada optimisasi query seleksi yang umum digunakan.
Namun, keberhasilan Q-Learning di laboratorium tidak serta-merta menjamin kesuksesannya di lingkungan basis data yang lebih luas dan kompleks. Tantangan terbesar dalam penerapan model prediksi berbasis Q-Learning atau RNN adalah kompleksitas query di dunia nyata, yang sering kali melibatkan lebih banyak variabel dan skenario yang dinamis. Sebagai contoh, hanya 3,66% dari query pada dataset situs kursus yang melibatkan JOIN predicates.Â
Meskipun demikian, di banyak aplikasi enterprise, query JOIN sering menjadi bagian integral dari analisis data. Q-Learning, yang dalam penelitian ini difokuskan pada prediksi fragmen query, perlu diuji lebih jauh pada dataset dengan distribusi kueri yang lebih beragam untuk memastikan bahwa algoritma ini bisa bekerja di berbagai lingkungan basis data, tidak hanya yang mendominasi seleksi sederhana.
Selain itu, walaupun RNN kalah dalam hal akurasi, pendekatan RNN-Synth yang dapat mensintesis query novel memiliki potensi besar di masa depan. Keunggulan RNN terletak pada kemampuannya untuk memprediksi query-query baru yang belum pernah terjadi sebelumnya, suatu fitur yang mungkin sangat berguna di dunia data eksploratif yang lebih kreatif. Sementara Q-Learning berfokus pada presisi dalam mereplikasi query sebelumnya, RNN menawarkan fleksibilitas yang lebih besar dalam menghadapi pola-pola baru dalam penggunaan basis data.
Dari sisi efisiensi waktu, penelitian ini mencatat bahwa Q-Learning juga lebih unggul. Ini penting, mengingat salah satu kendala terbesar dalam pemrosesan query adalah waktu respons. Jika prediksi query SQL dapat dilakukan selama waktu "think-time" pengguna, hasil kueri dapat disiapkan terlebih dahulu, sehingga mengurangi waktu tunggu secara signifikan.Â
Dalam skenario di mana ribuan query diproses secara paralel, kecepatan prediksi menjadi salah satu faktor kunci. Namun, pertanyaannya adalah apakah pendekatan spekulatif ini dapat beradaptasi dengan perubahan kebutuhan pengguna dalam dunia nyata yang serba cepat.
Meskipun penelitian ini mengungkapkan bahwa Q-Learning lebih akurat dan cepat, tantangan dalam hal skalabilitas dan penerapan pada skenario dunia nyata tetap ada. Kesuksesan dalam laboratorium adalah langkah pertama, tetapi untuk memanfaatkan potensi penuh dari algoritma ini, perlu ada adaptasi yang lebih fleksibel terhadap perubahan lingkungan basis data.
***
Dari penelitian yang dilakukan oleh Meduri et al. (2021), dapat disimpulkan bahwa algoritma Q-Learning memiliki keunggulan signifikan dalam memprediksi query SQL berikutnya dibandingkan RNN, baik dari segi akurasi maupun efisiensi waktu.
Namun, keberhasilan algoritma ini dalam skenario yang lebih terbatas dan terkendali menimbulkan pertanyaan penting: bagaimana kinerjanya ketika diterapkan pada basis data dengan tingkat kompleksitas dan variasi query yang lebih tinggi? Untuk mencapai potensi penuhnya, algoritma ini perlu diuji lebih lanjut pada skenario dunia nyata yang lebih dinamis dan beragam.
Dengan dominasi kueri seleksi dalam dataset yang digunakan---89% untuk situs kursus database dan 86% untuk Bus Tracker---riset ini berhasil menunjukkan bahwa prediksi fragmen SQL sangat berguna dalam skenario yang serupa.Â