Pada tahun 2021, MongoDB (NoSQL) tercatat sebagai basis data paling populer di kategori ini, menempati posisi ke-5 secara keseluruhan di peringkat DB-Engines. Namun, masalah utama yang dihadapi industri adalah kurangnya alat manajemen terpadu yang dapat mengelola kedua jenis basis data ini secara efektif.
U-Schema adalah metamodel yang menawarkan solusi atas tantangan ini. Dengan memetakan skema logis dari empat paradigma utama NoSQL (kolumnar, key-value, dokumen, grafik) serta basis data relasional, U-Schema memungkinkan interoperabilitas antara sistem basis data yang berbeda.Â
Salah satu keuntungan utama dari pendekatan ini adalah kemampuannya untuk memfasilitasi migrasi skema antar model data.Â
Dalam artikel tersebut, para peneliti menunjukkan bagaimana U-Schema dapat diterapkan pada basis data besar seperti MongoDB dan Neo4j, serta menunjukkan performa yang efisien dengan validasi eksperimen.Â
Mereka menguji U-Schema dengan beberapa ukuran dataset, mulai dari ukuran kecil hingga besar (hingga 800.000 objek untuk entitas seperti pengguna dan alamat), dan hasilnya menunjukkan bahwa proses pemetaan skema tetap efisien bahkan pada skala yang lebih besar, dengan rasio waktu inferensi terhadap waktu query yang optimal.
Teori utama yang mendukung pengembangan U-Schema adalah konsep polyglot persistence. Dalam konteks ini, aplikasi tidak harus terikat pada satu jenis basis data, tetapi dapat memanfaatkan beberapa jenis basis data yang sesuai dengan kebutuhan. Misalnya, sebuah aplikasi e-commerce dapat menggunakan basis data relasional untuk transaksi keuangan dan NoSQL untuk menyimpan katalog produk yang tidak terstruktur. Pendekatan ini memungkinkan fleksibilitas dalam pengelolaan data yang tidak bisa diberikan oleh hanya satu jenis basis data saja.
Selain itu, teori klasik dari pemodelan basis data relasional juga diterapkan dalam pengembangan U-Schema. Pemodelan skema yang baik dapat meningkatkan integritas dan konsistensi data, yang penting bagi aplikasi enterprise.Â
Namun, NoSQL, meskipun lebih fleksibel, sering kali tidak memiliki alat pemodelan skema yang sekompleks basis data relasional. U-Schema menjembatani kesenjangan ini dengan menawarkan alat yang mendukung pemodelan skema baik untuk sistem NoSQL maupun relasional, sehingga memungkinkan kedua sistem ini untuk digunakan secara bersamaan dalam satu aplikasi.
Dalam artikel ini, Candel dan timnya juga menguji skalabilitas U-Schema di lingkungan basis data NoSQL yang besar, seperti MongoDB dan Neo4j, dan menemukan bahwa sistem ini mampu menangani berbagai ukuran dataset dengan efisien.Â
Sebagai contoh, dalam pengujian dengan dataset besar yang melibatkan 800.000 objek, sistem berhasil menyelesaikan inferensi skema dengan rasio yang tidak lebih dari 10 kali lipat dari waktu query biasa. Hasil ini sangat signifikan karena menunjukkan bahwa U-Schema dapat diimplementasikan secara efisien bahkan di lingkungan data besar yang terus berkembang pesat.
***
Secara keseluruhan, penelitian oleh Carlos J. Fernndez Candel dan rekan-rekannya telah berhasil menawarkan solusi praktis dan inovatif untuk tantangan pengelolaan basis data heterogen melalui U-Schema.Â