Bayangkan internet menjadi pusat server, memungkinkan akses tak terbatas kapan saja. Kini teknik database berbasis cloud computing yang menggantikan manajemen database fisik muncul. Program dijalankan melalui komputer yang terhubung secara bersamaan dalam satu jaringan. Kekuatan utama cloud computing terletak pada virtualisasi dan penggunaan node-node, di mana setiap node beroperasi secara mandiri namun tetap terintegrasi dalam satu sistem.
Cloud data warehouse (CDW) memungkinkan pengelolaan database terpusat di public cloud, yang mampu memproses, menyimpan, mengintegrasikan, dan mengelola big data, baik terstruktur maupun semi terstruktur. CDW berbeda dengan data warehouse tradisional. Cloud data warehouses seperti Amazon Redshift, Google Bigquery, Microsoft Azure Synapse Analytics dan Snowflake memungkinkan pengguna untuk mengakses data dari lokasi geografis serta zona waktu yang berbeda. Skalabilitas lebih terjamin sebab cloud computing didesain untuk unggul di pengguna skala besar sehingga memudahkan juga untuk DBA (database administrator) dalam pengelolaannya.
Arsitektur CDW mengacu pada komponen dalam DW yang dikelola di cloud. Adapun komponennya mencakup elemen dan interaksinya seperti sumber data. Sumber data variasinya luas dalam tipe data, format, maupun mekanisme pengiriman mulai dari basis data transaksi hingga data streaming dan API eksternal. Kemudian, ada data ingestion layer yang bertanggung jawab untuk melakukan ETL (Extract, Transform, Load) seperti pada DW tradisional. Proses ini seringkali dilakukan secara real time. Ketiga, storage layer yang mengorganisasi dan menyimpan data dalam format terstruktur yang dioptimalkan untuk pemrosesan analitik.
Kebanyakan CDW memanfaatkan sistem file terdistribusi untuk penyimpanan, mendistribusikan data di seluruh beberapa node dan menyediakan skalabilitas. Keempat, lapisan komputasi yang memproses kueri dan melakukan operasi analitik pada data yang disimpan seperti alokasi sumber daya (CPU dan memori) untuk berbagai kueri dan beban kerja. Kelima, optimasi dan eksekusi kueri. Mesin cloud data warehouse mengoptimalkan kueri SQL sehingga kueri bekerja dengan efisien. Pendekatan ini mengevaluasi berbagai rencana eksekusi dan memilih yang memiliki biaya estimasi terendah. Terakhir, integrasi dengan alat BI. Cloud data warehouse menyediakan protokol konektivitas dan antarmuka yang memungkinkan integrasi mulus dengan alat BI. Protokol umum mencakup Java Database Connectivity (JDBC), Open Database Connectivity (ODBC), dan RESTful APIs.
Menilik lebih dalam, terdapat perbedaan mendasar antara DW tradisional dan CDW, terutama dalam hal performa dan skalabilitas. DW tradisional memengaruhi kueri seiring bertambahnya data sedangkan CDW tidak. DW tradisional lebih cocok untuk penggunaan volume data yang besar dengan pengguna yang kecil. Lain cerita dengan CDW, yang cocok untuk peningkatan volume keduanya, baik data maupun pengguna. Dari segi sumber daya perusahaan, DW tradisional mengharuskan organisasi untuk membeli kapasitas komputasi dan penyimpanan secara bersamaan, yang bisa menjadi pemborosan jika tidak semuanya digunakan sedangkan untuk CDW, memungkinkan organisasi untuk menyesuaikan cluster komputasi dan hanya membayar untuk apa yang mereka butuhkan saat mereka membutuhkannya, memberikan kontrol lebih besar atas biaya operasional.
Pemeliharaan, penskalaan, atau peningkatan data warehouse cloud lebih mudah dibandingkan dengan DW tradisional, karena dalam DW cloud tidak perlu memelihara indeks, membersihkan file, atau memperbarui metadata. Cloud menyediakan penyimpanan murah dan komputasi sesuai permintaan. CDW telah menurunkan biaya kompleksitas dan waktu untuk mendapatkan nilai yang panjang, yang telah membatasi adopsi dan penggunaan teknologi data warehouse tradisional yang sukses. Selain itu, data warehouse cloud menyediakan penskalaan yang sepenuhnya independen untuk komputasi, penyimpanan, dan layanan
Meskipun CDW menawarkan berbagai keunggulan, seperti fleksibilitas dan kemampuan skalabilitas yang lebih tinggi, transisi dari data warehouse tradisional ke lingkungan berbasis cloud membawa tantangan tersendiri. Keamanan data harus dijaga dengan baik, dan ini bisa dilakukan sesuai kebijakan perusahaan, seperti memberikan jaminan hukum serta menggunakan teknik minimisasi data, sehingga hanya data yang diperlukan yang diambil. Selain itu, ambiguitas kepemilikan data menjadi tantangan, karena ketika informasi diakses oleh lebih dari satu orang, akan dibutuhkan upaya tambahan untuk menentukan siapa pemiliknya.
Oleh karena itu, perusahaan harus cermat dalam menjalankan praktik ini guna mencegah data terpecah. Migrasi data ke CDW membawa tantangan besar bagi organisasi, terutama ketika berpindah dari sistem perangkat keras dan perangkat lunak tradisional. Walaupun solusi berbasis cloud menawarkan kemampuan baru dan akses sumber daya yang lebih fleksibel, proses migrasi bukan hanya sekadar memindahkan alat dan prosedur yang sama ke lingkungan cloud. Tantangan ini meliputi penanganan volume dan variasi data yang sangat besar, serta kompleksitas data science yang diterapkan pada data tersebut. Selain itu, lingkungan cloud yang dinamis membutuhkan manajemen yang hati-hati untuk mengatasi masalah yang mungkin muncul, serupa dengan tantangan yang dihadapi dalam pengaturan tradisional.
DAFTAR PUSTAKA
Ahmadi, S. (2023). Security And Privacy Challenges in Cloud-Based Data Warehousing: A Comprehensive Review. International Journal of Computer Science Trends and Technology (IJCST)–Volume, 11.
Kahn, M. G., Mui, J. Y., Ames, M. J., Yamsani, A. K., Pozdeyev, N., Rafaels, N., & Brooks, I. M. (2022). Migrating a research data warehouse to a public cloud: challenges and opportunities. Journal of the American Medical Informatics Association, 29(4), 592-600.