Apa itu Data Warehouse?
Data warehouse adalah jenis sistem manajemen data yang dirancang untuk memungkinkan dan mendukung kegiatan intelijen bisnis (BI), terutama analisis. Data warehouses hanya dimaksudkan untuk melakukan kueri dan analisis dan sering mengandung sejumlah besar data historis. Data dalam gudang data biasanya berasal dari berbagai sumber seperti file log aplikasi dan aplikasi transaksi.
Data warehouse memfokuskan dan mengkonsolidasikan sejumlah besar data dari berbagai sumber. Kemampuan analisisnya memungkinkan organisasi untuk mendapatkan wawasan bisnis yang berharga dari data mereka untuk meningkatkan pengambilan keputusan. Seiring waktu, ia membangun catatan sejarah yang bisa sangat berharga bagi ilmuwan data dan analis bisnis. Karena kemampuan ini, gudang data dapat dianggap sebagai "sumber satu-satunya kebenaran" organisasi.
Penyimpanan Data Awal
Punch card adalah solusi pertama untuk menyimpan data yang dihasilkan komputer. Pada tahun 1950-an, kartu punch adalah bagian penting dari pemerintah Amerika dan bisnis. Peringatan “Jangan melipat, membungkuk, atau melukai” awalnya berasal dari kartu punch. Kartu punch terus digunakan secara teratur sampai pertengahan 1980-an. Mereka masih digunakan untuk merekam hasil pemungutan suara dan tes standar.
“Magnetic storage” perlahan-lahan menggantikan kartu punch mulai pada tahun 1960-an. Penyimpanan disk datang sebagai langkah evolusioner berikutnya untuk penyimpanan data. Penyimpanan disk (hard drive dan floppies) mulai menjadi populer pada tahun 1964 dan memungkinkan data untuk diakses secara langsung, secara signifikan meningkatkan pita magnet clumsier.
DBMS dalam penyimpanan disk
DBMS (Database Management Systems) diintegrasikan dengan penyimpanannya untuk menyimpan data secara langsung pada disk itu sendiri. Keuntungan utama dari integrasi DBMS adalah kami dapat menemukan data dengan cepat. Fitur termasuk lokasi dan penghapusan data, memecahkan masalah ketika dua data yang berbeda dipaparkan ke lokasi yang sama. Lokasi fisik dapat diperpanjang ketika data melebihi batas penyimpanan.
Penyimpanan disk segera diikuti oleh perangkat lunak yang disebut sistem manajemen database. (DBMS). Pada tahun 1966, IBM datang dengan DBMS sendiri yang disebut, pada saat itu, sistem manajemen informasi. Perangkat lunak DBMS dirancang untuk mengelola “penyimpanan disk” dan mencakup kemampuan berikut:
- Mengidentifikasi lokasi data yang tepat
- Memecahkan konflik ketika lebih dari satu unit data dipaparkan ke lokasi yang sama
- Memungkinkan data untuk dihapus
- Cari ruang ketika data yang disimpan tidak akan cocok di lokasi fisik tertentu yang terbatas
- Dapatkan data dengan cepat