Tulisan ini adalah lanjutan dari tulisan saya berjudul Data Warehouse, yang dapat dibaca pada [1]. Kali ini saya akan membahas salah satu model data multidimensi yang sering digunakan pada pembangunan data warehouse. Menurut Han dkk (2012), bahwa salah satu paradigma pemodelan yang paling umum digunakan dalam merancang data warehouse adalah Star Schema.
Model ini terdiri dari dua komponen utama, pertama disebut sebagai fact table. komponen ini memiliki ciri antara lain menampung sebagian besar data pada data warehouse. Kedua disebut sebagai dimension table, ciri utama tabel ini adalah berisi data dimensi yang dirujuk oleh fact tabel, pada umumnya tabel ini lebih sedikit menampung data [2]. Sebagai catatan, banyaknya jumlah dimension table ini tergantung dari banyaknya jumlah atribut dimensi pada fact table, artinya setiap satu atribut dimensi pada fact table dipastikan memiliki satu dimension table.
Perhatikan Gambar 1, Anda dapat melihat bahwa fact table yang dimaksudkan adalah entitas yang memiliki atribut id_d1, id_d2, id_d3, id_d4 dan id_d5. Setiap nilai atribut ini masing-masing merujuk ke dimension table yang bersesuaian.
Sedangkan atribut lain merupakan atribut yang menjadi atribut ukuran (saya sering menyebutkan sebagai atribut kunci dalam merancang data warehouse, sebagai contoh pada makalah kami [3], kami memilih atribut sks dan ip sebagai atribut ukuran, karena atribut-atribut tersebut adalah tujuan utama dalam merancang data warehouse sesuai kasus yang kami ambil.
Jika diperhatikan, model ini tidak lebih merupakan bentuk normalisasi dari basis data, yang dipelajari disemester awal mahasiswa informatika atau ilmu komputer. Sehingga sangat memungkinkan Anda dapat membuat data warehouse dengan mudah pada semester 5 ke-atas, artinya Anda sudah bisalah mengambil project dibidang ini jika ada tawaran.. he heh e....
Tentu saja tidak ketinggalan pemahaman tentang Entitas Relationship Diagram (ERD) perlu ditinjau kembali. Kemudian, pemahaman tentang Structure Query Language (SQL) juga sangat diperlukan, khususnya dalam melalukan data retrieve nantinya, yang paling utama adalah pemahaman tentang agregasi pada SQL. Ini paling banyak digunakan nantinya.
Catatan: bahwa dimension table tidak harus 5 (lima), bisa lebih, bisa kurang, tergantung kasus yang diambil. Gambar 1 Hanya contoh agar memudahkan Anda memahami model ini. Kemudian, secara teknis mungkin saja, data warehouse yang Anda dibuat tidak hanya berisi satu model schema, bisa lebih.Â
Referensi:
[1] Natalis Ransi, 2019, Data Warehouse, Kompasiana.com
[2] Jiawei Han, Micheline Kamber, Jian Pei, 2012, Data mining: concepts and technique, Morgan Kaufmann, Waltham, USA