Nama : I Nyoman Jyotisa
NIM : 1905551092
Matakuliah : Data Warehouse
Nama Dosen : I Putu Agus Eka Pratama, S.T., M.T.
Program Studi Teknologi Informasi, Fakultas Teknik, Universitas Udayana
Data Multi Dimensi
Data multidimensi (Multidimensional Data atau MDD) merupakan model data fisik (physical data model) yang strukturnya dapat dilihat dari berbagai sudut pandang (dimensi), dengan tiga buah bagian (record atau baris, field atau kolom, dan layer), dengan objek-objek data multidimensi di dalamnya, yang atributnya dibedakan menjadi atribut dimensi dan atribut pengukuran.
Jika direpresentasikan ke dalam bentuk koordinat, data multidimensi dapat ditunjukkan ke dalam tiga buah sumbu yaitu X, Y, dan Z. Lalu jika dianalogikan dengan gambar bangun, maka data multidimensi dapat diibaratkan sebagai bangun ruang yang memiliki tiga dimensi yaitu panjang, lebar, dan tinggi.
Data Mart
Data mart merupakan sub-bagian dari data warehouse keseluruhan sebagai sebuah struktur data, yang di dalamnya memuat data untuk memudahkan pengguna akhir (end user) dalam mengakses data dari data warehouse sesuai keperluan ataupun untuk analisis data. Data mart berada pada layer akses (access layer) serta berorientasikan kepada spesifik proses bisnis serta kebutuhan dari unit organisasi tempat data warehouse tersebut diimplementasikan. Jika dianalogikan sebagai sebuah himpunan, maka data mart merupakan himpunan bagian dari sebuah himpunan semesta bernama data warehouse. Sehingga apabila data warehouse memuat semua data sesuai kebutuhan dari keseluruhan organisasi yang bersangkutan, maka data mart hanya spesifik memuat data sesuai kebutuhan per unit atau departemen saja.
Model Pengembangan Data Warehouse
Terdapat 6 model pengembangan data warehouse berdasarkan hierarki dan masukan dari pengguna yaiutu sebagai berikut.
Top Down Tanpa User Feedback
Pada pemodelan jenis ini, aliran datanya sangat sederhana karena tidak melibatkan user feedback (umpan balik dari pengguna). Aliran data tersebut berawal dari sumber-sumber data (data sources) yang kemudian diteruskan ke data warehouse lalu diteruskan (dipecah) ke dalam beberapa buah data mart.
Model ini terfokus kepada kemampuan untuk menjadikan pengguna dapat memperoleh data sesuai kebutuhan melalui data mart (yang dialirkan dari data warehouse), tanpa melakukan pengubahan apapun pada data warehouse itu sendiri. Penambahan data pada data mart hanya dapat dilakukan melalui data warehouse, dengan mengikuti aliran Extraction, Transformation, dan Transportation (ETT).
Button Up Tanpa User Feedback
Pemodelan ini berkebalikan dari top down pada uraian sebelumnya. Sesuai namanya, pengembangan dimulai dari bawah, di mana dua buah data mart atau lebih dibentuk dari data yang berasal dari berbagai sumber data (data sources). Pengembangan pada model ini terdiri dari 2 tahap, yaitu:
Tahap 1 : Terjadi proses ETT (Extraction, Transformation, Transportation) pada sumber-sumber data ke masing-masing data mart. Di sini, setiap data mart mengintegrasikan data dari berbagai sumber tersebut.
Tahap 2 : Data dialirkan dari masing-masing data mart ke data warehouse, dengan kembali menggunakan proses ETT (Extraction, Transformation, Transportation). Di sini, data dari setiap data mart kembali diintegrasikan dalam data warehouse serta dilakukan pula penghilangan redundancy (pengulangan) pada data dari sejumlah data mart tersebut.
Paralel Tanpa User Feedback
Pemodelan ini merupakan modifikasi dari model top down, namun data mart tidak sepenuhnya bergantung kepada data warehouse dalam hal sumber data yang diperoleh. Tahap pertama pengembangan model ini yaitu dibangunnya data warehouse dari berbagai sumber data. Dalam data warehouse terdapat data model yang menjadi acuan bagi model data untuk data mart-data mart yang dibentuk. Data model ini juga ikut mempengaruhi data mart. Kemudian, data mart yang telah terbentuk ikut berperan dalam membangun data warehouse melalui integrasi di level data.
Top Down Beserta User Feedback
Pada pemodelan ini, sejumlah data dari berbagai sumber data membentuk data warehouse. Data warehouse menjadi pusat dari penggudangan berbagai data yang berasal dari berbagai sumber data tersebut. Di sini, terjadi proses integrasi di level data untuk memudahkan berbagai data tersebut disatukan ke dalam sebuah gudang data ini. Dari data warehouse, dibentuklah sejumlah data mart sesuai dengan kebutuhan pengguna.
User feedback pada data mart menjadi tolok ukur dalam pengembangan berkelanjutan pada data mart dan data warehouse itu sendiri. User feedback sangat mempengaruhi data mart dan secara otomatis akan mempengaruhi data warehouse itu sendiri. Terdapat aliran bolak-balik dari user feedback (pengguna) ke data mart dan dari data mart ke data warehouse.
Button Up Beserta User Feedback
Pada pemodelan ini, 2 data mart atau lebih dibentuk terlebih dahulu menggunakan data dari berbagai sumber data. Pada proses ini juga digunakan ETT (Extraction, Transformation, Transportation) untuk membantu pengumpulan data, ekstraksi data, transformasi ke format data yang disepakati bersama di dalam Data Mart, serta integrasi di level data itu sendiri. Lalu dibentuk data warehouse dari data mart yang telah terbentuk. Proses pembentukan ini kembali menggunakan ETT untuk mengintegrasikan data dari berbagai data mart tersebut ke dalam kesatuan data warehouse. Kemudian, user feedback diarahkan melalui tatap muka data warehouse, yang berefek terhadap data mart-data mart pembentuk data warehouse.
Paralel Beserta User Feedback
Langkah awal dari pemodelan ini adalah penentuan aturan untuk model data dari data warehouse ke data mart yang terbentuk. Kemudian, data dari berbagai sumber data masuk ke data mart dan juga data warehouse. Data dari sumber data yang menuju ke data mart saja yang akan melalui proses ETT (Extraction, Transformation, Transportation). Sedangkan data yang menuju ke data warehouse terlebih dahulu menuju ke data model dari data warehouse untuk diseragamkan formatnya. Pada data warehouse tidak terjadi proses ETT, sebab data warehouse menjadi pusat untuk model data enterprise, yang menjadi acuan bagi data mart lainnya. Data warehouse mengagregasikan data, memuat fungsi koordinasi dan integratif untuk pengembangan ke depannya, serta termasuk juga manajemen data dan informasi kepada pengguna. Kemudian, user feedback dialirkan melalui tatap muka ke data mart.
Contoh Data Multi Dimensi
Misalnya, dimensi yang digunakan untuk melihat data mahasiswa adalah dimensi kelulusan, dimensi sidang TA, dan dimensi wisuda. Masing-masing dari dimensi tersebut akan membentuk tabel kelulusan, tabel sidang TA, dan tabel wisuda, dengan perincian sebagai berikut:
1. Tabel Kelulusan yang memiliki field ID kelulusan (primary key), NIM, nama, angkatan, dan IPK.
2. Tabel Sidang TA yang memiliki field : ID sidang, NIM, nama, judul, pembimbing, penguji, kelulusan, dan nilai.
3. Tabel Wisuda yang memiliki field : ID wisuda, NIM, nama, dan periode wisuda.
Ketiga dimensi tersebut dapat digunakan untuk melihat data mahasiswa pada tabel mahasiswa.
Data Relasional vs Data Multi Dimensional
Data Relasional atau Relational Data Modelling (RDM) dipandang sebagai bentuk hubungan antar data (melalui tabel) yang berelasi dalam struktur hierarkis dan berada pada 2 dimensi (baris dan kolom). Ada 3 relasi yang dikenal pada data relasional yaitu one to one, one to many, dan many to many.
Dalam pengembangan perangkat lunak, untuk database digunakan desain pengembangan berupa Entity Relationship Management. RDM dipastikan akan merupakan data transaksional karena manipulasi data dilakukan tanpa menyimpan data historis (hanya bersifat 2 dimensi). Hal inilah yang membedakan data relasional dengan data multidimensi yang bersifat lebih dari 2 dimensi.
OLTP, OLAP dalam Data Multi Dimensi
Data multidimensi tidak dapat terlepas dari kebutuhan untuk mempermudah proses analisis data. Namun, data multidimensi tidak digunakan dalam OLTP (On Line Transactional Processing) karena pada proses tersebut tidak terdapat data historis dan hanya terdapat data transaksional yang berfungsi untuk kebutuhan data dan informasi semata. Jadi, data hanya dilihat terstruktur dalam 2 dimensi (baris dan kolom). Sebaliknya, data multidimensi sangat diperlukan dalam OLAP (On Line Analytical Processing) karena proses tersebut sangat mengutamakan historis data. Maka dari itu, data perlu dilihat dari 3 atau lebih dimensi untuk kemudahan analisis data. Di sini, slicing data atau pemotongan data berlapis-lapis diasumsikan untuk mengambil data yang relevan dalam kebutuhan analisis.
Daftar Pustaka
I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017)
Pemaparan materi pertemuan Pertama tentang “Arsitektur Data Warehouse” oleh I Putu Agus Eka Pratama, S.T., M.T.