Nama : I Nyoman Jyotisa
NIM : 1905551092
Matakuliah : Data Warehouse
Nama Dosen : I Putu Agus Eka Pratama, S.T., M.T.
Program Studi Teknologi Informasi, Fakultas Teknik, Universitas Udayana
Definisi Data Warehouse
Definisi data warehouse menurut Bill Inmon yaitu Data warehouse sebagai konsep database unutk menggudangkan data dari beragai sumber data dengan dormat yang berbeda, dimana memiliki 6 sifat utama, subject oriented, integrated, process oriented, time variant, accessible, non volatile.
Menurut Ralph Kimball, Data warehouse itu mengumpulkan data dari sumber data transaksional sesuai dengan keutuhna pengguna dan disana ada proses query dan analisa data, kemudian akan masuk kedalam OLAP (On Line Analytical Processing)
Dari kedua definisi tersebut, Data warehouse bisa dikatakan hampir sama dengan database pada umumnya, bedanya yaitu pada database biasa, sumber datanya bisa dikatakan hanya dari satu sumber, sedangkan pada dw, sumber datanya berasal dari berbagai sumber yang berbeda. Pada sebuah database biasa, setiap entri data pada tabel di dalam DB akan dilakukan penumpukan data (timpa) apabila terjadi edit/update. Pada Data Warehouse, entry data ke n apabila dilakukan pengeditan/perubahan, akan disimpan sebagai entry ke n+1 dengan disertai catatan waktu, proses, dan subyeknya.
Arsitektur Data Warehouse
Arsitektur data warehouse diperkenalkan oleh oracle, pada arsitektur data warehouse dibagi menjadi 3 bagian, yaitu
1. Data source
Jadi data transaksional yang digudangkan bisa berasal dari sebuah sistem, file, berkas digital, dokumen, flat file, dll. Data source ini akan menjadi sumber-sumber dari data transaksional yang kemudian akan menjadi data-data yang bersifat historis analisis untuk kebutuhan analisa data pada data warehouse. Data-data dari berbagai sumber dengan format file yang berbeda akan disimpan di summary data.
2. Warehouse
Data yang berupa metadata, summary data dan raw data diambil bagian-bagian pentingnya, lalu dilanjutkan proses dari OLPT ke OLAP (transaksional ke historis analisis) untuk diubah menjadi data analitycal. Disinilah akan terjadi perubahan dengan menggunakan proses ETL/ELT.
3. User
Sisi Pengguna dibagi menjadi 3 yaitu sisi analyst, mining, reporting. Dalam analyst yaitu menganalisis data yang berasal dari metadata, summary data, raw data, dll, kemudian dihubungkan apakah berelasi dengan data yang dibutuhkan pengguna yang diubah menjadi data analitycal. Mining yaitu melakukan proses mengoleksi dari data sesuai dengan pola yang ada, pola disini bisa berupa algoritma dan atau perilaku dari data yang diperoleh. Reporting ini setelah dilakukan analysis dan mining pada data, lalu melakukan pembuatan pelaporan.
Berikut ini merupakan ilustrasi dari arsitektur data warehouse
Arsitektur Staging Area
Staging area, yaitu sebuah area virtual pada dw, yang berugas untuk menampung temporary dari data transaksional yang berasal dari berbagai sumber yang sebelumnya diolah, dirapikan, dibersihkan sesuai kebutuhan dan diteruskan ke data warehouse, jadi ketika data transaksional yang berasal dari berbagai sumber ini akan masuk bagian warehouse itu ada staging area. Implementasi staging area pada data warehouse yaitu dapat semaca pragmatically (pemrograman) maupun dengan penambahan modul pada sistem data warehouse. Berikut ini merupakan ilustrasi dari staging area
Arsitektur Staging Area + Data Mart
Konsep dasar dari arsitektur ini jadi arsitektur ini akan menambahkan sebuah data mart yang dikombinasikan dengan staging area, data mart yaitu sub kecil dari data warehouse yang bersifat khusus. Jadi arsitektur ini merupakan perbaikan dari konsep staging area. Konsep ini merupakan yang paling banyak digunakan karena pengguna dapat menyesuaikan, kalau kebutuhannya kecil, maka tidak perlu memakai data warehouse keseluruhan, cukup hanya memerlukan data martnya saja. Sebaliknya, jika institusi sudah semakin berkembang, kebutuhan dari sebuah data mart dapat tehubung satu sama lain menjadi sebuah data warehouse. Data mart ini dapat digunakan untuk tujuan khusus seperti marketing analisys oleh bagian marketing, dll). Berikut ini merupaka ilustrasi arsitektur staging area + data mart.
Sumber Data Pada Data Warehouse
Sumber data pada data warehouse dibedakan menjadi 2 yaitu :
1. Sumber data internal
Artinya data berasal dari 2 buah sumber data, namun data transaksional ini berasal dari internal organisasi bersangkutan. Data sistem transaksional (sistem informasi, point of sale), file scan, dokumen office, file teks, flat file, dll, di jaringan internal (intranet) perusahaan.
2. Sumber data eksternal
Berasal dari komputer/server yang terhubung melalui jaringan publik/internet dari organisasi yang bersangkutan, kemudian diambil datanya oleh organisasi untuk kemudian digudangkan ke dalam sistem Data Warehouse di jaringan lokal (intranet) perusahaan. Berikut ini merupakan ilustrasi sumber data pada data warehouse
Daftar Pustaka
I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017)
Pemaparan materi pertemuan Pertama tentang “Arsitektur Data Warehouse” oleh I Putu Agus Eka Pratama, S.T., M.T.