Proses ETL (Extract-Transform-Load) dalam Data Warehouse - Seri Data Warehouse (4)

Apa yang dimaksud dengan integrasi data (data integration)?

Integrasi data (atau data integration) adalah istilah umum dan luas (umbrella term) yang mencakup tiga proses yang menggabungkan data dari berbagai sumber data ke dalam data warehouse, tiga proses teresebut meliputi: 1) mengakses data, 2) menggabungkan berbagai macam view data yang berbeda-beda dan 3) menangkap perubahan data.

Apa yang dimaksud dengan tiga tahap dalam proses ETL (Extract-Transform-Load)?
  1. Extraction:  adalah proses memilih data dari satu atau beberapa sumber dan membaca/mengakses  data yang dipilih tersebut.
  2. Transformation: adalah proses mengonversi data dari bentuk awal/asli dalam bentuk apapun itu menjadi bentuk yang sesuai dengan kebutuhan data warehouse. Tahap ini seringkali juga mencakup hal-hal seperti pembersihan data untuk menghilangkan berbagai error yang mungkin terjadi.
  3. Loading:  adalah proses menaruh/memasukkan data yang sudah dikonversi/transformasi ke dalam data warehouse.

Mengapa proses ETL (Extract-Transform-Load) sangat penting dalam proses data warehouse?

Karena ETL (Extract-Transform-Load) adalah rangkaian proses dimana data di-load ke dalam data warehouse, sehingga data warehouse tidak mungkin ada tanpa adanya proses ETL. Proses ETL juga sangat berperan terhadap kualitas data dalam data warehouse.

No comments:

Post a Comment