Pada Data Warehouse kita mengenal suatu istilah dengan nama ETL. ETL merupakan singkatan dari (Extraction, Transformation, Loading).
Selain ETL, ada juga istilah ELT yakni singkatan dari (Extracition, Loading, Transformation).
Kedua istilah tersebut sekilas sama namun memiliki cara kerja yang seditki berbeda.
Berikut penjelasan masing-masing dari keduanya.
ETL (Extraction, Transformation, Loading)
Merupakan proses yang harus dilalui dalam pembentukan data warehouse.Pada proses ini yaitu semua data akan di extract terlebih dahulu kemudian data akan disaring dan data yang akan diambil yaitu data yang penting.
Pada proses transformation data akan diubah sesuai format yang disetujui dan data diload ke data warehouse, kemudian data akan diolah selanjutnya akan du teruskan ke user.
Untuk lebih jelasnya berikut merupakan penjelasan dari tiap proses.
Extraction (Ekstraksi Data)
Ekstraksi data adalah proses dimana data diambil atau diekstrak dari berbagai sistem operasional, baik menggunakan query, atau aplikasi ETL.Transformation (Transformasi Data)
Transformasi adalah proses dimana data mentah (raw data) hasil ekstraksi disaring dan diubah sesuai dengan kaidah bisnis yang berlaku.Loading (Pengisian Data)
Proses terakhir yang perlu dilakukan adalah proses pemuatan data yang didapatkan dari hasil transformasi ke dalam data warehouse.ELT (Extracition, Loading, Transformation)
ELT (Extracition, Loading, Transformation) adalah variasi dari ETL (Extraction, Transformation, Loading), proses integrasi data di mana transformasi berlangsung pada server menengah sebelum dimuat ke sasaran.Sebaliknya, ELT memungkinkan data mentah yang akan dimuat langsung ke sasaran dan berubah di sana.
Kemampuan ini sangat berguna untuk memproses set data yang besar diperlukan untuk intelijen bisnis (BI) dan analisis data yang besar.
Sebenarnya, ELT hampir sama dengan ETL, hanya saja pada ELT setelah mengekstrak data dari sumber data, ELT meloading data ke dalam data warehouse kemudian barulah data tersebut di diolah sesuai kebutuhan.
Bagan
Berdasarkan dengan gambar diatas terdapat 4 bagian yaitu:
- Sumber Data (Data Sources).
- Penyimpanan data (Data Storage).
- OLAP Engine
- Ouput yang merupakan hasil keluaran dari semua proses yang ada.
Keempat bagian tersebut akan dimanfaatkan oleh pengguna (perorangan maupun organisai) sesuai dengan kebutuhan-kebutuhan yang ada misalnya sebagai DSS (Deasion Support System), Bussines Intellgence, Smart Economic, Big Data serta kebutuhan lainnya didalam mendukung proses bisnis.
Pada bagian pertama terlihat beberapa sumber data seperti document, database, file, aplikasi dan sebagainya merupakan hasil dari proses OLTP yaitu data yang tersimpan setelah melakukan transaksi data seperti insert, update, dan delete.
Kemudian sumber-sumber data tersebut akan diintegrasikan dan akan diteruskan menggunakan proses ETL ataupun ELT yang terdapat pada bagian kedua
Proses akan disesuaikan dengan kebutuhan untuk disimpan pada data warehouse dan setiap data pada data warehouse dilengkapi oleh metadata.
Kegunaan dari metadata ini adalah untuk menyimpan data dari sebuah data yang dikumpulkan menjadi sebuah informasi mengenai data tersebut seperti panjang field, tipe field, tanggal, dan lain sebagainya.
Kemudian pengguna akan memberikan perintah untuk menampilkan informasi, OLAP Engine yang terdapat pada bagian keempat akan melakukan analisis terhadap data yang telah tersimpan pada data warehouse.
Kemudian, hasil olahan tersebutlah yang akan ditampilkan kepada pengguna sesuai dengan yang diinginkan oleh pengguna tersebut baik dalam format informasi, pelaporan, query, hasil data mining dan lain sebagainya.