ETL (Extract-Transform-Load) Nedir?

Yazdır PDF

etlVeri ambarı, analiz amaçlı sorgulamalar yapmak için özelleşmiş bir veritabanıdır. Temel amacı, işletmeye ait güncel olmayan kayıtları saklamak ve bu kayıtlar üzerinde daha kolay analizler yapılmasını sağlayarak iş ihtiyaçlarını anlamaya ve işletme fonksiyonlarını yenilemeye yardımcı olmak, yani iş zekasına kolaylık sağlamaktır.

 

 

Bildiğimiz ilişkisel veritabanları, olaylar ve işlemlerle (transaction) ilgili verileri saklar, bu yüzden devamlı bir veri giriş çıkışı içerisindedirler ve en güncel veriyi taşırlar. Veri ambarları ise, bu veritabanlarındaki verilerle diğer dış kaynaklardan alınan verilerin belirli periyodlarda derlenip arşivlenmesi ile oluşturulan, bu sayede dönemsel analizlerin yapılmasına olanak sağlayan yapılardır.
Veri ambarları sayesinde işletmelerde iş yükü ile analiz yükü ayrılır; yani bir tarafta farklı sunucularda saklanan veri ambarındaki derlenmiş veriler üzerinde analizler yapılırken, işletmeye ait ilişkisel veritabanları güncel veri saklama ve sorgulama ihtiyacını karşılamaya devam eder.
Veri ambarları, veri saklama işlevinin dışında veri toplama-taşıma-dönüştürme (ETL), veri madenciliği, raporlama, tahminleme çözümleri sunan uygulamalar tarafından da kullanılarak, ham verilerin kullanışlı bilgilere dönüştürülmesine olanak tanır.

E(Extract - Ayrıştırma) : Veriyi kaynak sistemden alma anlamına gelir.Bilindiği gibi veri ambarı yapılarında birçok farklı kaynak sistem ve flat files(excell,csv,txt...vb) kullanılır.Veriyi birçok farklı sistemden yardımcı araçlar veya kod ile alabiliriz.

 

T(Transform - Dönüştürme) : Verilerin birçok farklı sistemden geldiğini söyledik.Bu farklı sistemden gelen verilerin bizim yapımıza uygun olması için belli bir dönüşümlerden geçmesi gerekmektedir.Verinin temizlenmesi,kalitesinin arttırılması lazımdır.

Veri farklı kaynaktan gelmese bile verinin herbir veri ambarı yapısında farklı karakteristik özelliklerde davranması gerekebilir.İşte bu yüzden staging alanındaki bir veri ile veri ambarındaki aynı verinin formatı farklı olabilir.İşte bu noktada transform bu işlemlerin genel adını kapsayabilir.

 

L(Load - Yükleme) : Verilerin kaynak sistemden gelip hedef sisteme yüklenmesi anlamına gelir.

ETL süreci

ETL(Extract-Transform-Load; "çıkart-dönüştür-yükle") temel olarak kullanılacak verinin dış kaynaklardan çıkarılması, verinin iş önceliklerine göre temizlenmesi, birleştirilmesi, kısıtlarının ve kalitesinin dönüştürülmesi ve son hedefe(veritabanı veya veri ambarı) yüklenmesi sürecine denir. Yüksek boyutlu veriler operasyonel sistemlerden alınıp veri ambarı veya data mart'lara yüklenirken ETL sürecine sokulurlar. Amaç iş zekasında kullanılacak verinin en etkin kullanılabilecek hale sokulmasıdır.

 

etl

 


Twitter

Sosyal Ağlar

Paylaşın:

mod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_counter
mod_vvisit_counterBugün77
mod_vvisit_counterDün196
mod_vvisit_counterBu Hafta772
mod_vvisit_counterGeçen Hafta939
mod_vvisit_counterBu Ay2676
mod_vvisit_counterGeçen Ay4586
mod_vvisit_counterToplam339811
PATHWAY_MSG   Anasayfa
| + - | RTL - LTR