فرآیند ETL چیست؟
ETL مخفف عبارت Extract Transform Load است که به معنای استخراج، پلایش و بارگذاری می باشد. یکی از مهمترین مراحل هوش تجاری، فرآیند ETL است.
از ETL در هنگام ساخت انباره داده ها استفاده می شود. درواقع با فرآیند ETL داده ها را از منابع داده ای مختلف جمع آوری می کنیم و سپس روی داده ها پردازش و تجزیه تحلیل انجام می دهیم و سپس آنها را بارگذاری می کنیم.
مراحل ETL به شرح زیر می باشد:
1:Extract
در این مرحله با استفاده از کامپوننت های Source، به منابع داده ای مختلف مانند اکسل،SQL SERVER، فلت فایل ها و … وصل می شویم تا داده های موجود در منابع داده ای مورد نظر را استخراج کنیم. در این مرحله پس از وصل شدن به منبع داده ای می توان کل داده، قسمتی از داده، یا با استفاده از کوئری های مورد نظر، دیتای خلاصه و مد نظر را بخوانیم.
2:Transform
در این مرحله با استفاده از انواع کامپوننت های Transfotm مانند Merge، Look up، CDC، SCD و … ، تجزیه تحلیل ها، تغییرات، اتصالات و پردازش ها روی داده خوانده شده از مرحله قبل انجام می دهیم تا دادها به اطلاعات مفید تبدیل و آماده بارگذاری در انباره داده می شود.
3:Load
در مرحله آخر، داده های پردازش شده را به انباره داده طراحی شده یا هر منابع داده ای دلخواه انتقال و در آن بارگذاری می کنیم.