文章出處
文章列表
1、ETL的定義
ETL分別是“Extract”、“ Transform” 、“Load”三個單詞的首字母縮寫也就是“抽取”、“轉換”、“裝載”,但我們日常往往簡稱其為數據抽取。
ETL是BI/DW(商務智能/數據倉庫)的核心和靈魂,按照統一的規則集成并提高數據的價值,是負責完成數據從數據源向目標數據倉庫轉化的過程,是實施數據倉庫的重要步驟。
ETL包含了三方面:
“抽取”:將數據從各種原始的業務系統中讀取出來,這是所有工作的前提。
“轉換”:按照預先設計好的規則將抽取得數據進行轉換,使本來異構的數據格式能統一起來。
“裝載”:將轉換完的數據按計劃增量或全部導入到數據倉庫中。
2、為什么需要ETL?
因為目前運行的應用系統是用戶花費了很大精力和財力構建的、不可替代的系統,尤其系統中的數據是非常之寶貴。但由于不同原始數據庫中的數據的來源、格式不一樣,導致了系統實施、數據整合出現問題。ETL就是用來解決這一問題的。
本記錄摘自 快樂綠茶 的博客:【原文地址】
文章列表
全站熱搜