Kettle產(chǎn)品家族介紹
KETTLE是一個ETL工具集,它允許你管理來自不同數(shù)據(jù)庫的數(shù)據(jù)。Kettle通過提供一個圖形化的用戶環(huán)境來描述你想做什么,而不是你想怎么做。 工作被描述成元數(shù)據(jù)形式。 在軟件設(shè)計進(jìn)化的過程里,存在著4代生成方式。 第一代 — 手工編程: 大量的工作,難以維護(hù),難以發(fā)布 第二代: 生成一次, 然后修改來滿足需求: 容易生成, 仍然難以維護(hù)和發(fā)布. 第三代: 從模型生成程序: 易于生成,易于維護(hù),但仍然難以維護(hù). 第四代: 從模型直接執(zhí)行任務(wù): 易于生成,易于發(fā)布,易于維護(hù)。 這正是Kettle所使用。
Kettle家族目前包括4個產(chǎn)品:Spoon、Pan、CHEF、Kitchen。
SPOON 允許你通過圖形界面來設(shè)計ETTL轉(zhuǎn)換過程(Transformation)。例如,從一個SAP系統(tǒng)抽取信息,并把這些信息存儲到一個文本文件里的轉(zhuǎn)換任務(wù)如下: For more information on Spoon, please check out the Spoon documentation (PDF link).
PAN 允許你批量運(yùn)行由Spoon設(shè)計的ETL轉(zhuǎn)換 (例如使用一個時間調(diào)度器)。Pan是一個后臺執(zhí)行的程序,沒有圖形界面。 想要詳細(xì)了解 Pan,請查看 Pan documentation (PDF link). CHEF 允許你創(chuàng)建任務(wù)(Job)。 任務(wù)通過允許每個轉(zhuǎn)換,任務(wù),腳本等等,更有利于自動化更新數(shù)據(jù)倉庫的復(fù)雜工作。任務(wù)通過允許每個轉(zhuǎn)換,任務(wù),腳本等等。任務(wù)將會被檢查,看看是否正確地運(yùn)行了。(下面是一個Chef的任務(wù)圖) KITCHEN allows you to run the jobs designed with Chef in batch. (for example using a scheduler)
Job與Transformation的差別是:Transformation專注于數(shù)據(jù)的ETL,而Job的范圍比較廣,可以是Transformation,也可以是Mail、SQL、Shell、FTP等等,甚至可以是另外一個Job。
KITCHEN 允許你批量使用由Chef設(shè)計的任務(wù) (例如使用一個時間調(diào)度器)。KITCHEN也是一個后臺運(yùn)行的程序。 |
|