日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

SQL Server 2012 數據質量服務實戰(zhàn)簡介(Data Quality Services)

 imelee 2016-06-11

SQL Server 2012 數據質量服務實戰(zhàn)簡介(Data Quality Services)

http://blog.csdn.net/niyi0318/article/details/8099493

數據質量服務是包含在SQL Server 2012中的一個組件。我們需要安裝數據質量服務端和客戶端,這些在sqlserver 2012的安裝文件中都可以找到。安裝服務端以后,在我們sqlserver數據庫中會出現3個新的以DQS開頭的數據庫

這三個數據庫分別用來存儲數據質量服務的知識庫,總體和臨時數據。

安裝完成以后,我們可以用客戶端來打開數據質量服務的管理界面

總體分三個大類,

知識庫的管理(Knowledge Base Management)

數據質量項目(Data Quality Projects)

管理(Administration)

上圖為創(chuàng)建知識庫的界面,所有的數據質量項目都是基于知識庫的,知識庫里面包含具體的“域”(Domain),針對域來設定數據清理的規(guī)則。知識庫我們可以看成是個表結構,域相當于字段。對域的規(guī)則可以是單獨字段的也可以是組合字段的。

上圖為域的管理,我們可以添加域,設置域的格式,數據類型,規(guī)則,引用等等。

當知識庫建立以后,我們需要對知識庫進行訓練(Knowledge Base Discovery),一般情況下,我們可以取小部分真實數據來對知識庫來進行訓練,訓練的次數越多,涵蓋的情況越多,知識庫也就越豐富越具體。

上圖為知識庫訓練的界面,數據源可以是excel或者SQL Server數據庫,下方設置相應的字段映射之后,就可以開始進行訓練了。訓練完之后,我們可以根據訓練的結果可以進行設置,添加域的規(guī)則,修改域的引用等操作。

當一個知識庫完成以后,我們就可以正式的使用數據質量項目來進行數據的清理。

而且在SSIS 2012中也添加了相對應的數據質量服務的組件,這樣我們就可以很方便在SSIS 包中使用數據質量服務來完成數據的清洗。

當前世面上有很多行業(yè)的標準的第三方的知識庫,我們也可以直接導入這些已經很成熟的知識庫來對我們的數據直接進行清洗,大大的方便了我們操作一致性和準確性。

 

注意:當前版本下,DQS服務端不支持卸載,需要卸載的時候,需要手動刪除那三個數據庫,兩個相對應的instance的login,master database中的一個存儲過程。

 

    本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發(fā)現有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多