建立DQS專案與監看DQS活動
資料品質專案是一種用來改善來源資料品質的專案, 它會利用知識庫(KB)中的資訊,執行資料比對和資料清理作業,然後將執行結果匯出到 SQL Server 資料庫或 .csv 檔案。 底下Lab將練習如何建立一個資料品質專案,並且在 Data Quality Client 中監控DQS活動。
DQS 預設的知識庫(KB)
要建立DQS專案,必定會使用到知識庫,在還沒建立知識庫之前,我們先使用 DQS Data 知識庫來練習,這是一個在安裝完 Data Quality Services 就預設的知識庫。
預設知識庫。
這個知識庫,總共定義了8個定義域(Domain),每個定義域都對特定欄位設定了各自的分析語法。
建立 DQS 專案
對預設的知識庫有個基本概念後,我們就使用它來建立一個簡單DQS專案。
1. 執行 Data Quality Client
開啟 Data Quality Client 並連至含有 DQS 資料庫的 SQL Server 執行個體.
2. 建立DQS專案
選用 DQS Data 知識庫和 US-LastName 定義域,並選擇[清理]活動。
3. 設定DQS專案內容
在[對應]頁中,設定要清理的資料庫、資料表、資料行。
4. 執行清理
在[清理]頁面中,執行[啟動]功能。
執行結束後,結果會顯示於下方[分析工具]中。
5. 檢視結果
在[管理和檢視結果]頁面,你可以檢查 [Suggested]、[New]、[Invalid]、[Corrected]、[Correct] 等頁面。
6. 匯出結果
如果不要匯出,可直接按[完成];若要匯出,則必須設定匯出選項。
下圖是以 SQL Server 方式的匯出結果
監看DQS活動
執行活動監控。
點選專案名稱,下方視窗會顯示[活動步驟]的詳細內容。
在[分析工具]頁面中,可以檢視分析統計資訊。
沒有留言:
張貼留言