2014年2月25日 星期二

Lab16:在SSIS封裝中使用自訂程式碼

這個練習將會使用 Data Profiling Task 去分析資料庫中客戶電子郵件資料的樣版(Pattern)。並將分析結果輸出到 XML 檔案中。 然後再使用 Script Task 來開啟這個檔案,以讀取 XML 文件中樣版的資料。

根據得到的樣版,再使用正規表達式去驗證另一個資料庫中的電子郵件資料,找出不符合這個樣版的郵件。

2014年2月24日 星期一

Lab15:資料模楜比對

在這個 Lab 中,將練習以下二個主題:

  • 如何使用模糊查閱(Fuzzy Lookup),對整批的資料執行識別對應。
  • 如何使用 MDS Add-in for Excel 來清除重複資料。

2014年2月18日 星期二

Lab14:資料比對

這個 Lab 將練習如何使用 DQS Cleansing Transformation ,以及如何使用 DQS 比對原則知識庫進行重複資料的清除。

2014年2月13日 星期四

Lab13:資料清理

在 Lab12 中我們已經建立好知識庫,現在我們要建立一個「DQS 專案」,並使用該知識庫來進行資料清理的工作。

除了 DQS 專案可以用來分析資料品質,另外,如果在 SSIS 封裝中,你也可以利用「 Data Profiling Task 」來分析資料的分佈狀況,以判別是否有淺在的資料品質問題。

2014年2月12日 星期三

Lab12:建立知識庫

這個練習示範如何透過知識探索(knowledge discovery)來建立知識庫(KB),並且在知識庫中進行定義域的維護工作。