這個練習將會使用 Data Profiling Task 去分析資料庫中客戶電子郵件資料的樣版(Pattern)。並將分析結果輸出到 XML 檔案中。 然後再使用 Script Task 來開啟這個檔案,以讀取 XML 文件中樣版的資料。
根據得到的樣版,再使用正規表達式去驗證另一個資料庫中的電子郵件資料,找出不符合這個樣版的郵件。
這個練習將會使用 Data Profiling Task 去分析資料庫中客戶電子郵件資料的樣版(Pattern)。並將分析結果輸出到 XML 檔案中。 然後再使用 Script Task 來開啟這個檔案,以讀取 XML 文件中樣版的資料。
根據得到的樣版,再使用正規表達式去驗證另一個資料庫中的電子郵件資料,找出不符合這個樣版的郵件。
在這個 Lab 中,將練習以下二個主題:
在 Lab12 中我們已經建立好知識庫,現在我們要建立一個「DQS 專案」,並使用該知識庫來進行資料清理的工作。
除了 DQS 專案可以用來分析資料品質,另外,如果在 SSIS 封裝中,你也可以利用「 Data Profiling Task 」來分析資料的分佈狀況,以判別是否有淺在的資料品質問題。