在 SSIS 中提供許多工具或元件可以用來執行各種作業需求, 如果這些現成的元件還不能滿足需求話,你也可以利用以下元件,透過自訂程式碼的方式來設計封裝。
- Script Task :允許在 Control Flow 中執行 .Net 腳本。
- Script Component :允許在 Data Flow 中執行 .Net 腳本。
- Custom Components :自訂元件,方便重複使用與部署。
Script Task
不管是使用 Script Task 或 Script Component 都會使用到二個設計模式。 一個是在編輯介面中,直接指定元件的屬性;另一個模式則是用來撰寫指令碼的環境。 在 SQL Server 2012 中的指令碼編輯環境稱為:Microsoft Visual Studio Tools for Applications(VSTA)。 而 早期的 SQL Server 2005 的指令碼編輯環境則稱為:Microsoft Visual Studio for Applications (VSA) 。
Dts Object
在 Script Task 中,你除了可以使用完整的 .NET 類別庫和命名空間來撰寫程式碼之外,你也可以透過 Dts 物件來存取 package 本身變數。
Configuring the Script Task
在 Control Flow 中加入 Script Task 後,通常必須先設定好以下屬性,才開始撰寫程式碼:
- ScriptLanguage:腳本要使用的程式語言版本。
- EntryPoint:指定一個Method名稱,做為腳本的啟始Method。
- ReadOnlyVariable:指定要在腳本中使用到的 SSIS 唯讀變數。
- ReadWriteVariable:指定要在腳本中使用到的 SSIS 讀寫變數。
Coding the Script Task
VSTA 編輯環境
當你執行「編輯指令碼」,就會開啟 VSTA 編輯環境。你可以在這個環境執行以下作業:
- 使用自訂的類別與方法
- 使用 .NET 類別庫和命名空間來撰寫程式碼
- 加入 .NET assemblies 、 COM components 、 Web Service 、或其他專案等參考
- 使用 Dts 物件來存取 package 本身變數或連線資訊。
- 使用 breakpoint 來 debug 腳本程式。
你可以由 Dts 的 Variables 和 Connections 屬性取得 package 中的變數和連線資訊。 以下是他們的用法,注意型別轉換及大小寫。
public void Main() { // TODO: Add your code here // 存取變數 string var2 = Dts.Variables["User::var2"].Value.ToString(); // 存取 ADO.Net 連線 SqlConnection conn1 = (SqlConnection)Dts.Connections["adonet"].AcquireConnection(null); // 存取 OleDB 連線 ( ref Microsoft.SqlServer.DTSRuntimeWrap in Microsoft.SqlServer.DTSRuntimeWrap.dll ) ConnectionManager cm = Dts.Connections["oledb"]; IDTSConnectionManagerDatabaseParameters100 cmParams = cm.InnerObject as IDTSConnectionManagerDatabaseParameters100; OleDbConnection conn2 = cmParams.GetConnectionForSchema() as OleDbConnection; Dts.TaskResult = (int)ScriptResults.Success; }
Dts.TaskResult 屬性是用來回傳 True/False ,表示指令碼工作是成功或失敗。
Dts.TaskResult = (int)ScriptResults.Success;
Dts.TaskResult 屬性是用來回傳使用自訂物件,以提供更多的回傳資訊。
int rowAffected; ... rowAffected = 1000; Dts.ExecutionValue = rowAffected;
Script Component
Script Component 與 Script Task 一樣,都提供你完整的自訂程式碼的能力,只不過它是用在 Data Flow 中的元件。
Configuring the Script Component
Script Component 的用法類似 Script Task ,不過,它是 Data Flow 中使用的元件,所以會有輸入與輸出的設定。 就像你在設計 Data Flow 時,你由 Toolbox 中拉出的元件,不外乎:Data Source 、 Data Destination 、 Transformation 。 因此在設計一個指令碼元件,一開始的時候就必須先設定這個元件的用途。共有以下三種選擇:
元件類型 | 說明 | 輸入 | 輸出 |
來源 | 指令碼元件可支援多個輸出。 | X | 多個 |
目的地 | 指令碼元件可支援一個輸入。 | 一個 | X |
轉換 | 指令碼元件可支援一個輸入和多個輸出。 | 一個 | 多個 |
同步與非同步輸出(Sync or Async )
當你的 Script Component 包含多個輸出時,你可以將他們設定成同步或非同步輸出。 此處的同步與非同步指的是輸出是否與輸入同步,詳細說明如下:
- 當要處理的資料列彼此沒有相關連,你就可以採用同步輸出。
- 同步輸出模式,每次讀取一列,處理完後,就立即輸出一筆。
- 要使用同步輸出,你必須將 同步輸入 ID(SynchronousInputID) 這個屬性值指定為同一個元件中的那個輸入的 ID (因為輸入也只有一個,你也無法隨便輸入,你可以在下拉選單中找到)。
- 在同步輸出模式下,所有的輸入資料列都會導向至所有可用的輸出。
- 不過,你可以在同步輸出模式下設定 互斥群組(ExclusionGroup) 屬性,就可以在程式碼中,指定特定的資料列進入到特定的輸出。 ExclusionGroup 值沒有特別要求用什麼值,只要是相同的非零值即可,表示這些輸出彼此是同一個互斥群組。
public override void 輸入0_ProcessInputRow(輸入0Buffer Row) { /*Add your code here*/ if (Row.married == true) { Row.DirectRowTo輸出0(); } else if (Row.carOwned == true) { Row.DirectRowTo輸出1(); } else if (Row.houseOwned == true) { Row.DirectRowTo輸出2(); } }
- 當要處理的資料列彼此有相關連,你就必須採用非同步輸出。 例如下列情形:
- 輸出A與輸出B有先後關係的必要需求.
- 某個輸出要等所有資料都讀取完,做完排序或合併相關資訊才能輸出。
- 因為要執行彙總,所以要等所有輸出都讀取完畢。
- 使用非同步輸出,你必須將 SynchronousInputID 屬性值設定成「無(None)」
- 在非同步輸出模式下,你還可以設定輸出是否使用排序。
- If the value of the SynchronousInputID property is None, then the output is asynchronous.
- If you use asynchronous outputs, then you can also define whether the output is sorted.
- If the value of the SynchronousInputID property is the component's input ID, then the output is synchronous.
- If you use synchronous outputs, then you can also configure the ExclusionGroup property to identify redirections of rows to different outputs.
For example, you could redirect part of the rows to the regular output and part to the error output.
Coding the Script Component
當你開啟 VSTA 編輯器時,它會根據以上的設定自動產生基礎的程式碼架構,包含以下三個檔案:
這個檔案包含一個 ScriptMain 類別,繼承自以下的 UserComponent 類別。 它是主程式部份,讓你撰寫程式用的。
這個檔案包含一個 UserComponent 類別,繼承自 ScriptComponent 類別。 該類別包含了用來處理資料時會使用到的 Method 和 Property 。 這個檔案也包含了變數和連線的類別,提供你存取封裝本身的資訊。
這個檔案包含所有的輸入和輸出。 這些類別都繼承自 ScriptBuffer 類別,類別的屬性就是輸入和輸出的欄位。
執行階段的方法(run-time method)
Custom Component 和 Script Component 是一樣的,都包含相同的執行階段方法(run-time method)。 下列清單是幾項比較重要的方法:
- AcquireConnections:
Use the AcquireConnections method to retrieve the connection - PreExecute:
If you need to perform an action once before processing the rows, override the PreExecute method of the ScriptComponent base class. - PostExecute:
If you need to perform an action once after processing the rows, override the PostExecute method of the ScriptComponent base class. - <InputX>_ProcessInputRow:
write the processing code here to process each row of an input.
Custom Components
要部署自訂元件,必須先將組件複制到 SSIS Task 或者 Component 目錄,然後再使用 gacutil 工具程式,將其登錄到 GAC 。
Task 的預設目錄為:
- 32-bit edition : %ProgramFiles(x86)%\Microsoft SQL Server\110\DTS\Tasks
- 64-bit edition : %ProgramFiles%\Microsoft SQL Server\110\DTS\Tasks
Component 的預設目錄為:
- 32-bit edition : %ProgramFiles(x86)%\Microsoft SQL Server\110\DTS\PipelineComponents
- 64-bit edition : %ProgramFiles%\Microsoft SQL Server\110\DTS\PipelineComponents