WebSphere Transformation Extender V を使った CSVファイル to CSVファイル変換の考え方とその方法

(1)

WebSphere Transformation Extender

CSVファイル変換

ハンズオン演習

日本アイ・ビー・エム株式会社

WebSphereサービス

(2)

シナリオ

この演習で行う作業は図のようになります。 002,田中洋介,ＹＳＬ・ＩＳＴ・金融ＮＷＳＯＬ開発,大和 003,小野真樹,ＹＳＬ・ＷｅｂＳｐｈｅｒｅサービス,箱崎 00002,田中洋介,大和ＹＳＬ・ＩＳＴ・金融ＮＷＳＯＬ開発 00003,小野真樹,箱崎ＹＳＬ・ＷｅｂＳｐｈｅｒｅサービス入力データ ①文字埋め ②文字の結合 ③文字の入替 ④スペースの挿入

(3)

WTXによるCSV変換

WTXでCSV変換を行うには、まず始め に、入力データの構造と出力データの構造を定義します – 定義にはType Designerを使います次に、入力データの各項目と出力データの各項目をマップします – マッピングにはMap Designerを使います最後に、ツール上でテストして結果を確認します – テストにはMap Designerを使います

データ構造の設計

データ構造の作成

マッピング

テスト

(4)

データ構造の設計

Type Designerでデータ構造を定義す る前に、WTXでのデータ構造の考え方 を習得します まず、Type Designerではデータを3つ の型に分類します – アイテム – グループ – カテゴリー

データ構造の設計

データ構造の作成

マッピング

テスト

(5)

アイテムとグループ

アイテムは意味のある最小のオブジェクト（CSVではフィールド）です まずは、すべてのデータをアイテムに分解します次にグループを定義しますグループにはアイテムまたはグループが含まれます 上の例ではEmpRecordがグループになります CSVの場合、グループ内は同じ区切り文字を使うようにします 002,田中洋介,ＹＳＬ・ＩＳＴ・金融ＮＷＳＯＬ開発,大和<CR><LF> 003,小野真樹,ＹＳＬ・ＷｅｂＳｐｈｅｒｅサービス,箱崎<CR><LF> ID LastName FirstName Department Location

EmpRecord EmpName

(6)

アイテムとグループ

EmpRecordグループは1行分のデータにあたるので、これを複数行分まとめたものが

ファイル全体となり、EmpFileグループと定義します

結果としてアイテムとグループは図のような階層構造をとることになります

WindowsではUTF-8ファイルには先頭にByte Order Mark（BOM）という識別子があ るため、EmpFileの先頭文字にBOMの3バイト（<<EF>><<BB>><<BF>>）を追加しま す。

EmpFile

EmpRecord(s)

ID

EmpName

LastName

FirstName

Department

(7)

区切り文字

区切り文字はグループを定義するために使われています

例では区切り文字として以下のようなものを使っています

–

カンマ（，）

–

スペース（<SP>）

区切り文字の位置によって以下の分類を行います

–

接頭部（^A^B^C）

–

中置き（A^B^C）

–

後置（A^B^C^）

(8)

グループと区切り文字

002,田中洋介,ＹＳＬ・ＩＳＴ・金融ＮＷＳＯＬ開発,大和<CR><LF>

003,小野真樹,ＹＳＬ・ＷｅｂＳｐｈｅｒｅサービス,箱崎<CR><LF> ID LastName FirstName Department Location

EmpRecord EmpName グループ名区切り文字位置 EmpName <SP> 中置き中置き EmpRecord ,

(9)

カテゴリー

アイテムやグループはカテゴリーの下に所属させることができます

カテゴリーの下に新規に作成されるアイテムやグループはカテゴリーのプロ

パティーを継承します

この継承という性質を利用するために、Type Designerでは、始めにカテゴ

リーを定義します

–

例えば、文字データと数値データ

• エンコードを日本語、UTF-8で継承、数値のフォーマットを継承

–

例えば、グループとアイテム

–

例えば、入力データと出力データ

(10)

データ構造の作成

データ構造の作成はType Designerを 使って行います Type Designerではデータ構造のこと をタイプ・ツリーと呼んでおり、この演習 では入力用と出力用のデータ構造を1つ のタイプ・ツリーを使って作成します

データ構造の設計

データ構造の作成

マッピング

テスト

(11)

Type Designer

Type Designerを起動します

– スタート>すべてのプログラム>IBM

WebSphere Transformation

Extender 8.1>Design Studio>Type Designer

(12)

タイプ・ツリーの作成方法

「新規タイプ・ツリー作成」ボタンをクリックします TypeTree1ができます – このビューをナビゲーターと呼んでいます – 右側にあるのはプロパティー・ビューです – カテゴリー、グループ、アイテムすべてに継承されるプロパティーをもっているのが最上位タイプ（ROOT）です ROOTのプロパティーを編集し、名前を変更し ます – 名前を「CSV_Demo」にします – Enterキーを押して変更を確定させます一旦、保存します – ファイル名を「CSVTypeTree」にして保存します

(13)

カテゴリーの追加

以下のカテゴリーをCSV_Demoの下に追加します

カテゴリー名用途

FIELD アイテムを格納する

(14)

カテゴリーの追加方法（１）

FIELDカテゴリーを追加します – 「CSV_Demo」を右クリックして、コンテキスト・メニューから「新規」を選びます – 「新規タイプを追加しますか？」というダイアログは「はい」を選びます – ナビゲーターで「新規カテゴリー1」をクリックして、プロパティーの名前を「FIELD」に変更します – プロパティーのクラスは「カテゴリー」のままにしておきます – アイテム・サブクラス>各国語を「日本」にし、データ言語を「UTF-8（非推奨）」にします

(15)

カテゴリーの追加方法（２）

NUM_FIELDカテゴリーを追加します – 「CSV_Demo」を右クリックして、コンテキスト・メニューから「新規」を選びます – 「新規タイプを追加しますか？」というダイアログは「はい」を選びます – ナビゲーターで「新規カテゴリー1」をクリックして、プロパティーの名前を「NUM_FIELD」に変更します – プロパティーのクラスは「カテゴリー」のままにしておきます – アイテム・サブクラスを「数値」に変更します

(16)

アイテムの追加

以下のアイテムをFIELDとNUM_FIELDカテゴリーの下に追加します

アイテム名カテゴリー名サブクラス埋める文字数位置用途 NUM_FIELD NUM_FIELD FIELD FIELD OUT_NAME FIELD テキスト出力用名前 3 FIELD FIELD 入力データ用ID 右寄せ数値 5 数値テキストテキスト 出力データ用ID テキスト右寄せテキスト姓名部門名事業所 IN_ID OUT_ID LAST_NAME FIRST_NAME DEPT LOCATION

(17)

アイテムの追加方法（１）

IN_IDアイテムを追加します – 「NUM_FIELD」を右クリックして、コンテキスト・メニューから「新規」を選びます – 「新規タイプを追加しますか？」というダイアログは「はい」を選びます – ナビゲーターで「新規カテゴリー1」をクリックして、プロパティーの名前を「IN_ID」に変更します – クラスは「アイテム」に変更します – 「これによってタイプのクラスが変更されます。続行しますか？」というダイアログは「はい」を選びます – アイテム・サブクラス>文字で埋めるを「Yes」にします – 埋める文字数>長さを「3」にします 同様にしてOUT_IDアイテムを追加します – プロパティーのアイテム・サブクラス>文字で埋める>埋める文字数>長さを「5」にします

(18)

アイテムの追加方法（２）

LAST_NAMEアイテムを追加します – 「FIELD」を右クリックして、コンテキスト・メニューから「新規」を選びます – 「新規タイプを追加しますか？」というダイアログは「はい」を選びます – ナビゲーターで「新規カテゴリー1」をクリックして、プロパティーの名前を「LAST_NAME」に変更します – プロパティーのクラスは「アイテム」に変更します – 「これによってタイプのクラスが変更されます。続行しますか？」というダイアログは「はい」を選びます 同様にしてFIRST_NAME、OUT_NAME、 DEPT、LOCATIONアイテムを追加します

(19)

グループ化の方法

次のページからは、グループを定義するために、入力用データ、出力用デー

タの文字区切り方法を確認します

区切り文字によってグループを定義していることを確認してください

複数行のデータを扱えるようにするためファイル全体をグループにしています

出力用データのOUT_DEPTグループのようにスペース（<SP>）を新たな区

切り文字として指定することで入力時の区切り文字（カンマ（，））から変更する

ことができます

(20)

入力用データ・グループ

002,田中洋介,ＹＳＬ・ＩＳＴ・金融ＮＷＳＯＬ開発,大和<CR><LF>

003,小野真樹,ＹＳＬ・ＷｅｂＳｐｈｅｒｅサービス,箱崎<CR><LF>

IN_ID LAST_NAME FIRST_NAME DEPT LOCATION

IN_RECORD IN_NAME グループ名区切り文字位置先頭文字終了文字なしなし <NL> なし中置き中置き IN_NAME <SP> IN_RECORD , IN_FILE

(21)

出力用データ・グループ

00002,田中洋介,大和ＹＳＬ・ＩＳＴ・金融ＮＷＳＯＬ開発<CR><LF>

00003,小野真樹,箱崎ＹＳＬ・ＷｅｂＳｐｈｅｒｅサービス<CR><LF>

OUT_ID OUT_NAME LOCATION DEPT

OUT_RECORD OUT_FILE OUT_DEPT グループ名区切り文字位置先頭文字終了文字なしなし <NL> なし中置き中置き OUT_DEPT <SP> OUT_RECORD ,

(22)

グループの追加

以下のグループをCSV_Demoの下に追加します

グループ名区切り文字位置先頭文字終了文字 IN_NAME <SP> 中置きなしなし IN_RECORD , 中置きなし <NL> IN_FILE なし <<EF>><<BB>><<BF>> なしなし <NL> なしなしなし <<EF>><<BB>><<BF>> 中置き中置き OUT_FILE なし OUT_DEPT <SP> OUT_RECORD ,

(23)

グループの追加方法（１）

IN_NAMEグループを追加します – 「CSV_Demo」を右クリックして、コンテキスト・メニューから「新規」を選びます – 「新規タイプを追加しますか？」というダイアログは「はい」を選びます – ナビゲーターで「新規カテゴリー1」をクリックして、プロパティーの名前を「IN_NAME」に変更します – プロパティーのクラスは「グループ」に変更します – 「これによってタイプのクラスが変更されます。続行しますか？」というダイアログは「はい」を選びます – プロパティーのグループ・サブクラス>形式を「指定」にします – 構文アイテムを「区切り文字で区切られている」にします – 区切り文字>値を「<SP>」にします – さらにその下の位置を「中置き」にします 同様にしてOUT_DEPTも追加します

(24)

グループの追加方法（２）

IN_RECORDグループを追加します – 「CSV_Demo」を右クリックして、コンテキスト・メニューから「新規」を選びます – 「新規タイプを追加しますか？」というダイアログは「はい」を選びます – ナビゲーターで「新規カテゴリー1」をクリックして、プロパティーの名前を「IN_RECORD」に変更します – プロパティーのクラスは「グループ」に変更します – 「これによってタイプのクラスが変更されます。続行しますか？」というダイアログは「はい」を選びます – プロパティーのグループ・サブクラス>形式を「指定」にします – 構文アイテムを「区切り文字で区切られている」にします – 区切り文字>値を「,」にします – さらにその下の位置を「中置き」にします – 構文アイテム>終了文字を「リテラル」にします – その下の値を「<NL>」にします

(25)

グループの追加方法（３）

IN_FILEグループを追加します – 「CSV_Demo」を右クリックして、コンテキスト・メニューから「新規」を選びます – 「新規タイプを追加しますか？」というダイアログは「はい」を選びます – ナビゲーターで「新規カテゴリー1」をクリックして、プロパティーの名前を「IN_FILE」に変更します – プロパティーのクラスは「グループ」に変更します – 「これによってタイプのクラスが変更されます。続行しますか？」というダイアログは「はい」を選びます – 構文アイテム>先頭文字を「リテラル」にします – その下の値を「<<EF>><<BB>><<BF>>」にします 同様にしてOUT_FILEも追加します

(26)

グループおよびアイテムの階層構造

グループおよびアイテムの階層構造を定義します入力用データ、出力用データの階層構造は右図のようになります – 上が入力用、下が出力用ですグループおよびアイテムはデータ順に従って上から順番に書かれています IN_FILE IN_RECORD(s) IN_ID IN_NAME LAST_NAME FIRST_NAME DEPT LOCATION OUT_FILE OUT_RECORD(s) OUT_ID OUT_NAME OUT_DEPT LOCATION DEPT

(27)

グループおよびアイテムの階層化の方法

IN_NAMEグループにLAST_NAME、 FIRST_NAMEアイテムを追加します – IN_NAMEをダブルクリックしてコンポーネント画面を開きます – コンポーネントのフィールドに LAST_NAMEアイテムをドラッグ＆ドロップして追加します – 次に、FIRST_NAMEアイテムをその下のフィールドにドラッグ＆ドロップして追加します – 追加した順番にアイテムが並びますので必ずデータ順に追加してください – 追加が終わったら、コンポーネント画面を閉じます – 確認ダイアログは「はい」を選びます同様にして他のグループも階層化します

(28)

コンポーネントの繰返し

コンポーネントには同じグループやアイテムを追加することができません

コンポーネントの繰り返しが必要なときは以下のルールに従って記述します

(最小繰り返し回数:最大繰り返し回数)

–

デフォルトの状態は(1:1)で、必ず1回だけ出現することを意味します

–

数字が1つしか指定されていないときは、最小を0とします

–

(s)は繰り返し数が未知数を意味します（s = “some (unknown) number”）

最小最大繰り返しルール

Date Field 1 5 Date Field(1:5)

最小最大繰り返しルール

Date Field 1 5 Date Field(1:5)

(29)

コンポーネントの繰り返し設定方法

IN_FILEグループのIN_RECORD繰り返し ルールを設定します – IN_FILEをダブルクリックしてコンポーネント画面を開きます – コンポーネントのIN_RECORDフィールドを選択します – コンポーネント画面の上側（ルール・バー）に表示されている「IN_RECORD」のすぐ後ろに「(s)」を追加して、「Enter」キーを押します – IN_RECORDフィールドが右図のように「IN_RECORD (s)」に変わったら、コンポーネント画面を閉じます – 確認ダイアログは「はい」を選びます 同様にしてOUT_FILEグループの OUT_RECORDにも繰り返しルールを設定し ます

(30)

タイプ・ツリーの解析

タイプ・ツリーができあがったら、タイプ・ツリー構造に論理エラーが含まれていないかどうかをチェックします – CSVTypeTreeを保存します – ナビゲーターのCSV_Demoを選択します – メニューからツリー>解析>論理および構造を選択します – 解析結果がダイアログで表示されます • エラーが0になるようにします • 警告およびエラーがあるときは「結果」ボタンをクリックして解析結果ログを開きます

(31)

Type Designerの終了

CSVTypeTreeを保存して、Type Designerを終了します ここまででデータ構造の作成は終わりです

データ構造の設計

データ構造の作成

マッピング

テスト

(32)

マッピング

ここからは入力データ用アイテムと出力データ用アイテムをマップしていきます マップ作業はMap Designerで行いま す

データ構造の設計

データ構造の作成

マッピング

テスト

(33)

Map Designer

Map Designerを起動します

– スタート>すべてのプログラム>IBM

WebSphere Transformation

Extender 8.1>Design Studio>Map Designer

(34)

Map Designer各部の名称

ルール・バー

ナビゲーター入力カード・ウィンドウ出力カード・ウィンドウ

(35)

マップ・ソース・ファイルとマップ

マップとは、出力オブジェクトをどのように生成するかを定義したもの – 実行可能マップ • ビルド、実行ができるマップ • すべてのマップのルートとなる – 関数マップ • 実行可能マップから呼びだされるマップ マップ・ソース・ファイル（.mms）とは、1つ以 上のマップを保存するものマップには入力カードと出力カードが含まれます – 入力カード、出力カードは複数あっても構いません。 – カードは上から順番に処理されます。マップ・ソース・ファイル実行可能マップ関数マップナビゲーター

(36)

マップの作成

ここからは実際にマップと入力カード、出力カードを作成しながら説明します「新規マップ・ファイル」ボタンをクリックします名前を付けて保存ダイアログが開きますので、 「CSV_Demo.mms」と入力して保存します – 保存場所はどこでも構いませんナビゲーターのマップ・ソース・ファイルの下に 現れたCSV_Demoを右クリックして「新規作 成」を選択します新規マップ作成ダイアログが開きますので、 「EMP_Map」と入力し、「OK」します リスト・タブで見ると、CSV_Demoの配下に EMP_Mapが追加されたのがわかります

(37)

入力カードの作成

前のページで作成したEMP_Mapに入力カー ドを作成します EMP_Mapの配下の入力カードを右クリックし て、「新規作成」を選択します入力カード追加ダイアログが開きますので、 次の設定値を入力して、「OK」します – カード名：「EMP_IN」 – タイプ・ツリー：「CSVTypeTree.mtt」 – タイプ：IN_FILEを選択 – 入力単位：「S」 – 入力元：「File」 – パス名：「name8.txt」 • name8.txtファイルは入力データが入ったファイルです これで入力カードにIN_FILEグループの階層 構造が取り込まれました

(38)

出力カードの作成

EMP_Mapの配下の出力カードを右クリックし て、「新規作成」を選択します出力カード追加ダイアログが開きますので、 次の設定値を入力して、「OK」します – カード名：「EMP_OUT」 – タイプ・ツリー：「CSVTypeTree.mtt」 – タイプ：OUT_GROUP>OUT_FILEを選択 – 入力元：「File」 – パス名：「name8out.txt」 • name8out.txtファイルは出力データが入る予定のファイルで、まだ存在していません これで出力カードにOUT_FILEグループの階 層構造が取り込まれました

(39)

データのマッピング

入力カードは入力されるデータ構造を表しています出力カードは出力されるデータ構造を表しています出力カードのルール・フィールドに出力したい値を入力します入力カードのアイテムを出力カードのルールへドラッグ＆ドロップして入力することができますルールには関数も用意されています選択されたルールはルール・バーで編集できます

(40)

複数行のデータを扱うために（１）

入力カードは入力単位を「S」としたので複数 行であっても取り込めるのですが、出力カード は1行ずつしか出力できないため、1行ごとに 関数マップを呼び出して出力させる必要がありますここでは関数マップ・ウィザードを使って関数マップを作るための手順を説明します – OUT_RECORD (s)のルール・フィールドをクリックします – ルール・バーに「= EMP_List()」と入力します – 入力カードのIN_RECORD (s)を EMP_List()の括弧の中へドラッグ＆ドロップします – 「Enter」キーを押して確定させます

(41)

複数行のデータを扱うために（２）

関数マップ・ウィザードを使います – 出力カードのOUT_RECORD (s)のルール・フィールドで右クリックして、「関数マップ・ウィザード」を選択します – 関数マップ・ウィザードが開きますので、「作成」ボタンをクリックして、次に「閉じる」ボタンをクリックします – ナビゲーターにEMP_Listマップが現れたのを確認してください

(42)

入力データと出力データのマッピング

EMP_Listマップをダブルクリックして入力カードと出力カードを開きます 入力カードのアイテムを出力カードのアイテムのルール・フィールドへドラッグ＆ドロップ します（ただし、OUT_NAMEのルールについては次のページで説明します） IN_RECORD IN_ID IN_NAME LAST_NAME OUT_RECORD OUT_ID OUT_NAME

(43)

ルール関数による結合

OUT_NAMEは2つのアイテムを結合さ せて作ります OUT_NAMEのルールはルール・バー で定義します – OUT_NAMEのルール・フィールドを選択します – ルール･バーに「=」と書いて、その後ろへ入力カードのLAST_NAMEをドラッグ＆ドロップします – さらに、その後ろへ「+」と書いて、 FIRST_NAMEをドラッグ＆ドロップします – 最後に「Enter」キーを押して確定します

(44)

マッピングの終了

以上でマッピング作業は終了です

データ構造の設計

データ構造の作成

マッピング

テスト

(45)

テスト

テストはMap Designerを使って行いま すすでにマッピング作業の中で実行マップの入力カードと出力カードに入力データ・ファイルと出力データ・ファイルの場所を設定してありますここからはトレースの設定、ビルド、実行、結果の確認を行います

データ構造の設計

データ構造の作成

マッピング

テスト

(46)

マップのトレース設定

ここからはマップをテストするための準備をしていきます ナビゲーターでEMP_Mapをダブルク リックしてEMP_Mapの入力カードと出 力カードを前面に出します メニューからマップ>設定を選択します マップ設定ダイアログが現れますので 以下の値を設定し、「OK」してください – スイッチ：「オン」 – 入力データのトレース：「すべて」 – サマリー：「オン」

(47)

ビルド

実行可能マップEMP_Mapを選択して、 ツール・バーの「ビルド」ボタンをクリックします

(48)

マップ実行

実行可能マップEMP_Mapを選択して、 ツール・バーの「マップ実行」ボタンをクリックしますダイアログが開かれますので、「マップは正常に終了しました」と書かれていることを確認してください – 「キャンセル」で閉じますマップ実行

(49)

実行結果の確認（１）

実行可能マップEMP_Mapを選択して、 メニューからマップ>実行結果を選びま す実行結果ダイアログが開かれますので、入力カード、出力カードをチェックして、 「OK」します

(50)

実行結果の確認（２）

(51)

トレース

トレース結果を表示させるとデータが正しく入出力されたかがわかります – 実行可能マップEMP_Mapを選択して、メニューからマップ>雑記帳の表示を選択します – 雑記帳の下のトレース・タブをクリックします

(52)

テスト終了

テストはこれで終了ですこのハンズオン演習ではデバッグ手順については触れません

データ構造の設計

データ構造の作成

マッピング

テスト

(53)

WebSphere Transformation Extender V を使った CSVファイル to CSVファイル変換の考え方とその方法