第1章 Information Integratorの機能
1.8 管理機能
1.8.2 データ管理
Information Integratorでは、収集元システムから収集したデータや、配付先システムに配付したデータなどをInformation Integratorサー
バ内に保持します。この保持する領域を「データボックス」と呼びます。
データボックスは、システム中に複数作成されます。データの操作(格納、抽出など)を行うことができます。
図1.30 データ管理のイメージ
データボックスの種類
データボックスには以下の種類があります。
・ データボックス
- 逐次データの格納に利用する場合
利用者が、データ収集およびデータ配付単位に指定します。業務アプリケーションやシステム間でのキュー制御といった用途 として利用できます。
プロセス定義の基本処理、データ収集定義、データ振分定義、およびデータ配付定義で指定できます。
データボックスへの操作方法は、コマンドを利用したデータ格納、抽出、削除などのデータ操作と運用管理クライアントを利用 したデータ参照があります。
これらの詳細は、“コマンドリファレンス”および“運用管理クライアントヘルプ”を参照してください。
- スプールとして利用する場合
利用者が、データ収集に指定します。データ収集でマスタデータを溜め込んで管理する場合に利用できます。
コマンドを利用したデータ格納、抽出、削除などのデータ操作によって、データボックスをスプールとして扱うことができます。
ポイント
データボックスに格納されたデータの削除契機
データボックスに格納されたデータを削除する契機は、以下の2パターンがあります。
- 動作環境ファイルの「自側データボックス蓄積情報の保存期限(excttermキー)」の経過を契機に削除
動作環境ファイルの「日付を変更する区切り時刻(resettimeキー)」をもとに、データボックスの蓄積情報の保存期限が経過した あと、自動で削除されます。なお、Information Integratorサーバが停止していた場合は次回の起動時に削除されます。動作環 境ファイルの詳細は、“セットアップガイド”を参照してください。
- 利用者の削除依頼によって削除
ifirdelt(データ削除)コマンドの実行によって削除できます。詳細は、“コマンドリファレンス”を参照してください。
・ テンポラリデータボックス
処理プロセスでデータを処理する場合に、データ変換や振分などのファンクションの処理結果データを一時的に保存してファンク ション間でのデータの受渡しを行うのに利用します。
ファンクションで異常が発生した場合のリカバリ操作を行ったり、データの流れを確認したりすることができます。
一度、抽出したデータを再度、抽出する事はできませんが、データの参照は可能です。
ポイント
テンポラリデータボックスに格納されたデータの削除契機
テンポラリデータボックスに格納されたデータを削除する契機は、以下の2パターンがあります。
- プロセスの完了を契機に削除
動作環境ファイルの「テンポラリデータボックスの削除契機(tmpdboxdelキー)」に「proc」を指定した場合および「削除条件 (tmpdboxdeltermキー)」を指定した場合にプロセスの完了時に自動で削除されます。
- プロセス完了から1日経過後に削除
動作環境ファイルの「テンポラリデータボックスの削除契機(tmpdboxdelキー)」を省略した場合または「fix」を指定した場合、プ ロセスの完了から1日が経過したあと、動作環境ファイルの「区切り時刻(resettimeキー)」をもとに自動で削除されます。なお、
Information Integratorサーバが停止していた場合は次回の起動時に削除されます。
動作環境ファイルの詳細は、“セットアップガイド”を参照してください。
管理
「データボックス」には、データが世代として順次蓄積されます。各世代のデータに対して、システムで一意な番号であるデータ番号が 自動採番されます。利用者は、この番号を基にしてデータの識別を行うことができます。
各世代のデータに対して、データの管理情報とデータを以下の構造で管理します。
・ 管理情報
以下の情報を使用して管理します。
- データを示す情報(データ番号、データサイズ、格納日時など)
- データ操作を行った処理(ファンクション)情報
- データの状態
・ データ
データは、動作環境ファイルの「世代管理データ保存領域(stk_pathキー)」の配下でデータ単位にファイルで管理されます。
扱えるデータ
CSVやバイナリといったデータの形式にかかわらず、データボックスに管理する事ができます。
また、データボックス1つあたりの世代数の上限および各データのサイズにも制限はありません。
注意
1つのデータボックスに対して、異なる構造や形式のデータは格納できません。
ただし、以下の場合は異なる構造や形式のデータを混在することができます。
・ データボックスに対応する、データ構造定義のデータ形式に「混在フォーマット」を指定した場合
データボックスの格納状態
データボックスの格納状態は以下のとおりです。これらの各状態は、下記の表の上から順に遷移します。
格納処理、抽出処理で異常を検出した場合は、実行前の状態に戻ります。ファンクションで処理するデータは該当のファンクションが 正常終了または異常終了するまでは、格納中または抽出中になります。
表1.12 格納状態
状態 説明
格納中 格納処理中の状態です。データ収集中のデータもこの状態になります。
格納済 格納処理が完了した状態です。抽出することが可能です。
抽出中 抽出処理中の状態です。データ配付中のデータもこの状態になります。
抽出済 抽出処理が完了した状態です。
リカバリポイント
処理プロセスの実行中に、異常検出した場合、処理プロセスを再実行することで、業務をリカバリする必要がありますが、再実行を処 理の途中で開始できるように、チェックポイントがあります。このチェックポイントを「リカバリポイント」と呼びます。
リカバリポイントとは、データ収集完了時の処理結果状態およびデータ配付前の処理結果状態を保持した状態を指します。
再実行を依頼された場合には、異常が発生した処理の直前のリカバリポイント(データ収集完了時点または、データ配付前の時点)ま での処理をスキップして、処理することで、効率的なリカバリができます。
図1.31 リカバリポイントのイメージ
ポイント
複数のデータ配付処理が存在する処理プロセスのリカバリについて
以下のように、複数のデータ配付処理が存在する処理プロセスでは、データ配付前の処理がすべて完了するまで各データ配付処理 の開始を待ち合わせます。
これにより、いずれかのデータ配付処理で異常が発生した場合、異常が発生した処理の直前のリカバリポイント(データ配付前の時点) からリカバリを行うことができます。