レポートの保存先フォルダです。
レポートの場所
ファイル名に含める変数の情報を指定します。以下から1つ以上を選択で きます。
レポート名に追加
ジョブの実行に対して割り当てられる一意のIDです。シス ジョブID
にジョブを実行したときには、それが前回と同じジョブでも 異なるジョブでも、ジョブIDは2になります(3回目以降も 同様)。
レポートにデータを提供したステージの名前であり、
Enterprise Designer内のレポート ステージで指定されてい るものです。
ステージ
レポートが作成された年月日です 日付
以前のレポートを、同じファイル名を持つ新しいレポートで置き換えます。
新しいレポートと同じ名前の既存レポートがあるのにこのオプションを選 既存のレポートを
上書きする
択していない場合、ジョブは正常に完了しますが、新しいレポートは保存 されません。その場合は、レポートが保存されなかったことを示すコメン トが実行履歴に表示されます。
7. [OK]をクリックします。
ジョブを実行すると、そのジョブに関連するレポートがあるかどうかを示す列が[実行履歴]に表 示されます。空のアイコンはレポートが存在しないことを表し、ドキュメントを1つ含むアイコ ンはレポートが1つ存在することを表し、ドキュメントを複数含むアイコンは複数のレポートが 存在することを表します。[ジョブの詳細]で、レポートを表示、保存、印刷することができます。
注: レポートを削除するには、キャンバス上のレポート アイコンを右クリックし、[削除]
を選択します。
レポートの表示
レポートを表示するには、ジョブを実行してから、次のいずれかの操作を行います。
• ジョブを実行すると、Enterprise Designerで[実行の詳細]ウィンドウが表示されます。表示す るレポートを選択します。
• Management Consoleの[実行]ノードで、[履歴]をクリックし、レポートを表示するジョブを
選択して[詳細]をクリックします。
カスタム レポートの使用
Spectrum™Technology Platformモジュールには、基本レポートに役立つレポートが付属してい
ます。しかし、標準レポートでは対応できないレポート要件がある場合は、独自のカスタム レ ポートを作成してデータフローに含めることができます。
1. 任意のレポート設計ツールを使用して、レポート テンプレートを作成します。設計ツールは、
JasperReportsフォーマット(.jrxml)でレポートをエクスポートできるものでなければなりませ
ん。
2. .jrxmlファイルを、server\app\importサーバー上のSpectrum™Technology Platformフォ ルダにコピーします。
数秒でレポート テンプレートがシステムにインポートされ、Enterprise Designerで使用可能に なります。
3. Enterprise Designerにおいて、カスタム レポートを追加するジョブを開きます。
4. ウィンドウ左側の[パレット]の下で[レポート]をクリックします。
5. カスタム レポートをキャンバスにドラッグします。
6. 次のいずれかを行うことにより、レポートのデータ ソースを指定します。
説明 オプション
以下に示すようにグレーのひし形のレポート ポートを使用して、レ ポートを作成したいソース ステージにレポートを接続します。
データフローの入力に 関するレポートを作成 する場合
レポートは、データフローの入力データに基づくものとなり、データ フロー内で生じる処理はまったく反映されません。
以下に示すようにグレーのひし形のレポート ポートを使用して、レ ポートを作成したいシンク ステージにレポートを接続します。
データフローの出力に 関するレポートを作成 する場合
レポートは、データフローの出力データに基づくものとなり、データ に対するデータフローの影響が反映されます。
レポート テンプレートにおいて、JRXMLファイルの<queryString>
レポート テンプレート に埋め込まれたクエリ
説明 オプション
をダブルクリックして、[組み込みクエリの使用]ボックスをオンにし てから、クエリに使用するデータベース接続を選択します。
注: データベース接続を定義する必要がある場合は、
Management Consoleを開き、[リソース]、[接続]の順に選択 します。
以下に示すように、複数のレポートを1つのソースまたはシンクに接続できます。
7. レポートにユーザ定義パラメータが含まれる場合は、
a) キャンバス上のレポート アイコンをダブルクリックします。
b) [パラメータ]タブで、レポートのユーザ定義パラメータに使用する値を指定します。
8. オプション:必要な場合は、チャネルを右クリックし、ソースまたはシンクからのフィールド をレポート内のフィールドにマップします。
パフォーマンスに関する検討事項
パフォーマンス最適化のための設計ガイドライン
パフォーマンスが最適化されるようデータフローを慎重に設計することは、Spectrum™Technology Platformのパフォーマンス向上のために実行できる最も重要な作業です。これらのガイドライン では、データフローのパフォーマンス最適化に使用できる手法について説明します。
ステージ数の最小化
Spectrum™Technology Platformは、並列処理によって高パフォーマンスを実現します。従来の
ワークフロー サーバーの多くがワークフローの各ステップを逐次処理する(つまり、最初のステッ プですべてのデータを処理してから次のステップにデータを渡す)のに対し、Spectrum™Technology Platformは各ステージをそれぞれのスレッドで非同期に処理するため、データフローの並列処理 とパフォーマンスに優れた実行が可能です。
ただし、ある種のデータフローを実行するときプロセッサがオーバースレッドになる可能性があ ります。これは、"実際の仕事"を行う以上の時間がスレッドの管理に費やされることを意味しま す。130の個別ステージを持つデータフローの場合、1つまたは2つのプロセッサを搭載した小 規模なサーバーでのパフォーマンスが非常に悪いことが確認されています。
したがって、パフォーマンスに優れたデータフローを設計するためにまず検討すべきは、必要な だけのステージを使用し、それ以上は使用しないということです。必要以上のステージを使用し た例としては、次のものがあります。
• 1つで十分にもかかわらず複数のconditional routerを使用する
• 複数のトランスフォームを1つのステージに結合する代わりに複数のTransformerステージを 定義する
幸いなことに、通常はこのようなデータフローを設計し直して、冗長または不要なステージを削 除し、パフォーマンスを向上させることができます。
フローが複雑な場合は、埋め込みタイプのフローを使用してキャンバスの混乱を減らすことを検 討してください。これでフローを容易に確認して操作できるようになります。埋め込みタイプの フローを使用しても実行時のパフォーマンス上のメリットはありませんが、Enterprise Designer でのフローの操作が容易になります。
レコード長の短縮
同時並行で実行されるステージ間でデータが渡されるため、入力レコードの長さについても検討 する必要があります。一般的に、長いレコードの入力では、短いレコードの入力に比べ、処理に 時間がかかります。これは、読み込み、書き出し、ソートするデータが多いためです。複数のソー ト操作を行うデータフローは、レコード長を短くすることで特に恩恵を受けます。非常に長いレ コードを処理する場合は、Spectrum™Technology Platformジョブを実行する前に入力から不要な フィールドを削除し、その後、生成された出力ファイルにフィールドを戻すことで、処理速度を 向上させることができます。
ソートの適切な使用
ソート操作の最小化についても検討する必要があります。ソートは他の操作よりも時間がかかる ことが多いため、入力レコードの数およびサイズが増加すると問題となる場合があります。しか し、多くのSpectrum™Technology Platformステージが、ソートされた入力データを必要とした
ジュールは、入力が国および郵便番号によってソートされている場合にパフォーマンスが最適化 されます。Intraflow MatchやInterflow Matchなどのステージでは、入力が[グループ化方法]フィー ルドによってソートされている必要があります。外部ソート アプリケーションを使用して、入力 データを事前にソートできる場合もあります。この場合、Spectrum™Technology Platformデータ フロー内でのソートより速く処理できます。
ステージの実行時パフォーマンス オプション
実行時パフォーマンス オプションは、データフロー内の個々のステージの実行方法を制御し、
データフローのパフォーマンスを高める設定を提供します。使用可能な設定は、Spectrum™
Technology Platform環境の設定方法によって異なります。
• [ローカル]オプションは、ステージをローカルSpectrum™Technology Platformサーバーで実
行し、そのステージで1つの実行時インスタンスを使用するデフォルト設定です。実行時イン スタンスの設定は増やすことができます。したがって、並行処理を利用してパフォーマンスを 高めることができます。
• [分散]オプションは通常、ロード バランサ―と複数のSpectrum™Technology Platformサーバー がインストールされるクラスタ環境で使用されます。
• [リモート]オプションは、複数のSpectrum™Technology Platformサーバーで構成されている
が、分散処理が行えるように設定されていない環境で使用できます。このオプションを使用す ると、ステージの処理を別のサーバーで実行できます。
ローカル実行時インスタンスの設定
データフローの各ステージはそれぞれのスレッドで非同期に動作し、他のステージから独立して います。このため、データフロー内の複数ステージが並列処理され、1つのステージに対して複 数の実行時インスタンスを利用することができます。これは、データの処理時間が異なるステー ジで構成されるデータフローで役に立ちます。その結果、スレッド間での作業の分配のバランス が悪くなる可能性があります。例えば、次の2つのステージで構成されるデータフローを考えて みましょう。
ステージの設定によって、Validate AddressステージがGeocode US Addressステージより速く レコードを処理することがあります。その場合、データフロー実行のある時点で、Validate Address はすべてのレコードを処理していますが、Geocode US Addressにはまだ未処理のレコードがあ ります。このデータフローのパフォーマンスを向上させるには、最も速度の遅いステージ(この場
合はGeocode US Address)のパフォーマンスを向上させる必要があります。その方法の1つは、
ステージの実行時インスタンスを複数指定することです。例えば、実行時インスタンス数を2に