レポートをファイルに保存を選択したは、次のフィールドに入力します。

レポートの保存先フォルダです。

レポートの場所

ファイル名に含める変数の情報を指定します。以下から1つ以上を選択できます。

レポート名に追加

ジョブの実行に対して割り当てられる一意のIDです。シス ジョブID

にジョブを実行したときには、それが前回と同じジョブでも異なるジョブでも、ジョブIDは2になります(3回目以降も同様)。

レポートにデータを提供したステージの名前であり、

Enterprise Designer内のレポートステージで指定されているものです。

ステージ

レポートが作成された年月日です日付

以前のレポートを、同じファイル名を持つ新しいレポートで置き換えます。

新しいレポートと同じ名前の既存レポートがあるのにこのオプションを選 既存のレポートを

上書きする

択していない場合、ジョブは正常に完了しますが、新しいレポートは保存されません。その場合は、レポートが保存されなかったことを示すコメントが実行履歴に表示されます。

7. [OK]をクリックします。

ジョブを実行すると、そのジョブに関連するレポートがあるかどうかを示す列が[実行履歴]に表示されます。空のアイコンはレポートが存在しないことを表し、ドキュメントを1つ含むアイコンはレポートが1つ存在することを表し、ドキュメントを複数含むアイコンは複数のレポートが存在することを表します。[ジョブの詳細]で、レポートを表示、保存、印刷することができます。

注: レポートを削除するには、キャンバス上のレポートアイコンを右クリックし、[削除]

を選択します。

レポートの表示

レポートを表示するには、ジョブを実行してから、次のいずれかの操作を行います。

• ジョブを実行すると、Enterprise Designerで[実行の詳細]ウィンドウが表示されます。表示するレポートを選択します。

• Management Consoleの[実行]ノードで、[履歴]をクリックし、レポートを表示するジョブを

選択して[詳細]をクリックします。

カスタムレポートの使用

Spectrum^™Technology Platformモジュールには、基本レポートに役立つレポートが付属してい

ます。しかし、標準レポートでは対応できないレポート要件がある場合は、独自のカスタムレポートを作成してデータフローに含めることができます。

1. 任意のレポート設計ツールを使用して、レポートテンプレートを作成します。設計ツールは、

JasperReportsフォーマット(.jrxml)でレポートをエクスポートできるものでなければなりませ

ん。

2. .jrxmlファイルを、server\app\importサーバー上のSpectrum^™Technology Platformフォルダにコピーします。

数秒でレポートテンプレートがシステムにインポートされ、Enterprise Designerで使用可能になります。

3. Enterprise Designerにおいて、カスタムレポートを追加するジョブを開きます。

4. ウィンドウ左側の[パレット]の下で[レポート]をクリックします。

5. カスタムレポートをキャンバスにドラッグします。

6. 次のいずれかを行うことにより、レポートのデータソースを指定します。

説明 オプション

以下に示すようにグレーのひし形のレポートポートを使用して、レポートを作成したいソースステージにレポートを接続します。

データフローの入力に 関するレポートを作成 する場合

レポートは、データフローの入力データに基づくものとなり、データフロー内で生じる処理はまったく反映されません。

以下に示すようにグレーのひし形のレポートポートを使用して、レポートを作成したいシンクステージにレポートを接続します。

データフローの出力に 関するレポートを作成 する場合

レポートは、データフローの出力データに基づくものとなり、データに対するデータフローの影響が反映されます。

レポートテンプレートにおいて、JRXMLファイルの<queryString>

レポートテンプレート に埋め込まれたクエリ

説明 オプション

をダブルクリックして、[組み込みクエリの使用]ボックスをオンにしてから、クエリに使用するデータベース接続を選択します。

注: データベース接続を定義する必要がある場合は、

Management Consoleを開き、[リソース]、[接続]の順に選択します。

以下に示すように、複数のレポートを1つのソースまたはシンクに接続できます。

7. レポートにユーザ定義パラメータが含まれる場合は、

a) キャンバス上のレポートアイコンをダブルクリックします。

b) [パラメータ]タブで、レポートのユーザ定義パラメータに使用する値を指定します。

8. オプション:必要な場合は、チャネルを右クリックし、ソースまたはシンクからのフィールドをレポート内のフィールドにマップします。

パフォーマンスに関する検討事項

パフォーマンス最適化のための設計ガイドライン

パフォーマンスが最適化されるようデータフローを慎重に設計することは、Spectrum^™Technology Platformのパフォーマンス向上のために実行できる最も重要な作業です。これらのガイドラインでは、データフローのパフォーマンス最適化に使用できる手法について説明します。

ステージ数の最小化

Spectrum^™Technology Platformは、並列処理によって高パフォーマンスを実現します。従来の

ワークフローサーバーの多くがワークフローの各ステップを逐次処理する(つまり、最初のステップですべてのデータを処理してから次のステップにデータを渡す)のに対し、Spectrum^™Technology Platformは各ステージをそれぞれのスレッドで非同期に処理するため、データフローの並列処理とパフォーマンスに優れた実行が可能です。

ただし、ある種のデータフローを実行するときプロセッサがオーバースレッドになる可能性があります。これは、"実際の仕事"を行う以上の時間がスレッドの管理に費やされることを意味します。130の個別ステージを持つデータフローの場合、1つまたは2つのプロセッサを搭載した小規模なサーバーでのパフォーマンスが非常に悪いことが確認されています。

したがって、パフォーマンスに優れたデータフローを設計するためにまず検討すべきは、必要なだけのステージを使用し、それ以上は使用しないということです。必要以上のステージを使用した例としては、次のものがあります。

• 1つで十分にもかかわらず複数のconditional routerを使用する

• 複数のトランスフォームを1つのステージに結合する代わりに複数のTransformerステージを定義する

幸いなことに、通常はこのようなデータフローを設計し直して、冗長または不要なステージを削除し、パフォーマンスを向上させることができます。

フローが複雑な場合は、埋め込みタイプのフローを使用してキャンバスの混乱を減らすことを検討してください。これでフローを容易に確認して操作できるようになります。埋め込みタイプのフローを使用しても実行時のパフォーマンス上のメリットはありませんが、Enterprise Designer でのフローの操作が容易になります。

レコード長の短縮

同時並行で実行されるステージ間でデータが渡されるため、入力レコードの長さについても検討する必要があります。一般的に、長いレコードの入力では、短いレコードの入力に比べ、処理に時間がかかります。これは、読み込み、書き出し、ソートするデータが多いためです。複数のソート操作を行うデータフローは、レコード長を短くすることで特に恩恵を受けます。非常に長いレコードを処理する場合は、Spectrum^™Technology Platformジョブを実行する前に入力から不要なフィールドを削除し、その後、生成された出力ファイルにフィールドを戻すことで、処理速度を向上させることができます。

ソートの適切な使用

ソート操作の最小化についても検討する必要があります。ソートは他の操作よりも時間がかかることが多いため、入力レコードの数およびサイズが増加すると問題となる場合があります。しかし、多くのSpectrum^™Technology Platformステージが、ソートされた入力データを必要とした

ジュールは、入力が国および郵便番号によってソートされている場合にパフォーマンスが最適化されます。Intraflow MatchやInterflow Matchなどのステージでは、入力が[グループ化方法]フィールドによってソートされている必要があります。外部ソートアプリケーションを使用して、入力データを事前にソートできる場合もあります。この場合、Spectrum^™Technology Platformデータフロー内でのソートより速く処理できます。

ステージの実行時パフォーマンスオプション

実行時パフォーマンスオプションは、データフロー内の個々のステージの実行方法を制御し、

データフローのパフォーマンスを高める設定を提供します。使用可能な設定は、Spectrum^™

Technology Platform環境の設定方法によって異なります。

• [ローカル]オプションは、ステージをローカルSpectrum^™Technology Platformサーバーで実

行し、そのステージで1つの実行時インスタンスを使用するデフォルト設定です。実行時インスタンスの設定は増やすことができます。したがって、並行処理を利用してパフォーマンスを高めることができます。

• [分散]オプションは通常、ロードバランサ―と複数のSpectrum^™Technology Platformサーバーがインストールされるクラスタ環境で使用されます。

• [リモート]オプションは、複数のSpectrum^™Technology Platformサーバーで構成されている

が、分散処理が行えるように設定されていない環境で使用できます。このオプションを使用すると、ステージの処理を別のサーバーで実行できます。

ローカル実行時インスタンスの設定

データフローの各ステージはそれぞれのスレッドで非同期に動作し、他のステージから独立しています。このため、データフロー内の複数ステージが並列処理され、1つのステージに対して複数の実行時インスタンスを利用することができます。これは、データの処理時間が異なるステージで構成されるデータフローで役に立ちます。その結果、スレッド間での作業の分配のバランスが悪くなる可能性があります。例えば、次の2つのステージで構成されるデータフローを考えてみましょう。

ステージの設定によって、Validate AddressステージがGeocode US Addressステージより速くレコードを処理することがあります。その場合、データフロー実行のある時点で、Validate Address はすべてのレコードを処理していますが、Geocode US Addressにはまだ未処理のレコードがあります。このデータフローのパフォーマンスを向上させるには、最も速度の遅いステージ(この場

合はGeocode US Address)のパフォーマンスを向上させる必要があります。その方法の1つは、

ステージの実行時インスタンスを複数指定することです。例えば、実行時インスタンス数を2に

ドキュメント内 Dataflow Designer ガイド (ページ 119-163)

レポートをファイルに保存 を選択したは、次のフィールドに入力します。