• 検索結果がありません。

レポートをファイルに保存 を選択したは、次のフィールドに入力します。

ドキュメント内 Dataflow Designer ガイド (ページ 119-163)

レポートの保存先フォルダです。

レポートの場所

ファイル名に含める変数の情報を指定します。以下から1つ以上を選択で きます。

レポート名に追加

ジョブの実行に対して割り当てられる一意のIDです。シス ジョブID

にジョブを実行したときには、それが前回と同じジョブでも 異なるジョブでも、ジョブIDは2になります(3回目以降も 同様)。

レポートにデータを提供したステージの名前であり、

Enterprise Designer内のレポート ステージで指定されてい るものです。

ステージ

レポートが作成された年月日です 日付

以前のレポートを、同じファイル名を持つ新しいレポートで置き換えます。

新しいレポートと同じ名前の既存レポートがあるのにこのオプションを選 既存のレポートを

上書きする

択していない場合、ジョブは正常に完了しますが、新しいレポートは保存 されません。その場合は、レポートが保存されなかったことを示すコメン トが実行履歴に表示されます。

7. [OK]をクリックします。

ジョブを実行すると、そのジョブに関連するレポートがあるかどうかを示す列が[実行履歴]に表 示されます。空のアイコンはレポートが存在しないことを表し、ドキュメントを1つ含むアイコ ンはレポートが1つ存在することを表し、ドキュメントを複数含むアイコンは複数のレポートが 存在することを表します。[ジョブの詳細]で、レポートを表示、保存、印刷することができます。

注: レポートを削除するには、キャンバス上のレポート アイコンを右クリックし、[削除]

を選択します。

レポートの表示

レポートを表示するには、ジョブを実行してから、次のいずれかの操作を行います。

• ジョブを実行すると、Enterprise Designerで[実行の詳細]ウィンドウが表示されます。表示す るレポートを選択します。

• Management Consoleの[実行]ノードで、[履歴]をクリックし、レポートを表示するジョブを

選択して[詳細]をクリックします。

カスタム レポートの使用

SpectrumTechnology Platformモジュールには、基本レポートに役立つレポートが付属してい

ます。しかし、標準レポートでは対応できないレポート要件がある場合は、独自のカスタム レ ポートを作成してデータフローに含めることができます。

1. 任意のレポート設計ツールを使用して、レポート テンプレートを作成します。設計ツールは、

JasperReportsフォーマット(.jrxml)でレポートをエクスポートできるものでなければなりませ

ん。

2. .jrxmlファイルを、server\app\importサーバー上のSpectrumTechnology Platformフォ ルダにコピーします。

数秒でレポート テンプレートがシステムにインポートされ、Enterprise Designerで使用可能に なります。

3. Enterprise Designerにおいて、カスタム レポートを追加するジョブを開きます。

4. ウィンドウ左側の[パレット]の下で[レポート]をクリックします。

5. カスタム レポートをキャンバスにドラッグします。

6. 次のいずれかを行うことにより、レポートのデータ ソースを指定します。

説明 オプション

以下に示すようにグレーのひし形のレポート ポートを使用して、レ ポートを作成したいソース ステージにレポートを接続します。

データフローの入力に 関するレポートを作成 する場合

レポートは、データフローの入力データに基づくものとなり、データ フロー内で生じる処理はまったく反映されません。

以下に示すようにグレーのひし形のレポート ポートを使用して、レ ポートを作成したいシンク ステージにレポートを接続します。

データフローの出力に 関するレポートを作成 する場合

レポートは、データフローの出力データに基づくものとなり、データ に対するデータフローの影響が反映されます。

レポート テンプレートにおいて、JRXMLファイルの<queryString>

レポート テンプレート に埋め込まれたクエリ

説明 オプション

をダブルクリックして、[組み込みクエリの使用]ボックスをオンにし てから、クエリに使用するデータベース接続を選択します。

注: データベース接続を定義する必要がある場合は、

Management Consoleを開き、[リソース]、[接続]の順に選択 します。

以下に示すように、複数のレポートを1つのソースまたはシンクに接続できます。

7. レポートにユーザ定義パラメータが含まれる場合は、

a) キャンバス上のレポート アイコンをダブルクリックします。

b) [パラメータ]タブで、レポートのユーザ定義パラメータに使用する値を指定します。

8. オプション:必要な場合は、チャネルを右クリックし、ソースまたはシンクからのフィールド をレポート内のフィールドにマップします。

パフォーマンスに関する検討事項

パフォーマンス最適化のための設計ガイドライン

パフォーマンスが最適化されるようデータフローを慎重に設計することは、SpectrumTechnology Platformのパフォーマンス向上のために実行できる最も重要な作業です。これらのガイドライン では、データフローのパフォーマンス最適化に使用できる手法について説明します。

ステージ数の最小化

SpectrumTechnology Platformは、並列処理によって高パフォーマンスを実現します。従来の

ワークフロー サーバーの多くがワークフローの各ステップを逐次処理する(つまり、最初のステッ プですべてのデータを処理してから次のステップにデータを渡す)のに対し、SpectrumTechnology Platformは各ステージをそれぞれのスレッドで非同期に処理するため、データフローの並列処理 とパフォーマンスに優れた実行が可能です。

ただし、ある種のデータフローを実行するときプロセッサがオーバースレッドになる可能性があ ります。これは、"実際の仕事"を行う以上の時間がスレッドの管理に費やされることを意味しま す。130の個別ステージを持つデータフローの場合、1つまたは2つのプロセッサを搭載した小 規模なサーバーでのパフォーマンスが非常に悪いことが確認されています。

したがって、パフォーマンスに優れたデータフローを設計するためにまず検討すべきは、必要な だけのステージを使用し、それ以上は使用しないということです。必要以上のステージを使用し た例としては、次のものがあります。

• 1つで十分にもかかわらず複数のconditional routerを使用する

• 複数のトランスフォームを1つのステージに結合する代わりに複数のTransformerステージを 定義する

幸いなことに、通常はこのようなデータフローを設計し直して、冗長または不要なステージを削 除し、パフォーマンスを向上させることができます。

フローが複雑な場合は、埋め込みタイプのフローを使用してキャンバスの混乱を減らすことを検 討してください。これでフローを容易に確認して操作できるようになります。埋め込みタイプの フローを使用しても実行時のパフォーマンス上のメリットはありませんが、Enterprise Designer でのフローの操作が容易になります。

レコード長の短縮

同時並行で実行されるステージ間でデータが渡されるため、入力レコードの長さについても検討 する必要があります。一般的に、長いレコードの入力では、短いレコードの入力に比べ、処理に 時間がかかります。これは、読み込み、書き出し、ソートするデータが多いためです。複数のソー ト操作を行うデータフローは、レコード長を短くすることで特に恩恵を受けます。非常に長いレ コードを処理する場合は、SpectrumTechnology Platformジョブを実行する前に入力から不要な フィールドを削除し、その後、生成された出力ファイルにフィールドを戻すことで、処理速度を 向上させることができます。

ソートの適切な使用

ソート操作の最小化についても検討する必要があります。ソートは他の操作よりも時間がかかる ことが多いため、入力レコードの数およびサイズが増加すると問題となる場合があります。しか し、多くのSpectrumTechnology Platformステージが、ソートされた入力データを必要とした

ジュールは、入力が国および郵便番号によってソートされている場合にパフォーマンスが最適化 されます。Intraflow MatchやInterflow Matchなどのステージでは、入力が[グループ化方法]フィー ルドによってソートされている必要があります。外部ソート アプリケーションを使用して、入力 データを事前にソートできる場合もあります。この場合、SpectrumTechnology Platformデータ フロー内でのソートより速く処理できます。

ステージの実行時パフォーマンス オプション

実行時パフォーマンス オプションは、データフロー内の個々のステージの実行方法を制御し、

データフローのパフォーマンスを高める設定を提供します。使用可能な設定は、Spectrum

Technology Platform環境の設定方法によって異なります。

[ローカル]オプションは、ステージをローカルSpectrumTechnology Platformサーバーで実

行し、そのステージで1つの実行時インスタンスを使用するデフォルト設定です。実行時イン スタンスの設定は増やすことができます。したがって、並行処理を利用してパフォーマンスを 高めることができます。

[分散]オプションは通常、ロード バランサ―と複数のSpectrumTechnology Platformサーバー がインストールされるクラスタ環境で使用されます。

[リモート]オプションは、複数のSpectrumTechnology Platformサーバーで構成されている

が、分散処理が行えるように設定されていない環境で使用できます。このオプションを使用す ると、ステージの処理を別のサーバーで実行できます。

ローカル実行時インスタンスの設定

データフローの各ステージはそれぞれのスレッドで非同期に動作し、他のステージから独立して います。このため、データフロー内の複数ステージが並列処理され、1つのステージに対して複 数の実行時インスタンスを利用することができます。これは、データの処理時間が異なるステー ジで構成されるデータフローで役に立ちます。その結果、スレッド間での作業の分配のバランス が悪くなる可能性があります。例えば、次の2つのステージで構成されるデータフローを考えて みましょう。

ステージの設定によって、Validate AddressステージがGeocode US Addressステージより速く レコードを処理することがあります。その場合、データフロー実行のある時点で、Validate Address はすべてのレコードを処理していますが、Geocode US Addressにはまだ未処理のレコードがあ ります。このデータフローのパフォーマンスを向上させるには、最も速度の遅いステージ(この場

合はGeocode US Address)のパフォーマンスを向上させる必要があります。その方法の1つは、

ステージの実行時インスタンスを複数指定することです。例えば、実行時インスタンス数を2に

ドキュメント内 Dataflow Designer ガイド (ページ 119-163)