• 検索結果がありません。

値またはパターンを右クリックし、[データドメインの作成]を選択します。

ドキュメント内 Informatica Data Discovery Guide - (Japanese) (ページ 98-103)

[データドメインの作成]ダイアログボックスが表示されます。

5. データドメイン名と説明(省略可能)を入力します。

6. [作成]をクリックします。

データドメインがデータドメイングロッサリに追加されます。

Informatica Analyst でのデータドメインとデータドメイングルー プの検索

データドメイングロッサリで特定のデータドメインとデータドメイングループを検索することができます。

[データドメイン]または[データドメイングループ]ビューを選択して、データドメイングロッサリ内のデー タドメインのリストを表示することができます。

例えば、PII データドメイングループに追加したデータドメイン Zipcode があるとします。 次の方法で、

Zipcode とそのデータドメイングループ PII に関する詳細情報を検索することができます。

データドメインを検索する。

ナビゲータの上部にあるテキストフィールドに、zip や code など、データドメイン名の一部を入力しま す。 [データドメイングループ]ビューになっている場合は、Zipcode を含むデータドメイングループで ある PII が表示されます。 [データドメイン]ビューが表示されている場合は、検索文字列の Zip または code を含むすべてのデータドメインが一覧表示されます。

注: 検索では大文字小文字は区別されません。

すべてのデータドメイングループとその中のデータドメインを表示する。

ナビゲータで、[データドメイングループビューの表示]をクリックします。

すべてのデータドメインを表示する。

ナビゲータで、[データドメインビューの表示]をクリックします。

データドメインのプロパティを表示する。

[データドメイン]ビューになっていることを確認します。 ナビゲータで、「Zipcode」をクリックする と、右側のペインにそのプロパティが表示されます。 名前、タイプ、説明、関連付けられているルール、

および属しているドメイングループ(この場合は PII)を表示できます。

データドメイングループのプロパティを表示する。

[データドメイングループ]ビューになっていることを確認します。 ナビゲータで、「PII」をクリックす ると、右側のペインにそのプロパティが表示されます。 名前、タイプ、説明、および PIIZipcode を含 む、データドメインのリストを表示できます。

データドメイングロッサリを更新する。

ナビゲータで、[アクション] > [更新]をクリックします。 現在のビューに基づいて、データドメイン グロッサリにデータドメインまたはデータドメイングループの現在のリストが表示されます。

Informatica Analyst のデータドメイン検出オプショ ン

データドメイン検出のカラム、データドメイン、および推測オプションを選択するには、データドメイン検出 オプションを使用します。 推測オプションでは、データドメイン検出の実行対象を、カラムデータ、カラム 名、またはその両方から選択できます。

Informatica Analyst でのデータドメインカラムの選択

[設定の指定]画面で[編集]をクリックすると、データドメイン検出の一部として実行するカラムを選択でき ます。 プロファイルウィザードの[ソースの選択]画面に、データソース内のすべてのカラムを表示できま す。 カラムプロファイルおよびデータドメイン検出用にさまざまなカラムを選択できます。

以下の表で、データドメイン検出の[編集]ダイアログボックスの各プロパティについて説明します。

オプション 説明

名前 カラム名が表示されます。

タイプ カラムの文書化されたデータ型が表示されます。

精度 カラムの最大精度が表示されます。

スケール カラムのスケールが表示されます。

NULL

可能

NULL

値を指定できるカラムを示します。

キー カラムがプライマリキーまたは外部キーのどちらとして文書化されているかを示します。

Informatica Analyst

のデータドメイン検出オプション 99

Informatica Analyst でのデータドメインの選択

[設定の指定]画面の[データドメイン]ペインにデータドメイングロッサリのすべてのデータドメインが一覧 表示されます。 データドメイン検出の実行対象とするデータドメインを選択できます。

次の表で、データドメイン検出の[データドメイン]プロパティについて説明します。

オプション 説明

名前 データドメイン名が表示されます。 1つ以上のデータドメインまたはデータドメイングル ープを選択できます。

説明 データドメインの説明が表示されます。

DomainGroups

データドメインが属しているデータドメイングループの名前が表示されます。

Informatica Analyst のデータドメイン推測オプション

推測オプションでは、データドメイン検出の実行対象を、カラムデータ、カラム名、またはその両方から選択 できます。プロファイルが分析できる最大行数やデータドメイン一致の最小一致率を指定することもできます。

データドメインの推測オプションは、プロファイルウィザードの[設定の指定]画面で設定できます。

以下の表に、データドメイン検出の推測オプションを示します。

オプション 説明

Data (データ)

プロファイルをカラムデータに対して実行します。

カラム名 プロファイルをカラムタイトルに対して実行します。

データとカラム名 プロファイルをカラムデータとカラムタイトルの両方に対して実行します。

最小一致率 データドメインの一致の対象となるカラムデータの最小一致率。一致率は、一 致行数を合計行数で除算した値です。

注: Analystツールでは、NULL値は一致しない行とみなされます。NULL値の数 が多いカラムでは、最小一致率を低く指定しないと、結果がデータドメイン推 測にならない場合があります。

編集 データドメイン検出のカラムを選択します。

すべての行 プロファイルをソースのすべての行に対して実行します。

サンプリング最初の プロファイルを実行できる最大行数を選択します。 Analystツールでは、ソース の先頭行から行が選択されます。

ランダムサンプリング データソースから行のランダムサンプルを選択します。

ランダムサンプリング

(自動)

Analyst

ツールでは、データソースのサイズに応じて行のランダムサンプルが選

択されます。

以降のプロファイル実 行で、データ型とデー タドメイン推測から、

承認済みのデータ型と データドメインを除外 します。

プロファイル実行でデータ型またはデータドメインを承認したとします。 この オプションを選択した場合、承認されたデータ型またはデータドメインは、後 続のプロファイル実行のデータ型およびデータドメイン推測から除外されます。

Informatica Analyst でのデータドメイン検出実行プ ロファイルの作成

Analyst ツールでプロファイルを作成してデータドメイン検出を実行する前に、データドメインを少なくとも 1 つ作成する必要があります。プロファイルでは、定義済みデータドメインに一致するカラム名とカラムデータ の両方を検出できます。

1. [検出]ワークスペースで、[プロファイル]をクリックするか、Analyst ツール内の任意の場所で[新 規] > [プロファイル]を選択します。

[新規プロファイル]ウィザードが表示されます。

2. [単一ソース]オプションがデフォルトで選択されています。[次へ]をクリックします。

3. [全般プロパティの指定]画面で、プロファイルの名前と説明(省略可能)を入力します。 [場所]フィ ールドで、プロファイルの作成先のプロジェクトまたはフォルダを選択します。[次へ]をクリックしま す。

4. [ソースの選択]画面で、[選択]をクリックしてデータオブジェクトを選択するか、[新規]をクリック してデータオブジェクトをインポートします。 [次へ]をクリックします。

5. [設定の指定]画面で、カラムプロファイル、データドメイン検出、またはカラムプロファイルとデータド メイン検出のうちどれを実行するかを選択します。 デフォルトでは、カラムプロファイルオプションが選 択されています。

[カラムプロファイルを実行]を選択して、カラムプロファイルを実行します。

[データドメイン検出を実行]を選択して、データドメイン検出を実行します。[データドメイン]ペイ ンで、検出するデータドメインを選択して、データドメインの最小一致率を入力し、[データドメイン 検出のカラム選択の編集]ダイアログボックスでデータドメイン検出対象カラムを選択します。

[カラムプロファイルを実行]と[データドメイン検出を実行]を選択して、カラムプロファイルとデ ータドメイン検出を実行します。[データドメイン]ペインでデータドメインオプションを選択します。

注: デフォルトでは、カラムプロファイルの対象として選択したカラムには、データドメイン検出も適 用されます。[編集]をクリックすると、カラムプロファイルの対象として選択したカラムかどうかと は無関係に、データドメイン検出の実行対象カラムを選択または選択解除できます。

データドメイン検出の実行対象として、[データ]、[カラム]、[データとカラム]を選択します。

[次に対してプロファイルを実行]ペインでサンプリングオプションを選択します。

[ドリルダウン]ペインでドリルダウンオプションを選択します。必要に応じて、[カラムの選択]をク リックして、ドリルダウンするカラムを選択します。承認済みのデータ型またはデータドメインを持つ カラムの場合は、データ型およびデータドメインの推測を省略できます。

接続タイプとして、[ネイティブ]または[Hive]を選択します。[Hive]を選択した場合は、[選択]

をクリックすると、[Hive 接続の選択]ダイアログボックスで Hive 接続を選択できます。

Hive 接続を使用すると、データ統合サービスが Hadoop クラスタと通信し、プロファイルの実行をデ ータ統合サービスから Hadoop クラスタにプッシュダウンできます。

6. [ルールとフィルタの指定]画面では、プロファイルのルールおよびフィルタを追加、編集、または削除で きます。

7. [保存して完了]をクリックしてプロファイルを作成するか、[保存して実行]をクリックしてプロファイ ルを作成および実行します。

Informatica Analyst

でのデータドメイン検出実行プロファイルの作成 101

ドキュメント内 Informatica Data Discovery Guide - (Japanese) (ページ 98-103)