• 検索結果がありません。

Informatica Enterprise Data Catalog

N/A
N/A
Protected

Academic year: 2022

シェア "Informatica Enterprise Data Catalog"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

Informatica Enterprise Data Catalog

インテリジェントなデータカタログでデータの力を最大限に引き出す

データは経済の生命線であり、データ主導型の企業は自社のデータ資産を売上や利益に変えていま す。データ主導のデジタルトランスフォーメーションの第一歩は、データを企業の資産として管理する ことです。つまり、他の重要な設備投資や運用投資と同様に、データの在庫を調べ、その価値を評価 し、最大限に活用する必要があります。

データは多様化しているだけでなく、さまざまな部門やアプリケーション、データウェアハウスに分散 しているため(オンプレミス環境やクラウド環境)、どこにどのようなデータがあるのかを正確に把握 することが難しくなっています。ビッグデータの時代では、この状況がさらに複雑になります。

Informatica® Enterprise Data Catalogは、AI搭載のデータカタログです。機械学習ベースの探索エ ンジンを通じて、クラウド、オンプレミス、ビッグデータなどソースに関係なくデータ資産を全社規模 でスキャンおよびカタログ化することが可能です。Enterprise Data CatalogのCLAIRE™エンジンが、

メタデータを活用して、データ管理タスクに関する推奨、提案、自動化をインテリジェントに実行しま す。これにより、IT担当者の生産性が高まるとともに、業務担当者はデータの管理と使用について全 面的に協力できるようになります。

業務担当者とIT担当者は、パワフルなセマンティック検索、検索結果を絞り込む動的ファセット、デー タリネージ、プロファイリング統計、総体的な関係ビュー、データの類似性の提案、統合されたビジネ スグロッサリを利用できます。また、企業データ資産の管理を簡素化および効率化して、全社規模で データの価値を最大限に引き出せます。業務担当者は、データをすばやく見つけ出し、ビジネス用語 や定義、参考データなどのライフサイクルを簡単に管理できます。

Informatica Enterprise Data Catalog は、 AI 搭載のデータカタログです。機械 学習ベースの探索エンジンを通じて、クラウド、オンプレミス、ビッグデータな どソースに関係なくデータ資産を全社規模でスキャンおよびカタログ化する ことが可能です。

利点

• AI搭載のカタログ機能で社内のあ

らゆるタイプのデータを自動的に カタログ化および分類

• インテリジェントなキュレーション でドメインやエンティティを特定

• 管理されたクラウドソースの注釈を 使用してデータ資産をエンリッチ 化

• Googleのようなパワフルなセマン

ティック検索でデータ資産を発見

• リネージ、関係ビュー、データプロ ファイリング、品質統計などの総体 的なビューでデータ資産を探索お よび把握

• データ環境の全体像を把握

• オープンAPIを自社環境に統合し て、インテリジェントなメタデータ をあらゆる場所で活用

データシート

(2)

主な機能

メタデータAPIを自社環境に統合

Enterprise Data Catalogを使用してRESTベースのAPIを自社環境に統合することで、カタログのコン テンツをどこからでも利用できるようになります。インテリジェントなメタデータ(アプリケーション、

BIレポート、ダッシュボード)を業務担当者と共有できます。

Tableau向けプラグインでデータのガバナンスと信頼性を確保

Informatica Enterprise Data Catalog for Tableauにより、管理されたデータを使用する迅速なセルフ サービスアナリティクスが実現します。Tableauユーザーは、Enterprise Data Catalogのすべてのリソー スを活用してデータを視覚化できます。業務担当者は、ワークシート、ダッシュボード、データソースな どのビジネスコンテキストと技術コンテキストが並列表示されたTableauレポートを利用できます。

インテリジェントな機能を実装したセマンティック検索

パワフルなセマンティック検索とインテリジェントな機能を使用して、最も関連性の高いデータセッ トを検出、発見し、分析することができます。トークンマッチングを活用した高度なキーワード検索 では、カタログ内の最も関連性の高いデータ資産を見つけられます。セマンティック検索は参照先の データドメインにも適用されるため、データ資産が発見されずに見過ごされることはありません。検索 結果に基づいてインテリジェント機能を活用することで、関心のあるデータセットに検索を絞り込むこ とができます。

データリネージと影響分析

情報をわかりやすくまとめたビジネスフレンドリーなリネージビューを通して、データソースをインタラ クティブに追跡できます。これらのビューではエンドポイントに焦点が置かれ、その間にある複雑な 情報は表示されません。リネージビューはドリルダウンが可能で、すべてのリネージパスが展開可能な ため、さまざまな列やリネージダイアグラムの指標を確認できます。また、

上流/下流のデータ資産に関する詳細な影響分析を実行できます。

総体的な関係探索

ナレッジグラフにより、企業データや意義のあるデータの関係性を迅速に発見して総体的に把握でき ます。関連性の高いデータセット、技術、業務、セマンティクス、使用状況を基準にした関係の自動探 索も実行できます。総体的なデータビューには、関連するデータセット、テーブル、ビュー、データドメ イン、レポート、ユーザーが表示されます。このビューは、関心のある他のデータセットのプログレッシ ブ探索にも役立ちます。

ドメインとエンティティをインテリジェントに認識して分類を自動化

すべての構造化/非構造化データ資産に関して、ドメインやエンティティ(顧客、製品、注文など)を 項目、列、テーブルレベルで自動的に分類および特定します。これは、企業がデータ資産をカタログ化 して管理し、価値を引き出す態勢を構築するための重要なステップです。データを分類することで、

検索、検索結果の絞り込み、ビジネスグロッサリの提案を強化できます。インフォマティカは、電子 メールやクレジットカード番号、社会保障番号、国名や都市名、URL、会社名など、あらかじめ組み込 まれた60以上のデータドメインを提供します。ユーザーが作成したカスタムドメインを追加すること もできます。データ資産は、データルール(ルールで定義された特定のロジックに一致するデータがあ る列を検出)、または列名ルール(ルールで定義された列名のロジックと一致する列を検出)を使用 して分類できます。

(3)

1:スマートセマンティック検索機能と動的ファセットにより、データセットを手早く発見

統合データ品質統計

技術メタデータに加えて、データプロファイリング統計を確認し、データ資産の品質を把握してから、

データを分析に使用できます。プロファイリング統計には、値の分布やパターン、データタイプやデー タドメインの推測などがあります。

Informatica Axonのビジネスグロッサリの統合

Informatica Enterprise Data Catalogでは、用語、ポリシー、分類などのビジネスグロッサリ資産を

Informatica Axon™から簡単にインポートできます。ビジネス用語と適切な技術メタデータを関連付

けることで、データに質の高いビジネスコンテキストを付加できます。Informatica Enterprise Data

Catalogには、用語の関連付けを提案する機能もあります。この機能により、業務部門とIT部門のデー

タ管理者が連携しながら、人的ワークフローの効率的な自動化を含むビジネスメタデータを管理で きます。また、Informatica Business Glossaryやサードパーティツールからビジネスグロッサリ資産を インポートすることも可能です。

インテリジェントな類似データの提案機能

高度な統計アルゴリズムと機械学習アルゴリズムが、類似するデータとデータサブセットを特定しま す。このパワフルな機能によって、最も関連性の高い、信頼できるデータを見つけ出すことができま す。例えば、顧客の他社への乗り換えに関する分析に関心がある通信会社のアナリストが、当四半 期のプリペイドカスタマーの活動を含むデータのクエリを実行するとします。この場合、Informatica Enterprise Data Catalogは、よりクリーンなデータ(データの置き換え)、前四半期の顧客の活動を含 むデータ(結合可能なデータ)、データセットをエンリッチ化するための顧客情報テーブルを提案し ます。

(4)

ユニバーサルなメタデータ接続性

データベース、データウェアハウス、アプリケーション、クラウドデータストア、BIツール、Hadoop、

NoSQLなど、企業全体で使用しているあらゆるタイプのデータソースからメタデータを抽出します。メ

タデータの抽出をサポートしているデータソースの例は以下のとおりです。

• データベース:Oracle、MS SQL Server、Sybase ASE、IBM DB2、IBM Netezza、Teradata、JDBC、 MySQL、Amazon Redshift、Azure SQL DB、Azure SQL DW、PostgreSQL、Greenplum

• Hadoop:Cloudera Navigator、Hive(Cloudera/HW/MapR/HDInsights/EMR)、HDFS、 Hortonworks Atlas

• メインフレーム:DB2 z/OS、DB2 i5/OS、COBOL、JCL

• BI:SAP BusinessObjects、Tableau、Cognos、MicroStrategy、OBIEE、QlikView、Microsoft SSRS

• ETL:Informatica PowerCenter®、Informatica Big Data Management®、Informatica Cloud®、 Informatica Data Integration Hub、Microsoft SSIS、Oracle Warehouse Builder、Oracle Data Integrator

• ビジネスグロッサリ:Informatica Axon、Informatica Business Glossary

• データモデリング:ERWin

• ファイルシステム:HDFS、Amazon S3、Azure WASB、Azure Blob、Azure Data Lake Store、 Microsoft SharePoint、Microsoft OneDrive、Windows/Linuxファイルシステム

• アプリケーション:Salesforce、SAP、Oracle、Siebel、PeopleSoft、JD Edwards、Microsoft Dynamics、Informatica MDM

• 文書:MS Excel、MS Word、MS PowerPoint、Adobe PDF、フラットファイル、圧縮ファイル

PowerCenter |DQ | MDM BDM |MM |TDM|S@S BG | Axon | Informatica Cloud

インフォマティカ

Oracle | DB2 | DB2 for z/OS MS SQL Server |Sybase |Teradata

Netezza | MySQL | JDBC データベース

SAP R/3 |Salesforce Oracle |Siebel |PeopleSoft

JD Edwards |MS Dynamics アプリケーション HIVE(Cloudera、HortonWorks、

MapRIBM BigInsights EMRHDI HDFSCVSXMLJSON

AvroParquet Cloudera Navigator |Atlas

ビッグデータ

AWS S3CSVXMLJSON AWS Redshift | Azure SQL DW

Azure ADLS | Azure Blob クラウドプラットフォーム

Microsoft SSIS | SharePoint | OneDrive Oracle Warehouse Builder

Oracle Data Integrator ERWin Models |Custom Scanner

その他 MS Excel | Adobe PDF |

フラットファイル | MS PowerPoint | MS Word |圧縮ファイル

文書

Tableau |IBM Cognos| SAP BusinessObjects | QlikView

MicroStrategy |OBIEE ビジネスインテリジェンス

Enterprise Data Catalog

2Informatica Enterprise Data Catalogはユニバーサルなメタデータ接続性をサポート

カスタム属性とビジネス分類

クラウドソース対応の分類やエキスパート分類、コメント、適切なセキュリティ権限を持つユーザーが 利用可能なその他の属性を活用して、データセットをエンリッチ化します。カスタムの属性や注釈を、

ビジネスグロッサリの用語を含むデータセットに割り当てることで、業務部門とIT部門のコラボレー ションの強化や検索結果の向上を実現できます。

(5)

リソースレベルのセキュリティ

ユーザーやグループにリソースレベルで読み取り/書き込み権限を付与できます。ユーザーは、カスタ ム属性の閲覧/編集、ドメインキュレーションの実行、ビジネスグロッサリの用語の関連付けが可能 です。

ビッグデータの大規模導入

Enterprise Data Catalogは、ビッグデータの大規模導入用に構築されており、Hadoopクラスタに実装 できます。並列処理によるメタデータの取り込みと高速な分散インデクシングをサポートしているの で、カタログコンテンツを迅速に更新し、卓越した検索パフォーマンスを実現します。また、24時間 365日のフォールトトレランス性(耐障害性)を提供します。

統合システム管理

カタログリソース、メタデータ抽出スケジュール、プロファイリング実行などのタスクを統合システム管 理コンソールで管理および監視できます。ジョブコントロールダッシュボードでは、タスク監視ビュー やリソースビューを表示するウィジェットを利用できます。また、システム管理者は電子メールアラート を設定することで、カタログの問題にプロアクティブに対応することが可能になります。

3:データの関係を示す総体的なビューでデータを把握

利点

社内のあらゆるタイプのデータをインテリジェントにカタログ化

Informatica Enterprise Data Catalogは、企業内のさまざまなタイプのデータやその関係をインテリ ジェントに探索します。あらかじめ組み込まれたスキャナーが、データベース、データウェアハウス、ア プリケーション、クラウドデータストア、BIツール、Hadoop、NoSQLなどからメタデータを収集します。

すべてのメタデータは、迅速な更新やスマート検索、高速クエリを目的として設計された拡張可能な グラフデータベースでインデックス化され、カタログ化されます。生成されるデータ量が増えると共に 企業組織全体に広がっていくのに伴い、類似データや重複データが増えてしまうことは避けられませ ん。Informatica Enterprise Data Catalogは、高度な統計アルゴリズムと機械学習アルゴリズムを活用 して類似データとデータのサブセットを探索することで、ユーザーが必要としている最も関連性の高

(6)

Googleのようなパワフルなセマンティック検索でデータ資産を迅速に発見

何百もの企業システムの中から必要なデータを探すという作業は、時には実りのない無駄な労力に 思えることがあるかも知れません。包括的なメタデータサービスと拡張可能なインフラストラクチャ を基盤にしたパワフルなセマンティック検索機能がなければ、関連性のあるデータを見つけることさ えできないでしょう。Informatica Enterprise Data Catalogでは、セマンティック検索とインテリジェ ントな機能によって、検索結果を詳細に絞り込むことができます。ビジネスメタデータ、技術メタデー タ、運用メタデータが独自の方法で関連付けられているため、業務担当者はデータを探す際にビジ ネス用語を検索し、総体的な関係ビューを確認して、関連性のあるデータ資産を見つけることができ ます。

総体的な関係ビューとリネージでデータ資産を探索および把握

「測定できないものは管理できない」という格言がありますが、データ資産の管理についても同じこ とが言えます。データから価値を最大限に引き出すには、保有しているデータ、データの出所、データ の変更履歴、その信頼性を把握する必要があります。こうしたニーズに応えるInformatica Enterprise

Data Catalogでは、完全なエンドツーエンドのサマリーと詳細なリネージ、プロファイリング統計、総

体的な関係ビューを通じてさらに多くの情報が提供され、ユーザーはデータを明確に把握できます。

管理されたクラウドソースの注釈とビジネスコンテキストを使用してデータ資産をエンリッチ化 Informatica Enterprise Data Catalog(EDC)は、企業データ資産を項目/列レベルまで自動分類する ことで、データの再利用性と価値を最大化します。データの価値をさらに高めるために、EDCはクラウ ドソース対応のタグや注釈に加え、データの使用者や使用目的といったコンテキストも取得します。こ のような「集合知」を活用することでデータのエンリッチ化と取得を行い、全社規模でデータの有益 性をさらに高めることが可能になります。Informatica Enterprise Data CatalogはInformatica Axonと も統合可能で、ビジネス用語、定義、ポリシーなどのビジネスグロッサリをAxonから簡単にインポート できます。これらのビジネスメタデータは技術メタデータや運用メタデータと関連付けられるので、業 務アナリストやデータスチュワード(データ管理/案内人)などのユーザーは、データを迅速に発見、

把握し、協力してデータを活用することができます。

詳細はこちら

Informatica Enterprise Data Catalogの詳細については、

https://www.informatica.com/jp/products/big-data/enterprise-data-catalog.htmlをご覧ください。

IN06_0119_03238

105-6226 東京都港区愛宕2-5-1 愛宕グリーンヒルズMORIタワー26電話:03-6403-7600(代表) FAX03-3433-1021

© Copyright Informatica LLC 2019.Informatica、Informaticaロゴ、CLAIRE、AXON、PowerCenter、Big Data Management、Informatica Cloudは、米国およびその他の国におけるInformatica LLCの商 標または登録商標です。インフォマティカの商標の最新版は、https://www.informatica.com/jp/trademarks.htmlをご覧ください。その他すべての企業名および製品名は、各社が所有する商号または商標

インフォマティカについて デジタルトランスフォーメーショ ンによって我々の期待値が変化 しています。より良いサービスを、

素早く、便利に、低コストで利用 したいという期待が高まってい るのです。企業も状況に応じて 変化 する必 要があります。そし てそのヒントは「データ」にあり ます。

エンタープライズ 向けクラウド データ管理で世界をリードする インフォマティカは、俊敏性を高 め、新たな成長機会を実現する だけでなく、新たなイノベーショ ンを生み出すことさえ可能にする 将来への洞察力を提供します。イ ンフォマティカは、あらゆるデー タを徹底的に重視し、企業の成 功に必要とされる汎用性を提供 します。

インフォマティカは、企業がこれ からのインテリジェントな破 壊 的イノベーションを推進できるよ う、当社が提供するあらゆるサー ビスを通じてデータの力を継 続 的に引き出すことを支援します。

図 1 :スマートセマンティック検索機能と動的ファセットにより、データセットを手早く発見 統合データ品質統計 技術メタデータに加えて、データプロファイリング統計を確認し、データ資産の品質を把握してから、 データを分析に使用できます。プロファイリング統計には、値の分布やパターン、データタイプやデー タドメインの推測などがあります。 Informatica Axon のビジネスグロッサリの統合
Tableau   | IBM Cognos |   SAP BusinessObjects |  QlikView

参照

関連したドキュメント

る、関与していることに伴う、または関与することとなる重大なリスクがある、と合理的に 判断される者を特定したリストを指します 51 。Entity

 その後、徐々に「均等範囲 (range of equivalents) 」という表現をクレーム解釈の 基準として使用する判例が現れるようになり

HORS

テューリングは、数学者が紙と鉛筆を用いて計算を行う過程を極限まで抽象化することに よりテューリング機械の定義に到達した。

SUSE® Linux Enterprise Server 15 for AMD64 & Intel64 15S SLES SUSE® Linux Enterprise Server 12 for AMD64 & Intel64 12S. VMware vSphere® 7

Since the optimizing problem has a two-level hierarchical structure, this risk management algorithm is composed of two types of swarms that search in different levels,

LLVM から Haskell への変換は、各 LLVM 命令をそれと 同等な処理を行う Haskell のプログラムに変換することに より、実現される。

メモ  : 権利の詳細な管理は、 BlackBerry WorkspacesEnterprise ES モード BlackBerry Workspaces およ. び Enterprise ES ( 制限付きフルアクセス )