JBoss Enterprise Data Services Platform
による仮想データ統合ソリューションと
事例のご紹介
レッドハット株式会社
JBossサービス事業部
シニアソリューションアーキテクト
河野 恭之
市場のトレンド
Information as a Serviceとは
JBoss Enterprise Data Services 製品コンセプト
製品機能
導入イメージ
サーバ構成
導入プロセス
適用システム例
事例
よくある質問
アジェンダ
企業が扱うデータが飛躍的に増加傾向にある
調査会社によると2011年の世界のデータ量は1.8ZB。2年毎に
倍増
企業内SNSや、Twitter情報などを企業で活用する動きが加速
会社の統合、部門の統合、異業種との連携等で扱うデータは突
発的に飛躍的に増加する
データ統合の必要性と期待
重点投資の第一位は「データ量増大への対応」
データストアがシステム最適化されてサイロ状態である
関連会社や他部門システムのデータを柔軟に統合、共有できる
基盤が必要
既存のRDBMSとHadoopやKVSなどのビッグデータ等と連携で
きる基盤も今後必要
市場のトレンド
今日のITが直面している大きなギャップの1つは、“Information on demand”である。サ
イロ化された基盤制約の中から、
必要な情報を必要なフォーマットで要求される時間内に
得ることができる環境
、つまり、“Information as a Service” の導入戦略が重要である。
参考:March 10, 2008 http://www.infoworld.com/d/architecture/information-service-131
データ仮想化の
IaaS (information-as-a-service) は,ETL と DBMS 統合に変わり
、
優れたデータ管理とデータ統合となる。従来のETL および DBMS アプローチに比べ、次
のようなメリットがある。
– 仮想データが
短周期で作成可能であるため柔軟性と俊敏性が向上
– 物理的コピーの削減による
データ品質を改善できる
–
目的指向のビジネス用オブジェクト生成
による利用性の改善。
参考: Forrester June 15, 2011 Data Virtualization Reaches Critical Mass
複数のデータソースへ参照/更新する標準ベースのインタフェースを提供
データ仮想化によりデータの構造や項目を自由に変換
データをコピーせずにデータの統合を実現
監査証跡の取得や集中アクセスコントロールの基盤として利用可能
JBoss Enterprise Data Services 利用者
データ ソース 仮想データベース 物理モデル 論理モデル Web サービス I/F 各種DB 各種File Web サービス 各種AP サービス
企業内・外のあらゆるデータを
「モデリング」「仮想統合」「リアルタイム連携」する実行基盤
JBoss Enterprise Data Services Platformとは
メタデータリポジトリ 接続層 一般 アプリ ケーション レポート ツール SQ L (JD B C / ODBC) SO A P / RES T JBoss EDS JBoss EDS
J Bos s SOA -P J Bos s EDS
JBoss Enterprise Data Services Platform
全体アーキテクチャ
JDBC/ODBC/SOAP 接続 Function
Library
Cache Virtual Database (アーカイブファイル) 認証/ 認可 ログ出力 監査証跡 Query Engine(optimization) Connecter Framwork
JDBC LDAP File SOAP SFDC カスタム
リ ポ ジ ト リ
デザインツール
ランタイムエンジン
監視ツール
JBoss Developer Studio
XML 定義ファイル
Admin Shell
管理コンソール
データ ベース
LDAP File SOAP SFDC カスタム JDBC ODBC
SOAP JCR
仮想データベース
Data source Database Driver/Supported Interface/Notes
Oracle 10g R2/11g R2 Oracle JDBC Driver ※1
IBM DB2 9.1/9.7 IBM DB2 JDBC Universal Driver ※1 Microsoft SQL Server 2005, 2008 Microsoft SQL Server JDBC Driver 3.0
Sybase ASE 15 jConnect for JDBC3.0 v6.0.5 MySQL 5.0/5.1/5.5 mysql-connector-java ※1 PostgreSQL 8.3/8.4/9.1 JDBC4 PostgreSQL Driver, ※1
Teradata 12 Teradata JDBC driver, v13.00
Netezza 6.0.2 Netezza JDBC driver, v6.0.2
Greenplum Database 4.1 JDBC3 PostgreSQL Driver, Version 8.3-605
Ingres 10 Ingres JDBC driver, v3.0
Mondrian 3.0.x Jdbc4olap driver LDAP 3
Salesforce.com API version 21
ModeShape Metadata Repository via bundled ModeShape JDBC driver Files Delimited and Fixed-length
XML Files
XML over HTTP HTTP 1.1
SOAP Web Services SOAP 1.1, WSDL 1.2
Apache Hive (tech preview) v0.8.1 Hive JDBC driver Microsoft Excel 2003 JDBC-ODBC bridge driver Microsoft Access 2003 JDBC-ODBC bridge driver
JBoss Enterprise Data Services Platform 5.3
検証済みデータソース
物理モデル
接続情報
を含む物理データ
(DB、ファイル等)のメタモ
デル
関連情報(リレーション)
論理モデル
データの抽出や項目の変換で利
用する
表示用のメタモデル
論理的な階層関係
プロシージャ
データ登録
や引数を持たせて利
用したいビュー
セキュリティ
操作可否ロールの登録
操作(参照・更新)の設定
JBoss Enterprise Data Services Platform 5.3
仮想データベースの構成要素
JB oss E A P JBoss SO A -P JB o ss ED S VD B VD B JDBC Web サービス JDBC DB X DB Y DB Z ファイル SOAP SFDC ・・・論理モデル ・・・物理モデル ・・・プロシージャ ODBC
物理モデルの作成
既存の
システムから自動生成
データベースの接続情報
Oracel, DB2, SQL Serverは勿論
MySQL, Postgres 等をサポート
一般のJDBC接続をサポート
ファイルの定義情報
CSV
DDL やXSDなどの定義ファイル
その他
Webサービス
Sales Force
カスタマイズ接続
新機能
ガイドビューによる新しい支援ツール
固定長ファイルのウィザード
RESTサービス対応
JBoss Enterprise Data Services Platform 5.3
デザインツール(モデルジェネレーション)
論理モデルの作成
SQL言語
により生成
ドラッグ&ドロップによるテー
ブルの追加
マッピングツールによる項目の
抽出やWhere句の選択
SQLの直接入力に対応
コンパイルエンジンによるバリ
デーション機能
簡易テストツール(データのプ
レビュー表示機能)
更新処理
に対応
Insert/Update/Delete処理の
実装が可能
Procedureとして定義できるの
で特定のテーブルのみ更新や特
定の項目のみ更新などの柔軟な
処理の記述が可能
JBoss Enterprise Data Services Platform 5.3
デザインツール(グラフィカル変換ツール)
レポーティング機能
物理モデル
イメージのレポート
出力
モデルのリレーションをイメージ
で表示(外部キー関連)
論理モデルやプロシージャが参照
しているモデル(物理・論理)を
一覧で表示
物理的に異なるデータソースの
依
存関係を容易に確認
可能
項目の依存関係も一目で確認可能
モデルの構成情報
各モデルの情報(テーブル名、項
目名、プロパティ情報等)をCSV
等のフォーマットで出力
別のツールとの連携が可能
JBoss Enterprise Data Services Platform 5.3
デザインツール(レポーティングツール)
インバウンドインタフェース
JDBC/ODBC
PostgreSQLベースのドライバ提供
ロードバランス/フェイルオーバ
SOAP
I/F自動生成ツールの提供
HTTPロードバランサを用いたロー
ドバランス/フェイルオーバ
最適化クエリーエンジン
標準SQLのサポート
クエリープラン
Functionライブラリ
文字列、数値、日付等の関数を用意
独自の関数登録も可能
キャッシュ
ResultSet Cache
Materialized view サポート
新機能
EDSサーバサイドタイムアウト パフォーマンス(オフヒープバッファリング) SSO対応JBoss Enterprise Data Services Platform 5.3
ランタイムエンジン
J Bos s SOA -P J Bos s EDS JDBC/ODBC/SOAP 接続 Function Library Cache Virtual Database 認証/ 認可 ログ出力 監査証跡 Query Engine(optimization) Connecter FramworkJDBC LDAP File SOAP SFDC カスタム
リ ポ ジ ト リ データ ベース
LDAP File SOAP SFDC カスタム JDBC ODBC
サーバ構成イメージ
JBoss Enterprise Application Platform 顧客DB ローカルDB (リポジトリ/外 部キャッシュ用)履歴DB
JBoss Enterprise Data
Services
売上DB
APサーバ
(データ活用レイヤ)
JBoss Enterprise Application Platform
JBoss Enterprise Data
Services
JBoss Enterprise Application Platform JBoss Enterprise Application Platform EDSサーバ (データ仮想統合レイヤ) データベース (データソースレイヤ)
導入プロセスイメージ
プロトタイプ検証により、活用イメージ、導入プロセスを把握
スモールスタートで成功確認後に順次対象範囲を拡大
実際にデータに接続する事によって、 導入プロセスの把握 開発容易性、変更柔軟性を確認 活用イメージの把握 導入ゴールの設定 要件定義の実施 導入スケジュールの確定 EDS環境の構築(開発、品証、本番) アプリケーションの設計・開発 仮想データベースの設計・開発 シミュレーションとクレンジング・名寄せ 定期的な品質チェック 定期的なクレンジング・名寄せプロトタイプ検証の実施
導入プロジェクト要件定義
導入プロジェクト実施
本番運用定着化
検証作業イメージ
フェーズ
1カ月
2カ月
3カ月
要件定義
設計
実装
テスト
評価検討
レッドハット
サポート
(コンサルティング)
検証目的・ 内容検討 仮想DB(物理・論理 モデル) プロトAP テストシナ リオ作成 検証環 境構築 検証 作業 検証結果 報告書 作成 プロトAP作成 仮想DB作成 製品トレー ニング 設計支援 実装支援 環境構 築支援 検証結果 報告書 作成支援 製品サポート テスト支援 テスト設計 支援
データ連携基盤
リアルタイムBIデータ生成基盤
リアルタイムマスタデータマネージメント基盤
データアクセス一元化
共通データモデルの構築
適用システム例
ポイント ・DB/ファイルはシステムや組織内で利用 ・他のシステムや組織から情報を取得するには 個別に調整が必要 課題 ・取得時にデータの場所やI/F等の調整が大変 ・データ利用の状況が不透明でデータの変更時 の影響が見えない ・重複データが多数 ポイント ・既存の仕組みはそのままで共有データをEDSに展開 ・個別システムからの導入(スモールスタート)も可能 効果 ・各システムからのデータ取得が容易 ・データの再利用性が格段に向上 ・データ変更時の影響を最小化 ・共通モデル利用することで再利用性や管理性の更なる 向上が可能
仮想データ統合による「データ連携基盤」の導入
DB群 DB群 DB群 ファイル群 Xシステム DB群 DB群 DB群 ファイル群 DB群 DB群 DB群 ファイル群 Y組織 Z支店 DB群 DB群 DB群 ファイル群 DB群 DB群 DB群 ファイル群 DB群 DB群 DB群 ファイル群 Xシステム データ群 Y組織 DB Xシステム データ群 EDS Xシステム Y組織 Z支店ポイント ・ ETLにより分散したデータをBI製品が指定す るDWHに収集 課題 ・ 分析の為だけのデータレイヤの増加 ・DWH+ETLライセンスで非常に高価 ・月次・日次のバッチデータ(鮮度劣化) ・取得データの変更時の影響が大きい 仮想統合 DWH ポイント ・EDSを用いて仮想DWHを構築 ・DWHはデータソースの一つ(又は利用しない) 効果 - DB、ファイル等のデータソースの追加が容易 - DWHを使用しないパターンではEDSへの投資 のみでDWHを実現可能 - データが増加してもデータバックアップの手間 やストレージの追加が不要
仮想データ統合によるリアルタイムBIの実現
BIシステム EDS X‘ DB Y‘ DB xx DB DB yy DB zz BIシステム DWH ETL DWH 売上げ/ 注文情報
仮想データ統合
複数のデータソースのデータを
物理ではなく仮想で統合
統合処理の開発を容易に実現
リアルタイム統合を実現
仮想データベース
データアクセスを集中管理
(アクセス制御、監査証跡)
標準データモデルの構築
エンタープライズデータ管理の
実現
利用パターンの違い
「仮想データ統合」と「仮想データベース」
検討ポイント
仮想データ統合
データベース仮想化
必要な機能
・複数データソースの統合 ・複雑な統合処理の容易な開発 ・更新処理(主に参照) ・データモデルの自由な変更 (名前、制約、インデックス) ・更新処理課題となる点
・データソースの種類 ・複雑な統合処理の開発 ・分散トランザクション ・パフォーマンス(大量データ) ・SQLの方言の対応 ・排他処理JBoss EDS によ
る解決
・カスタマイズを含む多種のデータソー スをサポート ・プログラムレスの開発環境を提供 ・XAトランザクション対応 ・オーバーヘッドを最小化 ・SQL最適化の実現 ・アクセス制御、監査証跡検討外
・大量データの扱い ・排他処理 ・複雑な統合処理 (データベース側で実行)ターゲットシス
テム
・リアルタイムBI ・MDM ・データ連携基盤 ・共通モデル ・アクセス一元化システム ・エンタープライズデータ管理 ・データベース移行 ・データ連携基盤利用パターンによる検討ポイントの違い
参考:エンタープライズデータ管理
実世界の業務
概念データモデル
物理データ
モデル
DA : データ管理者
DBA : データベース管理者
構築
運用
保守
論理データ
モデル
論理データ
モデル
重要!!
業種
適用システム
MDM BI カテゴリ補足
View 共通 モデル 連携 基盤 補足 1 証券 顧客情報統合ビュー ○ 支店間のDB仮想統合 2 金融 取引ダッシュボード ○ 不正取引検知 3 金融 コンプライアンス規制対応 ○ データファイアフォール VSISA PCI 対応 4 金融 顧客/製品ビュー ○ 360°ビュー 5 保険 共通サービス連携基盤 ○ ○ 共通モデル/SOA データモデル標準化 6 医薬 顧客/従業員ビュー ○ レガシーDBの廃止 SalesForce との統合 7 医薬 分析レポート ○ 8 医薬 DWHセキュリティ統合 統合LDAP ポータル統合 9 公共 反薬物ネットワーク ○ ○ 写真を含むデータ検索 10 公共 統合データ検索システム ○ 11 公共 通信情報アセスメント ○ 12 公共 社会保障管理システム ○ ODS統合 ルールエンジン統合 13 公共 住民情報統合システム ○ ○ CRMデータ統合 14 政府機関 データ統合基盤 ○ 共通モデル 公共機関標準モデル 15 政府機関 グローバル戦闘支援システム ○ 人員や装備の管理 16 政府機関 指揮管理システム ○ データ統合 17 製造業 サプライチェーンデータ統合 ○ 仮想統合 18 通信業 共通サービス連携基盤 ○ SOA基盤 19 サービス 共通データハブ基盤 ○ データ統合 クラウドサービス 20 サービス データ連携基盤 ○ クラウドデータ連携 AMAZON上で構築事例一覧
課題
財務損失となるような問題となる取引を特定する
ためにデリバティブの取引データにアクセスする
必要がある
取引データは多くのシステムにまたがっている
ソリューション
全ての取引データをリアルタイムに取得できるシ
ングルビューに集約
データの違いを変換
ビジネス効果
リスク低下による投資家の投資額増
開発時間とコストの削減
将来のデータ変更に対する容易な管理の実現
米国大手金融会社:デリバティブ取引ダッシュボード
JB oss EDS Data Model Data ModelData Model Data Model
チャレンジ
VISA PCI がカードホルダ情報保護を義務づけ
複数データストアにまたがる共通セキュリテリ
ポリシーの実現が困難
ソリューション
複数のデータストアにまたがる「データファイ
アウォール」を作成するために「EDS」を選択
データは複製ではなく連携
全てのソースをまたがる共通アクセスポリシー
共通データ定義
監査証跡
ビジネス効果
データセキュリテリポリシーの定義は一つ
データを保護規制準拠の実現
大手金融会社:コンプライアンス強化
JB oss EDS Data Model Data ModelData Model Data Model