• 検索結果がありません。

データマネジメントを取り巻く IT の課題 大規模データの実践的活用に向けて レッドハット株式会社 Senior Solution Architect and Cloud Evangelist 中井悦司 2012/04/13 version1.0

N/A
N/A
Protected

Academic year: 2021

シェア "データマネジメントを取り巻く IT の課題 大規模データの実践的活用に向けて レッドハット株式会社 Senior Solution Architect and Cloud Evangelist 中井悦司 2012/04/13 version1.0"

Copied!
25
0
0

読み込み中.... (全文を見る)

全文

(1)

データマネジメントを取り巻く IT の課題

~大規模データの実践的活用に向けて〜

レッドハット株式会社

Senior Solution Architect

and Cloud Evangelist

中井悦司

(2)
(3)

Contents

ビジネスにおけるデータの役割

企業データの構造変化とデータマネジメントの課題

これからのビジネスを支える新しいデータ構造

(4)
(5)

ビジネスモデルが決定するデータ構造

ビジネス構造

RDB

IT システムが扱う「データ構造」は、それが支える「ビジネス構造」

から決定されます。

ビジネスがデータ構造を生むのがこれまでの常識

データ構造からビジネスを生むことは可能なのでしょうか?

データ構造

(データモデル)

(6)

「ページランク」の発見?発明?

Google がウェブページの重要度を決定するために使用する、ウェブ

ページ間の参照構造が「ページランク」

「 Google はページランクというデータ構造を発見

することで、検索精度を向上させることに成功した」

「 Google は検索精度を向上させるために、

ページランクというデータ構造を発明した」

どちらの説明が正しいでしょうか?

(7)

データ構造の多様化が生み出す新しいデータストア技術

NoSQL などの新しいデータストア技術が取り

上げられる背景には、「従来の RDB では表現

できない構造のデータ」を取り扱うビジネス

の出現があります。

オブジェクト

ストレージ

NoSQL

グラフ

データベース

列指向

データベース

RDB

データマネジメントを課題を正しく捉えるには、

データ量の変化だけではなく、

「データ構造の変化」の視点が必要です。

(8)

ビジネスの進化とデータ構造の進化

複雑

単純

データ量

データ構造

少ない

多い

IT 黎明期の

データ領域

現在のデータマネジメント

の課題領域

IT 化するビジネスの増加

に伴うデータ構造の複雑化

新しいタイプのデータを

活用したビジネスの出現

ビジネス特性に応じたデータマネジメントの

手法/ツールの適用が求められます。

取り扱うデータの「鮮度」を

担保する手法も考慮が必要

(9)

企業データの構造変化と

データマネジメントの課題

(10)

データ構造の複雑化におけるビジネス要因とは?

複雑

単純

データ量

データ構造

少ない

多い

IT 黎明期の

データ領域

現在のデータマネジメント

の課題領域

IT 化するビジネスの増加

に伴うデータ構造の複雑化

具体的な複雑化の中身は?

データマネジメントの課題は?

(11)

複数視点でのデータ管理に伴う「データのサイロ化」

ビジネスのさまざまな側面の IT 化に伴ない、異なるデータ構造を持つサイロ

型システムが構築され、結果的に「データのサイロ化」が発生しています。

ビジネス構造

データ構造

ビジネス構造

データ構造

ビジネス構造

データ構造

・・・

データマネジメントの主要課題:重複データの整合性確保、データ鮮度の担保、 etc...

CRM

販売管理システム

カスタマサポート

経営情報システム

営業店システム

(12)

販売管理

システム

CRM

カスタマー

サポート

営業店

システム

経営情報

システム

名前

所属

商品

価格

購買記録

電話番号

会社名

在庫数

倉庫

型番

地域

カテゴリ

マスタデータの集中管理による解決案

実際のところ、

実現容易性は?

(13)

販売管理

システム

CRM

カスタマー

サポート

営業店

システム

経営情報

システム

名前

所属

商品

価格

購買記録

電話番号

会社名

在庫数

倉庫

型番

名前

所属

商品

価格

購買記録

電話番号

会社名

在庫数

倉庫

型番

地域

カテゴリ

地域

カテゴリ

データの移動/複製による管理の発生

ビジネス要求に対する

情報鮮度と柔軟性は?

(14)

レッドハットの提案:「仮想マスタ」によるデータ統合

W e b サ ー ビ ス O D B C J D B C

データソース

アプリケーション

データ

ベース

DWH

Web

サービス

AP データ

既存のデータソースを仮想統合し、データベースや Web サービスで利用

異種データストアへのリアルタイム読み込み/書き込み

分散データへの単純アクセスによるアプリケーションのスピード開発

データソースの物理構造や論理構造の変化をアプリケーションから隠蔽

物理的に異なるデータソースの依存関係を可視化

集中アクセスコントロール、監査

JBoss Enterprise Data Service Platform

(15)

統合マスタ

販売

仮想マスタ

顧客

仮想マスタ

サポート

仮想マスタ

・ 仮想統合 = 必要な情報を必要な時に抽出

・ リアルタイムで鮮度の高い情報を提供

・ 各システムに合わせた柔軟なデータモデル構築

・ キャッシュ技術による高速化

グローバル営業

販売システム

グローバル顧客

管理システム

グローバル保守

サービスシステム

バッチ連携

リアルタイム連携

US

マスタ DB

トップ

ダウン

ボトム

アップ

仮想化レイア

JBoss EDS が実現する「仮想マスタ」によるデータ統合

グローバル営業

販売システム

グローバル顧客

管理システム

グローバル保守

サービスシステム

トップ

ダウン

日本

マスタ DB

ヨーロッパ

マスタ DB

US

マスタ DB

日本

マスタ DB

ヨーロッパ

マスタ DB

詳細はこの後の

セッションでご紹介

考え方はトップダウン

実装はボトムアップ

2 つのアプローチの

「いいとこ取り」を実現

(16)

これからのビジネスを支える

新しいデータ構造

(17)

ビジネスの進化とデータ構造の進化

複雑

単純

データ量

データ構造

少ない

多い

IT 黎明期の

データ領域

現在のデータマネジメント

の課題領域

新しいタイプのデータを

活用したビジネスの出現

具体的なビジネスの形態は?

データ構造の特徴は?

(18)

「ビッグデータ」と「非構造化データ」の神話

ビジネスの目的に応じて、適切な構

造をもたせることがデータ活用の本

質です。

「非構造化データ」とは、「従来の

RDB では表現できない構造を持つ

データ」と捉えるのが正解。

「構造のない大量データ」にビジネス価値はありません!

「ビッグデータ」=「大量データ」?

「非構造化データ」=「構造のないデータ」?

(19)

新しいデータ構造を生み出したビジネスの例

SNS は(ソーシャルネットワークサービス)は、「ネットワーク上の

人間関係」という新しいデータを活用したビジネス

→ そのためのデータを収集するための「仕組み」が SNS

新しいデータ構造/データ特性に

対応したデータストアの活用が

求められています。

オブジェクト

ストレージ

NoSQL

グラフ

データベース

列指向

データベース

とは言うものの・・・

適切なデータストアを

どのように選べばよい?

既存業務データとの

連係/再活用は可能?

(20)

レッドハットの提案:ソフトウェアストレージの活用に

よる大量データのアプリケーション連係

レッドハットが目指す「ソフトウェアストレージ」の特徴

→ コモディティハードウェアとオープンソース・ソフトウェアの組み合わせで、新たなデータ 

 構造の大量データ処理に最適な「ストレージインフラ」を実現します。

ボトルネックを持たないスケールアウト型設計により、大量データへの並列アクセスに対応

複数の API を提供することで、さまざまな観点でのアプリケーション処理を実現

レプリケーション機能により、必要なデータを必要なユーザ(アプリケーション)の下に事

前配置

冗長配置、重複排除、マルチテナンシー、ファイル配置の最適化、など

スケールアウト型

ソフトウェアストレージ

NFS/CIFS

REST

NAS

オブジェクト

ストレージ

Hadoop

API

RHEV

API

NoSQL

仮想マシン

ディスク

・・・

Red Hat Storage は、

「データストアの選択にビジネスが束縛されない環境」

を実現する新しいソフトウェアストレージ技術

(21)
(22)

大規模データ活用の現状と課題

出典:「企業システムにおける大規模データの活用と Hadoop の動向」

従来の構造化データ処理

新たな構造化データ

大規模データ/非構造化データは

「ただ集めるだけ」では活用できません

(23)

Red Hat Storage

データマネジメントソリューションによる

大規模データ活用

出典:「企業システムにおける大規模データの活用と Hadoop の動向」

   G-CLOUD Magazine 2011 ( 2011/02/11 )

従来の構造化データ処理

新たな構造化データ

ルールエンジン

/ イベントプロセッシング

仮想データ統合

ビジネスルールに基づく

データ抽出/加工/アクション

既存業務とのデータ連携

データマネジメント技術の活用で、大規模データの

業務連携に向けた「仮説 / 検証」を実現

詳細はこの後の

セッションでご紹介

(24)
(25)

WE CAN DO MORE

WHEN WE WORK TOGETHER

THE OPEN SOURCE WAY

参照

関連したドキュメント

名刺の裏面に、個人用携帯電話番号、会社ロゴなどの重要な情

浜松営業所 浜松市中区佐藤1丁目4番22号 滋賀営業所 滋賀県栗東市手原五丁目5番9号 姫路営業所 兵庫県姫路市東雲町一丁目10番地

          ITEC INTERNATIONAL 株式会社. 型名

当協会に対する 指定代表者名 代表取締役.. 支店営業所等

在学中に学生ITベンチャー経営者として、様々な技術を事業化。同大卒業後、社会的

三洋電機株式会社 住友電気工業株式会社 ソニー株式会社 株式会社東芝 日本電気株式会社 パナソニック株式会社 株式会社日立製作所

○特定健診・保健指導機関の郵便番号、所在地、名称、電話番号 ○医師の氏名 ○被保険者証の記号 及び番号

関係会社の投融資の評価の際には、会社は業績が悪化