• 検索結果がありません。

5年前の20126月、SAPジャパンは ニーズを先取りして、ビッグデータ解析 機能を強化した「SAP HANAインメモリデータベース」の 最新サービ

スパックとしてSAP HANA SP4を発表しました。

ビジネス向け関数群や 予測分析関数群の追加や機能強化が行われ、構造、

非構造化された コンテンツから テキスト検索をします。

ビッグデータ解析機能は、オープンソース統計言 語「R」との連係機能の強化と、HANA向け独自 関数群「Predictive Algoritm Library (Pal)

Business Function Library (BFL)」を拡充し

現在はない機能ですが、将来は収益機会や高度な予測分析をしてビッグデー タ解析に対応しようとしています。

SAP HANAは「リアルタ イム」という要素を最重視 した設計となっています。

「リアルタイムにデータを ロードし、リアルタイムに計 算、分析し、リアルタイム に実行される」というのが コンセプトです。

SAP HANAは、いくつかの要素技術と 独自技術を融合させることで、

パフォーマンスを 向上させています。

さらに、SAP HANAの開発 に当たって インテルとの

パートナーシップに基づき、大 量のアプリケーションコードが チップ上で最適に動作するよ うに設計しています。

まず「カラムストア」を使うことで50100倍の処理性能が期待でき、さらに

超配列処理 (MPP : Massively Parallel Processing) という大規模な配列分散 処理により、データベースの処理性能を数倍に引き上げようとしています。

SAP HANA」は、強力な演算エンジン と データベースをメインメモリー上に 統合し、メモリー上でデータを処理することで 大量データの リアルタイム 分析を可能とする SAP社のソフトウェア製品です。

業務データや分析用データ、Webデータなど各種データを対象に分析可能で たとえば、小売業の製品発注における計画、予測立案や価格設定の最適化 などを迅速に実現します。

「SAP HANA」は、大量データをサーバーのメインメモリーでリアルタイムに 処理する インメモリー・コンピューティング技術です。

これは、メモリー大容量化、マルチコア化、分散並列処理技術、高度圧縮技 術、カラム型技術 といったハードウェア、ソフトウェアのテクノロジーの

飛躍的な進化により、実現された技術です。

大規模なデータベースから データを吸い上げて 加工・

集計し、モバイルで利用する までにかかっていた作業時 間を大幅に短縮し、わずか 数秒で必要なデータを利用 できるようになります。

インメモリデータベース

in-memory database, IMDB

ハイブリッド型の インメモリデータベース

グラフの水色の線が一般的なディスク型データベースのスループット値で、ピン クの線がインメモリデータベースのスループット値。 このパフォーマンステスト は、同一のハードウェア・OS構成で実施され、ディスク型が約16000TPS

B+ ツリー構造 と T ツリー(カスタマイズ Vtrie ツリー)構造

Tツリー(Vtrie)では、検索データを見つけるまでのパスを少なくすることで 高速化を実現しています。

補足:

パーシステンス :persistence

パーシステンスとは永続性のこと。

主にデータの永続、保持と意味で使われます。

プログラムは メモリ上でデータを管理しますが、

メモリはプログラムが終了すればデータも失われま す。

そのためプログラムが終了してもなんらかの方法で データを保存しておくことを パーシステンスといいま す。

データの永続化は通常のデータであれば簡単です が、構造化され他のデータと複雑にリンクされてい る オブジェクト・データを パーシステンスするのは 大きな課題となっています。

データ永続性の保証の仕組み

チェックポイント間でサーバに障害が発生しても、ディスク上に一貫したデータの

補足: カラムストア

列指向のデータベース:

通常のデータベースが行指向で追加・更 新・削除のようなトランザウション処理が 得意なのに対し、カラムストアは列を抜き 出して捜査する集計処理が得意です。

配列分散処理

並列処理 1つの問題を分敵して複数の コンピューターで、高速に並列に処理する ように実現したシステムです。 負荷分散、

機能分散など。

SAP HANA

SAP HANAでは、ビツグデータの分析を容易にするほか、SAP製データウェ アハウス構築ソフト「SAP BW」のデータベースとして利用が可能です。

ここでは HANAの機能についてご紹介します。

インメモリ技術を活用した分析アプライアンス

SAP HANAは、インメモリデータベース技術 を利用してデータ処理を高速化する

アブライアンス製品です。

HANAは、「High-Performance Analytic Appliance」の略で、演算エンジンと

データベースを インメモリ上に統合、ビジネス

一般的なBI (ビジネスィンテリジェンス) システムでは、ERP (統合基幹業務シ ステム) CRM(顧客情報管理システム) 等の業務系システムからデータを ロードし、 分析しやすいように データを加工・集計し、目的別のデータマートに クエリを かける という仕組みです。

基本的には、 業務システムからの データロードに バッチ処理で約1日、

データ加工集計で 数時間から1日、ユーザーがかけたクエリ処理に 数分から数十分と、それぞれ時間がかかります。

HANASAP社が買収した「Sybase」の リアルタイム同期、 SAPのインメモリ、

BusinessObjects のリアルタイム検索等、

それぞれの技術を活用し、すべての工程を 数秒で処理することができます。

補足: データマート【 Data Mart 】

企業のあらゆる情報を格納した データウェアハウスから、特定の部門が必要 とするデータを抜き出した 部分集合(サブセット)。

データマートの実体は、データ ベースとその解析・視覚化ツー ルの組み合わせです。

データマートは開発部門、営業 部門、経理部門など各部門ご とに構築され、それぞれの部 門の要求に応じて解析・視覚 化が行えるようになっています。

クエリー 【 query

データベース管理システムに対する処理要求 (問い合わせ) を文字列として表 したもの。データの検索や更新、削除などの命令をシステムに発行するのに 使われます。

検索クエリーでは、対象となるテーブルやデータの抽出条件、並べ方などを 指定します。 一度作成したクエリーは保存しておいて何度も使うことができ るようになっているものが多いです。 リレーショナルデータベースでは、クエ リーの記述にSQLという言語を使うことがほとんどです。

BW用データベース

現在、 BW用のデータベースとして 日本オラクル社の「Oracle Database」 や、

IBM社の「DB2」、日本マイクロソフトの「SQL server」等を利用できます。

HANA SP3 から これらのデータベースの代わりに HANAを選択できるように なります。

バックアップやリストア、セキユリ ティ、監査、意見管理といった管 理機能も強化され、データ分析 やシミュレーションを支援する関 数群である 「ビジネス ファンク ションライブラリ」や「予備アルゴ リズムライブラリ」 も提供されて

このほかにも ERPのデータを リアルタイムで複製 (レプリケーション) する

「SLT」 と呼ぶ機能も搭載され、SAP以外の製品のデータも SAP ERPのデータ と同じく、リアルタイムに複製が可能になります。

HANAのこれからの可能性

インメモリデータベース を「ビッグデータ」 のソリューションと位置付けるのは 実のところ、かなり無理があります。 メインメモリに収まる程度のデータは、

例えテラバイト であっても小さいものです。

近年、 Amazon Web Services (AWS)上で 展開するSAP HANA One プラッ トフォームの提供を開始しました。 AWS Marketplace から利用できます。

AWSで 提供されるSAP HANA One とアプライアンス製品の「SAP HANA Platform Edition」フルバージョンと、同等の機能を利用できるというSAP ジャパンの発表です。

SAP HANA One では小規模なデータセットを対象とした環境を、クラウド上に 数分で構築できることから、独立系ソフトウェアベンダ や スタートアップ企 業での採用を期待しています。

パーシステンスサービス を利用すれば、SAP Sybase ASE やSAP HANAに データ蓄積がで きます。

そして従来のHANAにも 機能強化が行われています。 データベースの中に HTML5 やJavaScript に対応したアプリケーションサーバーを組み込むこと で アプリケーションレイヤーを削減し、データ処理を高速化することを狙って います。

併せて開発環境である SAP HANA Studio も機能強化を行い、データ処理では SQLScript を、ロジック制御ではJavaScriptを、 UI(ユーザーインターフェイス) 開発では HTML5を 同一の開発環境下で 実装できるように なっています。

SAP HANA Studioは、今後はモデリング や デバッグ作業の改善、チーム開発 環境支援のほか、リポジトリブラウザ や プロジェクト管理機能の追加が予定 されています。

SAP HANA One でも SAP HANA Studio が使えます。

SAPが真の意昧で「ビッグデータ」の分析を推進するのであれば、Sybaseの 技術をより 強く活用できた時であると思います。

HTML5

Webページの記述などに用いるマークアップ言語、HTMLの第5版。WHATWGの提 唱した仕様を元に、Web関連技術を標準化しているW3Cで仕様の検討・標準化 が進められています。

従来、動画やアニメーションなどを含むマルチメディアコンテンツや、操作性や表現 力に優れたWebアプリケーション(RIA)は、JavaアプレットやFlash、Silverlightなど特 定の技術やプラグインを必要としていましたが、HTML5を利用すれば標準仕様に 則ってこうしたWebコンテンツを開発することができ、HTML5対応Webブラウザで閲 覧・利用することができるようになると期待されています。

関連したドキュメント