EMC-greenplum-SG s-1p

(1)

1 データ・ウェアハウスの未来をリードするGreenplum DB

2 ビッグデータ活用でビジネス変革を実現

企業向け次世代Hadoopソリューション Greenplum MR

18 徹底解説

EMCジャパン株式会社東京都渋谷区代々木2-1-1 新宿マインズタワー〒151-0053 http://japan.emc.com お問い合わせは http://japan.emc.com/contact/

EMC2、EMC、Greenplum、Greenplum DatabaseおよびEMCロゴは、EMC Corporationの登録商標、または商標です。

これらの商標は、日本または諸外国で商標登録等により、適用法令で守られている場合があります。他のすべての名称ならびに製品についての商標は、それぞれの所有者の商標または商標登録です。

SG1038-1 02/12

Greenplum MR (旧Greenplum HD）が

「 ITpro EXPO AWARD 優秀賞」

を受賞しました

第1版

(2)

バッチ処理・データ解析における汎用RDBMSの課題

Greenplum DBのアーキテクチャの話をする前に、これまでデータベース分野でされてきた議論を、今、一度振り返ってみます。データベースの分野では、これまで大きく2つのアーキテクチャが議論されてきました。 1つがシェアードエブリシングです。シェアードエブリシングというのは、1台のサーバ・ストレージの中に、必要なデータを全て詰め込み、この1台のサーバで、全てのデータベースの処理をしようというアプローチです。シェアードエブリシング・アーキテクチャで、最も有名なのはOracleデータベース、IBM／DB2、あるいはMS SQL Server、PostgreSQL、MySQLのようなデータベースです。一般的にデータベースといわれるものは、基本的にはシェアードエブリシングと考えてよいでしょう。シェアードエブリシング・アーキテクチャはOLTPの処理には非常に向いていますが、バッチ処理やデータウェアハウスの処理には不向きとされています。何故かというと、OLTPのように、1件のデータを抜き出すというのではなくて、全てのデータを一気にスキャンする、あるいはテーブルをJOINするなど、一気にデータを読みだして処理をするところで、IOボトルネックが発生しやすいのです。1台のサーバで全てのデータを扱うため、CPU、メモリのボトルネックだけでなく、プロセス自身のボトルネックも発生しやすいと言えます。このシェアードエブリシング・アーキテクチャのシステムで大量データ処理の性能を向上させるために何をするかというと、1台のサーバ・ストレージにできるだけ多くのハードウェア・リソースを追加していくことでした。まず、CPUを10、20、30、40と増やしていくわけです。しかしながら、それで性能が伸びるかというと、その保証はありません。次に、ストレージ・ボトルネックが発生し、性能がそのボトルネックに引っ張られてしまう。そのボトルネックを解消するために、ストレージを増設し強化する。増設したからといって、性能が伸びるのかというと、次はまたCPUがボトルネックになってしまう。このようなイタチごっこが、シェアードエブリシング・アーキテクチャが、データウェアハウス処理、バッチ処理に向いてないとされてきた理由です。

シェアードナッシング・アーキテクチャ

この課題を解決するアーキテクチャとして、考え出されたのが、シェアードナッシング・アーキテクチャです。このシェアードナッシング・アーキテクチャというのは、一つのデータを分割して複数のサーバに小分けにして処理をする、という考え方です。複数の小さなサーバを水平方向に並べて、1台のサーバが処理しなければならないデータの量を少なくすることで、ストレージの負荷を低くします。これによりIOボトルネックを解消します。加えて、サーバのメモリ上に読み出したデータも少ないため、CPUとメモリのボトルネックも解消できます。このような利点をもつものがシェアードナッシング・アーキテクチャです。このシェアードナッシング・アーキテクチャは、特に新しいアーキテクチャでありません。既に30年以上前からこの業界では使われてきたアーキテクチャであり、古くはTeradataが、このアーキテクチャで実績を上げてきました。しかしこのシェアードナッシング・アーキテクチャにはコストの課題がありました。例えば、Teradataですと、サーバを並列に並べて、このお互いのサーバがデータを通信するのですが、そのためのインタコネクトにバイネットというデータウェアハウス向けの独自のテクノロジーが必要でした。バイネットは、専用のハードウェアで動くもので、必然的にコストが上がっていくというのが課題でした。あるいは他社の例では、インタコネクトに加えてCPUも独自に開発をしていて、そこがハードウェアを縛る原因になり、必ずコストが上がるような状況を招いていました。これらのような理由で、なかなかデータウェアハウス・システムのコストを下げることができない状況が続いていたのです。経済的に余裕のある企業がかなり大きな投資を行う。これがこれまでのデータウェアハウスのシステムでした。 Greenplum DBは、データウェアハウス分野のためのデータベースであり、当然このシェアードナッシング・アーキテクチャを採用しています。しかしながら、それを構成するハードウェアは特別なものに縛られるということがありません。サーバ同士を繋げるためのインタコネクトは通常のイーサネットスイッチを使うことができます。また、Greenplum DB自体はコモディティ化された普通のＩＡサーバ上で動作します。Linux OSが動けば、全てGreenplum DBの対象プラットフォームになります。Greenplum DBは、シェアードナッシング・アーキテクチャでありながら、特定のハードウェアに縛られずに簡単にデータウェアハウス環境が構築できるのです。 Buffers Locks Control Blocks 集計が集中ソートが集中結合処理が集中スキャンが集中サーバ#1 シェアードエブリシング Buffers Locks Buffers Locks Buffers Locks Control Blocks Control Blocks Control Blocks

サーバ#1 サーバ#2 サーバ#3 スキャン・結合・ソート・集計を並列化シェアードナッシング

徹底解説その１

データ・ウェアハウスの未来をリードするGreenplum DB

図1: シェアードエブリシングとシェアードナッシング・アーキテクチャ Greenplum DBはデータウェアハウス、バッチ処理のための高速データベースです。構造化データを対象にしたビッグデータの分析を低コストで高速に実行する基盤として利用できます。ここでは、Greenplum DBの先進機能、利用例を紹介しながらGreenplum DBのアーキテクチャを説明します。

Greenplum DB

の特徴・アーキテクチャを理解する

Greenplum DBの位置づけ

次に、Greenplum DBがシステムの中のどこに位置付けられているのかを確認してみましょう。一番左は基幹系のデータベースです。日中にトランザクション処理をするためのデータベースで、OracleやIBM DB2、MySQLなどが使われています。これらのデータベースから日中のトランザクションを吸いだしてＥＴＬサーバを経由して貯め込む先、そこにあるのがGreenplum DBです。ここに履歴、ヒストリカルデータをどんどん貯め込み、分析をかけていくということになります。

Greenplum DBはあくまでもデータベースですので、ユーザからはBIツールを使ってアクセスすることになります。

BIツールとしては、Business Objectsや、MicroStrategy、JaspersoftやSASなど、一般的に広く使われているツールが利用可能です。 BI、ETL製品への幅広い対応で基幹システム、分析システム連携を実現基幹システム分析&レポート ETL Extract Transform Load Oracle DataStage Infomatica SAS ETL Ab Initio PluralSoft Talend MicroStrategy Cognos SAS Jaspersoft Business Objects Pentaho Hyperion ACTUATE High Speed Loader IBM/DB2 MySQL Postgres SQL Server JDBC ＜＞ ODBC ＜＞ SQL/92 ＜＞

Greenplum DBの3つの特徴

バッチ処理・データ解析のためのデータベースであるGreenplum DB。その特徴を、3つご紹介します。まず第1点目は、大規模に処理をパラレル化する、並列処理をさせるという、シェアードナッシング・アーキテクチャである点です。シェアードナッシング・アーキテクチャを採用することによって、百から千以上のCPUコアを同時に使い、パラレルに、高速にデータ処理を行えるというのが第一点目の特徴です。大規模並列処理と言っても、標準のSQLが使えます。SQLを知っている開発者、ユーザであれば、Greenplum DBに標準のSQLを投げ込むだけで、ユーザは並列処理を意識しなくてもGreenplum DBが自動的にパラレル処理を実現してくれます。 2点目は、特定のハードウェアに縛られないオープンアーキテクチャである点です。 Greenplum DBを構成する全てのコンポーネントは特定のハードウェアに縛られません。インタコネクト、ストレージ、サーバ、CPU、メモリ、OSに至るまで、すべてのコンポーネントが特定のものに縛られていません。従来、データウェアハウスを始めるということは、それ専用のデータウェアハウス・システムを新規に導入するということと同じでした。それに対しGreenplum DBは、コモディティのサーバ、スイッチ、ストレージをうまく活用してデータウェアハウスの環境を、構築し、運用することができる。これが2点目のポイントです。そして3点目が拡張性です。 Greenplum DBは、サーバを追加するだけで簡単に拡張できます。システムを止めずに、オンラインでシステムにサーバを追加し、拡張することができますので、CPUのパワーが足りなくなった場合にも、簡単に性能をアップさせることができます。ストレージも同様です。この拡張性が3点目のポイントです。

シェアードナッシング・アーキテクチャの実装により、

高速なバッチ処理・データ分析を実現

Greenplum DBを構成するコンポーネントは大きく3つあります。上からマスターサーバ。2つ目がネットワーク・インタコネクト。3つ目がセグメントサーバです。マスターサーバは、ユーザからのクエリの受付と、クエリ結果の返答を行います。ただしデータベース処理自身は行いません。データベース処理は、バックエンドにあるセグメントサーバに対して、分散して指示をします。ユーザから「こういうクエリがきましたので、処理をしなさい」と命令を受け、分散して処理をするのがセグメントサーバです。実際には、このセグメントサーバの台数によってデータベースの性能と、データベースの容量が決まります。このマスターサーバと、セグメントサーバの間を繋げるのが、ネットワーク・インタコネクトです。マスターサーバと、セグメントサーバは、他社であれば専用のサーバが必要でしたが、Greenplum DBでは通常のインテル・アーキテクチャのサーバが活用できます。 OSはLinuxが一般的です。このマスターサーバとセグメントサーバの間を取り持つ、ネットワーク・インタコネクトにはイーサネットスイッチを使います。ここも、専用のものは必要ありません。今であれば10Gbイーサネットスイッチを冗長化のために2台使う構成が一般的です。よりコストを抑えたいということで1Gbイーサネットスイッチを 2台使用している事例もあります。

シェアードナッシング・アーキテクチャ

による高速

DB

処理

SQLを解析し、セグメントサーバのための最適な並列実行プランを作成 gNetソフトウェアインタコネクトによるセグメント間の効率的なデータ送受信パラレルデータフローエンジンが、ハードサーバ性能を最大活用パラレルロードによる、高速ローディングマスターサーバクエリプランニング＆ディスパッチセグメントサーバクエリの実行＆データの格納外部ソースローディング、ストリーミング等ネットワークインタコネクト SQL 大規模並列処理・シェアードナッシングによる大規模並列処理・パラレルエンジンが、数台から数百台のサーバによる並列処理を実現・広範囲のSQL対応（SQL-92, SQL-99, SQL-2003 OLAP）オープンアーキテクチャ・コモディティハードウェアで実現する大規模DB ・ソフトウェアオンリーのアプローチにより、低価格かつ構成の高い柔軟性を実現拡張性・スモール・スタートが可能・データ量の増加に伴うシステム拡張を低コストで実現・数百ギガから数十ペタバイト規模までのリニアなスケーラビリティ図2: Greenplum DBの位置づけ図3: Greenplum DBの特徴

(3)

4

5 世界最高速のデータロード性能

Greenplum DBは他製品と比べてさまざまな差別化ポイントがありますが、最もわかりやすいポイントはデータロード性能です。データロード性能は他社製品と比較して、圧倒的に高速です。図4はGreenplum DBと、他社の4製品における、1時間当たりにローディングできるデータの量を比較したグラフです。縦軸が1時間当たりでローディングできるデータの量、TB/h、横軸が各製品です。他製品が5TB、或いは2TBという性能に対して、Greenplum DBは10TBのデータローディングが可能です。他製品と比較して2倍、または5倍のローディング性能があります。また、Greenplum DBも他製品も1ラックから2ラック、3ラックと、ラックを増設し拡張することができます。Greenplum DBの場合、2ラックにするとセグメントサーバが増えて行き、リニアに性能が向上し、20TB/hのデータローディングが可能になります。対して他製品では性能が頭打ちになり、大きく変わりません。 2ラックでも3ラックでもローディング性能は5TBあるいは2TBのまま変わりません。 Greenplum DBは、2ラックでは20TB/h、3ラックにすると、30TB/hというように、ローディング性能がリニアに増加します。リニアに性能を向上させることができることは、特にHadoopを利用しているユーザに非常に好評です。 Hadoopで扱うべきデータがどこまで増えるのか分からない状況で、性能を青天井で向上させることができる仕組みが非常に評価されています。

TB/h

10 0 20 30 40 Greenplum DBはラック数に比例してロード性能が向上

0

2

4

6

8

10

12 TB/h

1ラック構成での比較

世界最高速のデータロード性能を実現するGreenplum DB

のScatter/Gather Streaming 技術活用例1

Greenplum DBが他製品と比較して何故これだけの性能差がでるのか？その理由を、Greenplum DBの主要機能の紹介を通じて説明していきます。まず、データローディングの機能について説明していきましょう。 Greenplum DBでは、様々なデータローディング手法があります。その中で最も高速にデータをローディング出来るのが、この活用例１のローディング方法です。図5では、マスターサーバ1台とセグメントサーバ2台という、非常に小さな Greenplum DBシステムを簡易的に表しています。このGreenplum DBシステムのインタコネクト部分に、ロードサーバ（NASやファイルサーバ）を直接接続し、マスターサーバを経由しないでデータをローディングすることが可能です。また、このロードサーバ自身を水平方向に増やしていき、ローディング性能を増やしていく、リニアにスケールさせることができます。 Oracleを利用しているユーザであれば、Oracleからファイルをロードサーバ上に掃きだし、そこから直接インタコネクトを経由してセグメントサーバにデータを流し込んでいく、ということも可能です。他DB（Oracle等）セグメントサーバロードサーバロードサーバセグメントサーバマスターサーバ

データロード：従来の処理方式

ここでは他製品の仕組みと比較しながらデータローディング性能の優位性について更に説明します。

従来のデータのローディング方式、これはOracle Exadata、Netezza、そして

Teradata、この3つのアーキテクチャに等しく当てはまるものです。他製品ともに名称は違っても、2階層のサーバでシステムが構成されているという点ではGreenplum DBと同じです。例えば、Greenplum DBでは、マスターサーバ、セグメントサーバと呼んでいますが、Oracleではデータベースサーバーとストレージサーバーと呼んでいます。このストレージサーバーを並べることによって性能を上げています。これは Netezza、Teradataも同様です。他製品におけるデータローディングは、全てのデータがマスターサーバを経由して入っていきます。マスターサーバ上にローディングプロセスがあり、仮にファイルサーバが2台、CSVのようなテキストファイルが2つあったとします。こ図4: 世界最高速のロード性能

図5: Greenplum Scatter/Gather Streaming 活用例1

世界最高速のデータロード性能を実現する

Greenplum DB

の

Scatter/Gather Streaming

技術

れらのデータをローディングするとき、この図のようにマスターサーバを経由しなければ全てのデータがセグメントサーバに入っていかないという事になります。図6ではセグメントサーバは4台ですが、8台になったとしても、或いは12台になったとしても、マスターサーバがボトルネックになってしまい、ローディングの性能は伸びません。先ほどの1ラック、2ラック、3ラックと、システムを増強していたとしても、性能が伸びないというのは、正にこの点に起因するわけです。データソースマスタサーバセグメントサーバローディングプロセスセグメントサーバセグメントサーバセグメントサーバデータソース

Greenplum DB の徹底した並列処理

これに対し、Greenplum DBのデータローディングでは、マスターサーバはデータのやり取りをしません。マスターサーバは、必須のコンポーネントであり、システム内には存在しますが、データローディングの処理自体には関与しません。ではどのようにデータをローディングしているのでしょうか。各セグメントサーバ上はデータを取りこむ、パラレルデータフローエンジンというものが存在します。従来製品の仕組みの説明でいうところの、ローディングプロセスを担っています。データをデータソースから取りこむ処理を、他製品であれば1か所にしかないところを、Greenplum DBでは各セグメントサーバ上に、ローディングプロセスを台数分持つわけです。まず、各セグメントサーバは、データの内容などは特に考えず、図7の場合で言えば、色や場所は特に考えないで、ブロック単位でデータソースからデータを持ってきます。次に、セグメントサーバの1台1台が、マスターサーバが定める分散ポリシーに応じて、データを分散するという処理を行います。実際には、この処理を全てのセグメントサーバが同時に行います。これによってローディング性能を向上させることができるのです。ラックを増やすということは、当然セグメントサーバが増えることになり、データを引っ張ってきてデータを所定の位置に分散するという、この処理を行うエンジンであるセグメントサーバ分増えますので、ローディング性能がリニアにどんどん伸びていくのです。セグメントサーバデータフローエンジンセグメントサーバデータソースセグメントサーバセグメントサーバセグメントサーバセグメントサーバデータソースパラレルデータフローエンジンパラレルデータフローエンジンパラレルデータフローエンジンパラレルデータフローエンジンデータソースデータソースパラレルデータフローエンジンパラレルデータフローエンジンパラレルデータフローエンジンパラレルセグメントサーバセグメントサーバ各セグメントサーバは、データの内容（この場合は色や場所）などは特に考えず、ブロック単位でデータソースにデータを取りに行き、各々のデータのロード先にデータを振り分けます。実際には、上記の処理をすべてのセグメントサーバが同時に行います。この並列処理が高速なローディングを可能にしています。

世界最高速のデータロード性能を実現するGreenplum DB

のScatter/Gather Streaming 技術活用例2

活用例1でご紹介したのは、大量のデータを限られた時間に、できるだけ高速に流し込むというローディング手法です。それ以外にもGreenplum DBは、様々なデータのローディングが可能です。 2つ目のローディング手法としてご紹介するのは、ロードサーバを使用しないローディング手法です。ここでは、Oracleを例として説明します。図8に示すとおり、OracleとIP通信ができる環境があれば、セグメントサーバが Oracleに対して直接コネクトし、データをローディングすることが可能です。従って、Oracleから一度、ファイルサーバにファイルをダンプする必要なく、直接データを抜き出すことが可能です。このローディング手法は、一旦ロードサーバ（ファイルサーバ）に対してファイルをダンプして、そこからセグメントサーバにデータを流し込むというこの手間を省けます。「なるべく最新のデータが欲しい」といった場合に、役に立つ仕組みです。このローディング手法は、ローディングのパフォーマンスが速いか遅いかは、データソース側の、この例であればOracleのシステムに依存します。直接 Oracleからデータを引っ張ってくることになるため、Oracle側のシステム規模が小さいと、高いローディングの性能を出すことはできません。

一方、Oracle側のサーバが非常に高スペックで、OracleとGreenplum DBの間のネットワークも帯域が非常に太ければ、非常に速いローディングが期待できます。ですからこの手法は、ニアリアルタイムなデータに対して分析をしたい場合に、有効な手法です。

図6: 従来の処理方式

(4)

具体的な仕組みとしては、Greenplum DBの外部表という機能を使用しています。外部表というのは、Greenplum DBの中にまだ入っていない、セグメントサーバ上に置かれていないデータであるが、その外にあるデータをあたかも Greenplum DBのデータとして扱える機能です。この外部表には、OSコマンドの結果をGreenplum DBのデータレコードとして扱う機能があります。例えばOracleからデータを抜き出す場合には、OSコマンドの中で、Oracleクライアントのコマンドを叩き、Oracleクライアントが外部にあるOracleに対して、SQL Plusでコネクションを張りデータを引き出してきて、その結果を Greenplum DBの中のデータレコードとして扱うことが可能です。 O Sコマンドとして発行できれば、何でも外部表データとして扱えるので、 Oracle以外のデータベースにも対応可能です。 DB2、SQL Serverであったり、シェルのコマンドであったり、何かのアプリケーションの実行結果であったり、様々なものをデータとして扱うことができます。他DB（Oracle等）セグメントサーバセグメントサーバマスターサーバ

世界最高速のデータロード性能を実現するGreenplum DB

のScatter/Gather Streaming 技術活用例3

ここまでは、高速にデータをロードする、あるいはニアリアルタイムなデータをローディングする方法をご紹介しました。次は、データを書きだすお話しです。当然、Greenplum DBは、マスターサーバを経由してデータを書きだすことが可能ですが、ここもローディングと同じように、マスターサーバがボトルネックになる可能性があります。他製品が持っている、また違う箇所のボトルネック、アンロード時のボトルネックになります。 Greenplum DBは、マスターサーバを経由してデータを書き出す以外に、セグメントサーバから直接ファイルサーバに対してデータを書き出すことも可能です。それを示したのが図9です。セグメントサーバから、マスターサーバを経由しないで、ダイレクトにデータを書き出しています。この書き出し先も、1台ではなく、2台、3台、4台と増設することができ、データを受け取る側のサーバを増やすことによって、大量のデータのパラレルの高速アンロードが可能です。このパラレルなデータのロード、パラレルのデータのアンロード、この仕組は Hadoopとの連携に非常に有効に働きます。ここでサポートしているファイルの形式は、CSVなどのテキストファイルです。テキストファイルに対するデータの書き出しが可能です。セグメントサーバロードサーバロードサーバセグメントサーバマスターサーバ

世界最高速のデータロード性能を実現するGreenplum DB

のScatter/Gather Streaming 技術活用例4

最新のデータのロード・アンドロードの技術として、Greenplum DB 4.1で搭載された機能が、外部表のデータソースとしてHadoopをサポートしたことです。 Hadoopのデータをパラレルにローディングでき、パラレルにデータをアンロードすることもできます。図10では、下がHadoopシステムです。

Hadoop Hadoop Hadoop

Hadoop

GreenplumDB

セグメントサーバデータノードマスターサーバセグメントサーバデータノードデータノードネームノード Hadoopは、Greenplum DBと似た2つのレイヤーから構成されています。 Hadoopは、親的役割をするネームノードと、水平方向にスケールさせて性能をあげていくデータノードの2つのレイヤーの組み合わせで構成されています。 HadoopのデータノードとGreenplum DBセグメントサーバが直接パラレルにやりとりすることによって、Greenplum DBのマスターサーバを経由せず、なおかつHadoopのネームノードも経由しないで、パラレルにデータのロードが可能ですし、アンロードも可能です。 Hadoopは、現在非常に注目されている技術ですので、他社製品も当然のようにHadoopとの連携ができると言われています。他社も「Hadoopとの連携ができるようになりました」と発表しています。しかしながら、他製品は、マスターサーバを経由してHadoopとデータのロード・アンロードを行いますので、Hadoopと連携する際、Hadoopシステムからデータを抜き出そうとすると、結局マスターサーバを経由します。同様にマスターサーバを経由してデータが出ていくわけです。従って、データが大きくなればなるほど、連携部分のボトルネックが顕著になります。 Greenplum DBはこの点を解決しています。Hadoopを外部表として使えるというようになったという、この機能がボトルネックを解消しているのです。図8: Greenplum Scatter/Gather Streaming 活用例2

例えばデータ量が50億件の非常に大規模なデータを、別の50億件のテーブルと突き合わせて、その突き合わせた結果の、非常に大きくなったテーブルをそのまま集計も何もしないで、Hadoopに渡したい。このようにデータ量としては、数百ギガバイトになるようなものを、マスターサーバを経由させると当然ボトルネックになります。そのような場合に使うのは、このアンロードの機能になります。

Greenplum DBにおけるマスターサーバの役割

ここで1つ疑問が生じたのではないでしょうか。Greenplum DBのマスターサーバは実際には何をやっているのでしょうか？マスターサーバはクエリの実行や JOIN処理などは行いません。それらの処理を行うのはセグメントサーバです。 Greenplum DBでは、セグメントサーバ同士が、自分以外のサーバが、どういったデータを持ってるかを知っています。従って、JOIN処理などにマスターサーバが関わらないで、セグメントサーバ同士が通信をすることによって、処理を実行していきます。その処理に関する分散ポリシーを、各セグメントサーバに定義をすることは、マスターサーバを経由してのみ可能です。例えばテーブルを作るときに、「このテーブルはこういった分散をさせます」という指示をします。そうすると、その指示が各セグメントサーバ上に伝達され、このテーブルに関しては「こういう分散ポリシーなんだ」ということを各セグメントサーバが記憶します。その後は、例えばデータソースから直接データを引っ張ってきたとしても、セグメントサーバは「マスターサーバから教わったこの分散ポリシーに従って、分散すればいいのだ」と判断して処理を行います。仮に「自分のところにあるべきデータじゃない」ということがわかった場合には、他のセグメントサーバに渡せばいいということを知っていますので、直接他のセグメントサーバにデータを渡します。マスターサーバは必須であり、テーブルの定義、あるいは分散ポリシーを設定するためには絶対に必要ですが、複雑な処理であったとしても、マスターサーバは実際のクエリ処理を、行わないで済むわけです。

(5)

8

9 データレコードの分散処理

Greenplum DBが、データをどのように分散配置しているかを説明します。

Greenplum DBは、データレコードの分散配置の仕方をテーブル作成時に指定します。具体的には CREATE TABLE 文の後ろに DISTRIBUTEDという句を追加します。DISTRIBUTED の後ろにカラムを指定しますと、データレコード１行づつの指定されたカラムの値をハッシュ値にしてセグメントへのデータレコードのハッシュ分散が行われます。図11は、Greenplum DBがハッシュ分散した時の仕組みを表しています。DISTRIBUTED の後ろに RANDOMLY と指定すると、ハッシュ分散は行わずにラウンドロビン方式でデータレコードを各セグメントへ分散させてゆきます。なお、分散配置の仕方が 2通りあると説明をしましたが、どちらの場合でもとても重要なポイントは、テーブル作成後に指定された分散配置の仕方は各セグメントにも通達されているという点です。ですので、各セグメントがクエリ処理をする過程で他セグメントのデータレコードを参照する必要が出てきた場合でも、そのデータレコードの在処をマスターサーバに問い合わせません。各セグメントサーバが分散配置の仕方を把握していますのでお互いに通信します。 B A B C C A A C C C C A A A B B データレコードマスターサーバセグメントサーバハッシュの指定 S2 S1 S3

クエリのパラレル処理

次にクエリのパラレル処理について説明します。Greenplum DBでは、各セグメントサーバへのクエリ処理は、マスターサーバからの指示を受けてパラレルに行われます。まず、クライアントは、クエリの投げ先としてマスターサーバを指定し、クエリを投げます。次にクエリを受け付けたマスターサーバは、クエリの解析を行い、各セグメントサーバへの実行プランを作成します。「パーティションスキャンをするか」、「シーケンシャルスキャンをするか」、などや「JOINでは入れ子JOIN をするか、ハッシュJOINするか」などの実行プランを考えるのがマスターサーバです。実行プランを作った後、実際にクエリの処理を始める時に、各セグメントサーバに対して、この実行プランを処理しなさいという指示を出します。指示を受け取った各セグメントサーバは自分が持っているデータに対して、マスターサーバから来た実行プランを実行します。全てのセグメントサーバは独立して処理を実施しますが、データの配置によってはセグメント1台の中で処理が終わらず、複数台のセグメントサーバと通信をしなければならない場合が生じます。ここが重要な点ですが、その場合もマスターサーバは介在せずセグメントサーバ同士が直接会話してデータの交換をします。マスターサーバの介在を必要としないためパラレリズムが維持されるわけです。クエリ処理の結果は、セグメントサーバがそれぞれマスターサーバに対して返して、そして最終的にクライアントに返っていく、これが通常のクエリ処理のフローです。また、クエリの結果はアンロードすることも可能です。各セグメントサーバが実施したクエリ処理の結果をアンロード先のサーバに対して出力したり、Hadoop に渡したりすることができます。アンロードの仕組みは、出力先がファイルでも、Hadoopであったとしても、 Greenplum DBの外部表という機能を使っています。外部表ですからテーブルです。アンロード時は処理したクエリの結果を「こちらの外部表にINSERTしてください」というように指示します。このようにINSERTすると、実はその出力先がHadoopであったり、あるいはファイルサーバ上のテキストファイルであったりするのです。Hadoopとの連携については、後の章で詳しく説明します。クライアントクエリ実行プランマスターサーバセグメントサーバセグメントサーバセグメントサーバセグメントサーバ答返と付受のリエク・成作のンラプ行実・のンラプ行実のへトンメグセ・配布と実行の指示納格をターデザーユ・答返と付受の示指のらかタスマ・行実のリエク・

高度なパイプライン処理により高速化されたソーティング

次にソーティングのお話をしましょう。ソーティングのような複雑な処理は、結局セグメントサーバ上1台では処理しきれないので、マスターサーバがすべて処理するため、マスターサーバがボトルネックになるのでは？と思われるかも知れません。 Greenplum DBは、マスターサーバがボトルネックになること無く、ソーティングを非常に高速に実行できる仕組みを実現しています、その仕組みをご紹介します。図13のマスターサーバ1台と、セグメントサーバ3台の構成で確認してみます。まずクライアントからソートの要求が来たとします。次に、そのソートの要求はマスターサーバから、各セグメントサーバに対して指示が行きます。指示を受けたセグメントサーバは、まず自分たちの中に順番がバラバラな状態で持っているデータをプリソートします。その結果をマスターサーバに返していくわけですが、実は全てのデータがマスターサーバに返りきる前に、マスターサーバはク

複雑な検索・集計・分析を、短時間に処理するための先進機能

図11: データレコードのハッシュ分散図12: クエリのパラレル処理ライアントへの返答を始めます。なぜこのような仕組みが可能なのでしょうか。順を追って説明します。まず、各セグメントサーバが、データのプリソートをした段階で、それぞれのセグメントサーバが持っている一番小さなデータはわかります。そこから一番上にあるデータを、それぞれのセグメントサーバが出し合います。この段階で、この全てのデータの中で一番小さなデータが何かということはわかります。この図13の中では「1」が一番小さなデータということがわかり、それを返します。そして次の一行が飛んでいきます。そして、この3行を比べてみて今回も一番左のサーバのデータが一番小さいことがわかり、クライアントに返せます。この仕組みを繋げていくと、パイプラインが途切れることなく、マスターサーバを経由してクライアントに対してソーティングされたデータを返していくことができます。セグメントサーバセグメントサーバセグメントサーバマスターサーバソート要求ソート要求ソート要求ソート要求１２４９３６７１１５８１０１２クライアント ②ソートの指示を受けた各セグメントサーバは、自分のデータをプリソートします。 ①クライアントから来たソート要求を、各セグメントサーバに指示します。ソート要求セグメントサーバ１２４９セグメントサーバ３６７１１セグメントサーバ５８１０１２マスターサーバクライアント ①各セグメントサーバは、ソート結果をマスターサーバに返します。 ②全てのデータがマスターサーバに帰りきる前に、マスターサーバはクライアントへの返答を始めます。他製品の場合はどうでしょうか。プリソートされていない全てのデータを、一回マスターサーバに持っていき、1台のマスターサーバでソーティングを行います。すべてのデータの読み出しと、すべてのソーティングを1台のデータベースのサーバの中で行うため、処理がパラレル化されず、ソーティング処理に非常に時間がかかります。従ってソーティング処理を高速に行うためには、非常に CPUスペックが高く、大容量のメモリの積んだ非常に大きなサーバが必要になるわけです。例えばCPUが64コア、メモリは1TBといった巨大なハードウェア・リソースが必要となり、非常に高価なシステムになります。これに対し、Greenplum DBは、ソーティング処理を効率良くパラレル化できるアーキテクチャを持っていますので、マスターサーバはボトルネックにはなりま

せん。Greenplumのアプライアンス製品であるGreenplum DCAのマスターサーバが積んでいるCPUは、2CPU、トータル12コア。メモリは48GBです。この程度のハードウェアスペックで充分なのです。

(6)

Greenplum Polymorphic Data Storage

が提供する豊富

な選択肢

先に紹介した機能以外にも、Greenplum DBには、データアクセスを高速化するいくつかの仕組みがあります。その仕組の一つであるデータの格納方式について説明します。 Greenplum DBでは、ローストアと、カラムストアという2つのデータの格納方式を持っています。ローストアというのはデータをロー方式、行単位で格納するという方式です。これは一般的なデータベース製品が使っている、非常に一般的なものです。実は、この仕組みは、データウェアハウス処理でよくある集計処理には非常に効率が悪いのです。何故でしょうか？例えば、このカラムのＣのデータだけを抜き出したいとします。ローストア方式の場合、ここの値だけを読みたいのに、全てのカラムの全レコード読みながら、カラムＣだけのデータを抜き出すことをします。結果的に、非常に効率の悪いアクセスパターンになってしまうのです。これに対してGreenplum DBが持っているカラムストアは、データをカラム単位で格納していきます。ですから、カラムＣのデータだけ集計したい、例えばカラムＣの「平均値を出したい」あるいは「合計値を出したい」という場合でも、他のカラムに対するアクセスは一切行なわず、Ｃカラムだけ一気に足し合わせてアクセスをし、集計ができますので、IO負荷が非常に少なくて済むわけです。このように、集計処理を非常に高速に実行できるというのがカラムストアのメリットです。実は、このカラムストアというのは新しい技術ではありません。古くはSybaseのデータウエアハウス・ソリューションである、SybaseIQが15年前からこの仕組みを提供しています。ですが、カラムストア・データーベースの課題というのは、逆にローストアを持っておらず、カラムストアしか無いというのが課題でした。大半のデータベース、例えばOracleやDB2などはローストアを採用しています。ローストアから持って来たデータをカラムストアに入れる、データベースのマイグレーションすることはクエリの書き方をうまく調整しなければ、なかなかパフォーマンスが出ません。ローストアというのは、1件単位でデータを格納していきますので、インサート処理は非常に高速です。逆にカラムストアは、集計処理は非常に速いのですが、インサート処理は苦手で遅いのです。インサート処理をカラムストア方式に対してそのまま適応すると、非常に効率の悪いデータベータ処理になります。ここがカラムストアの課題でした。 Greenplum DBは、ローストアとカラムストアを、1つのテーブルの中で混合して使うことが可能です。テーブルをパーティショニングして、最新のデータに関しては、アップデートやインサートが多く発生し、複数カラムに対してアクセスが多くなるのでローストアで格納する。それ以降の古いデータに関しては集計しかしないので、カラムストアを使う。このようなことが可能です。これはGreenplum DBだけのテクノロジーです。従来からあるローストアのテーブルカラムストアのテーブル列A 列B 列C 列D 読み出す必要のないカラムの値もアクセス。余分なIO負荷が発生列A 列B 列C 列D 特定カラムの特定カラムの値のみアクセスするため、 IO負荷を劇的に軽減検索範囲検索範囲

テーブルパーティショニングによる検索範囲の限定

Greenplum DBのテーブルパーティショニングについて紹介しましょう。データを、セグメントサーバにハッシュキーを使って分散配置をしていくというのは、先程説明しました。Greenplum DBは、更に各セグメントサーバの中で、検索をする範囲を絞り込んでいくことができます。それが、テーブルパーティショニングになります。検索範囲を絞り込んでいくことで、ストレージへのIOを減らし、レスポンスタイムを更に短くできます。テーブルパーティショニングの種類としては、レンジ（範囲）パーティショニング、リストパーティショニング、マルチレベルパーティショニングに対応しています。 1年間の集計処理を例にあげると、レンジパーティショニングでは2011年の1月から12月の販売データを1カ月ごとに区切ることができるので、6月の売り上げデータだけを集計したい、合算値を出したいといった場合に、6月のデータだけを読み出すことができます。パーティショニングをしなければ、1月から12月のデータを全部読み出した（フルスキャン）上で6月分だけ抜き出して集計処理を行いますが、パーティショニングを行うと、1月から5月分および７月から12月分のデータを読まず、6月分のデータだけを読み出せるので、フルスキャンを発生させること無く、非常に高速なクエリ処理が可能になります。また、レンジパーティショニングで区切ったテーブルを更にリストで分ける、あるいは、レンジパーティショニングで分けたものを更にレンジパーティショニングで分ける、といったことも可能です。例えば、月単位で分けたテーブルを更に週単位で分ける、あるいは、リストで分けたものをリストで組み合わせる。これがマルチレベルパーティショニングです。

Greenplum Polymorphic Data Storage

が提供する豊富な選択肢

図14: ローストア、カラムストアセグメントの場合セグメント＋パーティションの場合検索範囲マスターサーバマスターサーバ検索範囲

既存投資の保護とさらなる高速化へ – インデックス

Greenplum DBは、データベースですので当然インデックスにも対応しています。広く一般的に使われているB-Treeインデックス、それ以外にビットマップ・インデックスにも対応しています。B-Treeインデックスというのは、OLTP処理に強いとされるインデックスです。ビットマップ・インデックスはDWH/BIシステムに多い参照処理に効果的に機能します。この両方のインデックスに対応しているので、OLTP処理にもデータウェアハウス処理のどちらにも適したインデックスを使えます。

Ze

b

ar

Root

Branch Branch Branch

Leaf Leaf Leaf Leaf Leaf Leaf

B

oo

k

ra

C

1 1 1

1

1 MALE

FEMALE

SAZAE TARAO WAKAME KATSUO MASUO FEMALE MALE FEMALE MALE MALE テーブルインデクス B-Treeインデクスの格納方式 Bitmapインデクスの格納方式

ワークロード管理 - リソースキュー

続いて、ワークロード管理について紹介します。データウェアハウス・システムですので、複数のユーザが同時にクエリを投げるということが当然ありえます。この場合に、どのように優先順位付けをするかという機能がリソースキューを使ったワークロード管理です。 Greenplum DBを使用する全てのユーザは、必ずどれかの一つのリソースキューに紐付けられます。このリソースキューごとにCPUリソースの割り当てや同時に実行可能なクエリの数を決めることができます。例えば図17の場合、マネジメント層用のエグゼクティブキューと、レポート作成の担当者用のレポートキュー、アナリスト用のアナリストキューの3つがあります。このキューの太さ、これがCPUリソースの配分を表しています。マネジメントの方は、非常に太いキューを持っているので、多くのCPUリソースが割り当てられており、アナリストと同じクエリを同時に投げたとしても、エグゼクティブは非常に早くクエリの結果が得られます。一方アナリストは頻繁にクエリを発行しているため、エグゼクティブに比べてCPUリソースが少し絞られており、クエリ結果が帰ってくるのも少し遅いわけです。加えて、いくつのクエリを同時に実行できるかも定義できます。図17の場合、例えばアナリストは同時に4つのクエリしか実行できません。5つ目のクエリを実行しようとしても、すでに4つのキューを使っているため、実行中の4つのうちどれかが終わるまで待たされます。これに対してエグゼクティブ用には、10のキューが設定されています。従って、5つ6つのクエリを実行しても、待たされずに処理されていきます。クエリが11個目になって、初めて待たされるというわけです。この、クエリが実際に実行されるタイミング、CPUリソースの配分、加えてメモリの配分を行えるのがワークロード管理、リソースキューという機能になります。リソースキュー間でCPUやメモリ割当をプライオリティ付けエグゼクティブキューレポートキューアナリストグキューアナリストレポート作成担当者マネジメント実行開始待ちのクエリ実行中のクエリリソースキュー間でCPUやメモリ割当をプライオリティ付け同時に処理できるクエリ数か、コストの総和をリソースキュー毎に設定 GreenplumDBの提供するワークロード管理機能の一つリソースキューによって、複数の利用者やバッチ、システムの同時利用のために、受け付けたクエリの処理に関する優先順位付けを行うことが可能です。リソースキューは大きく4つの観点から優先順位付けを行います。 (1) 同時に処理されるクエリのコストの総和クエリ毎のコストを確認し、処理中の複数クエリのコストの総和が、あらかじめ指定した閾値を上回ることのないよう、制御します。 (2)同時に処理されるクエリ数処理中のクエリ数を確認し、処理するクエリの数があらかじめ指定した閾値を上回ることがないよう、制御します。 (3) CPUリソースの優先度リソースキュー間でCPUリソースをどのように割り当てるかを制御します。 (4) メモリの優先度リソースキュー間でメモリをどのように割り当てるかを制御します。複数の利用者・バッチ処理・システムでの同時利用のための機能図15: テーブルパーティショニングによる検索範囲の限定図16: B-TreeインデクスとBitmapインデクス図17: ワークロード管理 - リソースキュー

(7)

12

13 動的なクエリ優先度付け

Greenplum DBでは、クエリごとにCPUリソースの動的な割り当てが可能です。例えば、リソースキューについて、C P Uリソースの配分を最大限利用できるキューと、中くらい利用できるミディアムというキュー、配分が少ないローという3つのキューがあるとします。まず1つ目のミディアムというキューのユーザは、まだ誰もシステム資源を使っていないためクエリを実行したときCPUリソースを100％使えます。仮に、このミディアムのキューにもう一つクエリが来た場合には、リソース配分は、同じプライオリティですので、このように均等に配分されます。次にローのクエリが来たとします。ミディアムよりプライオリティが低いので、CPUリソースの割り当ては限られます。少しだけCPUリソースをもらい、それに合わせて他の2つのクエリの割り当ては均等に下がります。最後に4つ目のクエリとしてマックスのクエリが来たとします。マックスは最大限CPUリソースが貰えます。それに伴い、ミディアムとローに関しては、割り当てが下がります。これをマスターサーバが判断しながらダイナミックにCPUリソースの割り当てを変更していきます。Greenplum DBはこのような動的なリソース割り当てが可能です。また、この他にも特定のクエリを狙い撃ちでCPUリソースの割り当てを絞り込むことも可能です。データウェアハウスの運用の中でまれにあるケースとして、アナリストが1週間1つのクエリを回し続けているということがあります。非常に処理が重たいクエリを実行してしまったため、１週間ずっとCPUを80％以上使ってしまい、他のユーザにCPUリソースが割り当てられないという状況に陥ってしまい、今まではこれに対する術がありませんでした。手段としては、あくまでローにするしかなく、ローでも割り当てられてしまいます。Greenplum DBは、この1週間実行し続けられているクエリに対して、CPUリソースの割り当てを更に絞り込むことが可能です。まさに狙い撃ちをして、このユーザのこのクエリは徹底的に絞り込み、それによって他のユーザに対するCPUリソースの割り当てを上げることができます。これもGreenplum DBのリソース管理の機能の一つです。リソースキュー Medium Max Low リソース使用量の合計

Qry1 Qry2 Qry3

100% ? Qry4 リソースキュー Medium Max Low リソース使用量の合計

Qry1 Qry2 Qry3

100% ? ? Qry4 リソースキュー Medium Max Low リソース使用量の合計

Qry1 Qry2 Qry3

100% ? ? ? Qry4 ? 一つ目のミディアムユーザーは、まだ誰もリソースを使っていないため、クエリの実行にリソースを100%使えます。ミディアムのキューにもう一つクエリが来た場合は、同じプライオリティですので、均等にリソース配分されます。次にローとマックスのリソースが来ました。マックスは最大限リソースが使えるので、それに伴いミディアムとローの割り当ては下がります。

Greenplum DBの高い可用性

次にご紹介するのは、可用性についてです。Greenplum DBでは、全てのコンポーネントを冗長化できます。マスターサーバは、ホット・スタンバイで構成します。ネットワーク部分は、アクティブ・アクティブで2台以上のスイッチを使った冗長化をします。次にセグメントサーバですが、セグメントサーバ間でデータをミラーリングする、ミラーセグメントという機能があります。この機能により、例えばセグメントサーバがダウンしてしまった場合に、その停止したサーバのミラーデータを持っている他のセグメントサーバにフェイルオーバーし、サービスを止めることなく処理を継続できます。加えて、当然マスターサーバであっても、セグメントサーバであっても、データはR AIDで保護していますので、多段階でのデータの保護がなされていることになります。マスターサーバマスターサーバセグメントサーバセグメントサーバセグメントサーバセグメントサーバ

マスターサーバにおけるデータ保護

・サーバ障害に備えたトランザクションログの複製・ドライブ障害に備えたRAID

セグメントサーバにおけるデータ保護

・サーバ障害に備えたミラーセグメント・ドライブ障害に備えたRAID 図18: 動的なクエリ優先度付け図19: Greenplum DBの高い可用性

Greenplum DB 4.2

の新機能

2011年12月にリリースされたGreenplum DBの最新バージョン4.2では、次のような機能拡張が行われており、クエリ・スピードの向上、リソースの利用率向上、システム管理機能の強化などが図られています。

メモリ管理の最適化

最新バージョンでは、クエリの処理フェーズごとにメモリの割り当てが可能になり、クエリのスピードが向上しました。

テーブル・パーティションのエンハンス

クエリプランナの拡張により、テーブル・パーティショニング時の性能が大幅に向上します。

カラム単位の圧縮機能

カラム単位で圧縮アルゴリズムや圧縮レベルを選択可能になりました。例えば普段はほとんど参照しないカラムは高圧縮に設定するなど、カラム毎に圧縮レベルの設定などが可能です。この機能をうまく活用することにより、ストレージの利用効率を向上させることができます。

Oracle関数への対応が拡張

最新バージョンでは、日付関数や文字列関数、算術関数など、20以上のOracle関数に対応しました。これにより、既存のクエリを極力書き換えることなく、DBのマイグレーションやバッチ処理の最適化が可能となります。

バックアップ機能の強化

Data Domain Boostに対応しました。これにより、重複除外を行ってからバックアップができるようになり、バックアップがより高速になります。

拡張機能のパッケージ化

PostGIS、pgcrypt、PL/Rなどの拡張機能が、新しいパッケージ・マネージャによりパッケージ化され、導入が容易になりました。

システム管理ツールのエンハンス

従来のシステム管理ツールでは、各サーバ・リソースの利用率のモニタリングまででしたが、新しい管理ツールでは、Greenplumクラスタ全体のモニタリングに加え、設定、スタート/停止などの操作も可能になりました。カラム単位の圧縮機能列A 列B 列C 列D 従来はテーブル単位の圧縮最新バージョンでは、カラム単位で圧縮アルゴリズムや圧縮レベルを選択可能マスターサーバマスターサーバセグメントサーバセグメントサーバセグメントサーバセグメントサーバ重複除外重複除外重複除外重複除外重複除外重複除外 Data Domain DD Boostにより、重複除外プロセスの一部が各マスターサーバ、セグメントサーバに分散され、より高速あなバックアップが実現できます。

(8)

Greenplum DBの適用範囲

ここでは、Greenplum DBがどのような分野に適用できるかをお話しします。 Greenplum DBはデータウェアハウス用の製品ですので、当然データウェアハウスに適用できますが、それ以外にもデータベースの最適化という分野で多く利用されてます。最適化の具体例としては、バッチ処理への適用です。既存のシステムにおいて、データ量の増加にともないバッチ処理の長時間化がシステムの課題となっているケースが多く見受けられます。既存のデータベース・システムに対してCPUやメモリーを追加しても性能が伸びない。また、チューニングをいくら実施しても性能が伸びない。このような状況はよくあるのではないでしょうか。データ分析を業務に活用したいが、膨大な初期投資が掛かるため、ROIが計れずに着手できていないインフラ整備に費用がかかり、分析業務への投資が回らない Community Editionの発表容量課金モデルでのライセンス S/W提供による柔軟なH/W構成汎用的なオープンテクノロジーの活用 DWH/分析/BI環境のスモールスタート既存運用に則ったシステム構築大容量データでの分析を行いたいが、うまく回せる技術基盤がない大容量データを扱うためのシステムコストが膨大になってしまう超並列処理(MPP)による高パフォーマンスのDB処理高速データロードスケールアウト構成による拡張性大容量データに適したアプライアンス製品予測不可能な将来のDWH環境活用に備えた、柔軟な拡張性をもったシステム構成 Oracle等商用RDBのバッチ処理時間がかかっており、オンライン処理に影響を及ぼしている商用RDB S/Wのコスト負荷クエリ(大量データ検索など)のレスポンスが遅い超並列処理(MPP)による高パフォーマンスのDB処理高速データロード容量課金モデルでのライセンス S/W提供による柔軟なH/W構成汎用的なオープンテクノロジーの活用汎用的インターフェースの採用バッチ処理をGreenplum環境に切り出すことによる既存DBシステムのシステム/ コスト最適化高パフォーマンスの参照系DB 課題 Greenplum DBの特徴 Greenplum DBの活用ＨＷＤ化適最ＢＤこれはシェアードエブリシング・アーキテクチャにおいて多く見受けられる課題です。バッチ処理の流れは、データのローディング、スキャン、テーブルの結合、集計、最後にアンロードして返していく、というものです。シェアードエブリシング・アーキテクチャの場合、これら全ての処理が1台のサーバの中で処理されるため、全フェーズにおいてボトルネックが発生することが課題でした。 1.ロード 2.スキャン 3.結合 4.集約

Σ

5.アンロードノード#1 シェアードエブリシングアーキテクチャノード#1 ノード#1 ノード#1 ノード#1 シリアル処理のため、全フェーズにてボトルネックが発生次にシェアードナッシング・アーキテクチャの場合を見てみましょう。他社のシェアードナッシング・アーキテクチャが採用している仕組みの場合、スキャン、結合、集約の各処理はパラレル化出来ていますが、データのロード、アンロードの部分はマスターサーバがボトルネックとなります。

Σ

従来のMPP Greenplum DB 1.ロード 2.スキャン 3.結合 4.集約 5.アンロードノード#1 ノード#1 ノード#1 ノード#1 ノード#２ノード#２ノード#２ノード#1 ノード#３ノード#３ノード#３ノード#1 ノード#1 ノード#1 ノード#２ノード#２ノード#２ノード#３ノード#３ノード#３ノード#1 ノード#２ノード#３ノード#1 ノード#２ノード#３ノード#ｎノード#ｎノード#ｎノード#ｎノード#ｎこれに対してGreenplum DBは、ロードもアンロードもパラレル化できますので、全フェーズにおいてパラレル処理が可能です。加えて、セグメントサーバの追加により、パラレル度を容易に上げることができます。他製品と比べ、より大規模な並列分散処理により高速にバッチ処理を実行することが可能なのです。このすべてのフェーズにおけるパラレル化は、Hadoopの環境にも有効です。 Hadoopから、パラレルにデータを抜き出し、そのままスキャン、結合、集約、アンロードまで、すべてパラレル処理をして、そのままHadoopにシームレスにデータを戻す。このようなことが可能です。

Σ

Greemplum DB Hadoop 処理 Hadoop 処理 1.ロード 2.スキャン 3.結合 4.集約 5.アンロードノード#1 ノード#1 ノード#1 ノード#1 ノード#1 ノード#２ノード#２ノード#２ノード#３ノード#３ノード#３ノード#２ノード#３ノード#２ノード#３ノード#ｎノード#ｎノード#ｎノード#ｎノード#ｎノード#1 ノード#２ノード#３ノード#ｎノード#1 ノード#２ノード#３ノード#ｎ他システムとのパラレル連携を機能強化

バッチ処理最適化の事例

バッチ処理にGreenplum DBを適用し、最適化に成功されたお客様事例をご紹介します。このお客様は、他社のデータベース・システムでCRM/SFAを運用していました。全国の営業が、自分の顧客の販売履歴を確認できるというシステムです。しかしながら、夜間のバッチ処理が終わらず、毎朝営業に、どの顧客に訪問すべきかというデータを、必要なタイミングで渡せなくなりつつありました。データ量が増加する一方で、営業のシステム利用頻度も増加しており、現状の仕組みでは処理が追いつかなくなってきていたのです。そこで、他の製品・ソリューションを検討され、様々な性能検証を交えて検討した結果、Greenplum DBが採用されました。性能検証では、ロード性能、クエリ性能、多重アクセス性能、バッチ処理などを実施しました。既存のデータベース・システムは残しつつ、そのデータベースの参照用キャッ

Greenplum DB

の利用イメージと、さまざまなニーズに応える提供形態

図20: Greenplum DBの適用範囲図21: バッチ処理往年の課題図22: バッチ処理フロー比較図23: Greenplum DB 4.1によるバッチフローシュとしてGreenplum DBをDWHデータベースとして適用したのですが、その結果バッチ処理は20倍高速化され、データのロード性能は103倍向上しました。それ以外にも、非定型のクエリで27倍の高速化が確認されて、性能としては申し分なく、最後は他のDWHデータベース製品とのコスト比較になりましたが、 Greenplum DBは他製品と比べて数分の一で済み、そのコストパフォーマンスの高さが評価されて採用に至りました。既存システムに対する負荷を、Greenplum DBを使いオフロードした結果、性能面、コスト面でも高い効果が得られたという事例です。

データベース機能別役割

図24は、データベースの機能を分類し、Greenplum DBが得意な適用範囲を示した表です。 OLTPデータベース、キャッシュ用のデータベース、バッチ処理用データベース。そしてデータウェアハウス用のデータベースがあります。機能 OLTP 処理参照系処理の高速化_{(キャッシュ)} バッチ処理 _{ウェアハウス}データ主なユーザー •_•顧客_顧客窓口 •顧客 •顧客窓口 •アナリスト -•マネジメント •アナリストサービス •オンライントランザクション •オンライン参照 •オンライン参照 •レポーティング (定型帳票/定型検索) •集計 •データマート作成 • レポーティング •データマイニング /非定型検索アクセス・プロファイル •複数ユーザによる頻繁な検索と更新 •複数ユーザによる頻繁な検索 •バッチプロセスによるデータの集計とテーブル作成 •複数ユーザによる頻繁な検索と分析ストアデータ最新のデータ直近 3ヶ月のデータ集計対象データ過去 3年間の長期_データ候補 DB Oracle_DB2 GreenplumDB GreenplumDB GreenplumDB

適用範囲 Greenplum DBはOLTP系以外すべてに適用できます。図25でそれぞれ説明していきます。 OLTP系処理には、既存のOracleやDB2が適しています。一方、参照系にかかる負荷をオフロードしたい場合には、キャッシュ的な役割で、トランザクション・データベース用のサーバの前にキャッシュサーバを置き、これにクライアントからアクセスすることで、トランザクション・データベースに対する負荷を下げられます。ここのキャッシュ用データベースとして、Greenplum DBを適用し、参照系処理の性能を上げることができます。次は、トランザクション用データベースのバックエンドにGreenplum DBを置いて、日中のトランザクション処理に関してはOracleなどで行い、夜間バッチ処理はバッチ処理用のGreenplum DBにデータをロードして集計処理などを行い、朝までにトランザクション・データベースにデータを戻す仕組みです。最後はデータウェアハウスです。フロントのトランザクション・データベースからGreenplum DBにデータをロードし、BIツール経由でユーザがクエリを発行して分析やレポーティングを行うという一般的なデータウェアハウスの用途です。このように、Greenplum DBはOLTP系以外の様々な用途で効果を発揮します。トランザクションキャッシュトランザクションバッチデータウェアハウストランザクション OLTP処理高速化(キャッシュ)参照系処理のバッチ処理データウェアハウストランザクションザクショントランザクショントラン図24: データベース機能別役割(1/2) 図25: データベース機能別役割(2/2)

EMC-greenplum-SG s-1p

1

データ・ウェアハウスの未来をリードするGreenplum DB

2

ビッグデータ活用でビジネス変革を実現

企業向け次世代Hadoopソリューション Greenplum MR

18

Contents

徹底解説

Greenplum MR (旧Greenplum HD）が

「 ITpro EXPO AWARD 優秀賞 」

を受賞しました

バッチ処理・データ解析における汎用RDBMSの課題

シェアードナッシング・アーキテクチャ

徹底解説その１

データ・ウェアハウスの未来をリードするGreenplum DB

Greenplum DB

の特徴・アーキテクチャを理解する

Greenplum DBの位置づけ

Greenplum DBの3つの特徴

シェアードナッシング・アーキテクチャの実装により、

高速なバッチ処理・データ分析を実現

シェアードナッシング・アーキテクチャ

による高速

DB

処理

4

5

世界最高速のデータロード性能

TB/h

0

2

4

6

8

10

12

TB/h

世界最高速のデータロード性能を実現するGreenplum DB

のScatter/Gather Streaming 技術 活用例1

データロード：従来の処理方式

世界最高速のデータロード性能を実現する

Greenplum DB

の

Scatter/Gather Streaming

技術

Greenplum DB の徹底した並列処理

世界最高速のデータロード性能を実現するGreenplum DB

のScatter/Gather Streaming 技術 活用例2

世界最高速のデータロード性能を実現するGreenplum DB

のScatter/Gather Streaming 技術 活用例3

世界最高速のデータロード性能を実現するGreenplum DB

のScatter/Gather Streaming 技術 活用例4

Hadoop

GreenplumDB

Greenplum DBにおけるマスターサーバの役割

8

9

データレコードの分散処理

クエリのパラレル処理

高度なパイプライン処理により高速化されたソーティング

複雑な検索・集計・分析を、短時間に処理するための先進機能

Greenplum Polymorphic Data Storage

が提供する豊富

な選択肢

テーブルパーティショニングによる 検索範囲の限定

Greenplum Polymorphic Data Storage

が提供する豊富な選択肢

既存投資の保護とさらなる高速化へ – インデックス

Ze

b

ar

Root

B

oo

k

ra

C

1

1 1

「 ITpro EXPO AWARD 優秀賞」

のScatter/Gather Streaming 技術活用例1

のScatter/Gather Streaming 技術活用例2

のScatter/Gather Streaming 技術活用例3

のScatter/Gather Streaming 技術活用例4

テーブルパーティショニングによる検索範囲の限定