過去と現在を分析して
未来を予測
HP Vertica Analytics Platform
のコア
/
拡張分析機能を活用して
分析主導型の企業を構築
目次
エグゼクティブサマリー...2
データを活用した競争力の強化 ...2
HP Vertica Analytics Platformの分析機能 ...3
HP Vertica SQL:SQL-99準拠の標準SQL ...3
HP Vertica拡張SQL:Vertica独自の分析用SQL ...5
HP Verticaユーザー定義拡張機能 ...6
HP Vertica Analytics Platformの高度なビッグデータ分析 ...7
データ収集 ...8 メリットの活用:ケーススタディ ...9 顧客分析 ...9 運用分析 ...9 患者分析 ...10 センサーデータ分析 ...10 HPの専門知識とサポートであらゆる要素を統合 ...11 まとめ ...12 詳細情報 ...12
エグゼクティブサマリー
HP Vertica Analytics Platformはインデータベース分析機能に最適な環境を提供すると同時に、Rなどの高 度な分析ライブラリとの緊密な統合も実現します。このホワイトペーパーでは、プラットフォームが備えてい る広範な分析機能 (SQL-99準拠の標準SQL、Vertica独自の分析用SQL、カスタムロジックを使用した高度 な分析機能、ユーザー定義拡張機能など) について説明します。
本書には、HP Vertica Analytics Platformの実際の利用例を紹介する短いケーススタディが掲載されています。 また、HP Vertica Analytics Platformの組み込み機能の実装方法や、プラットフォームのC++、Java、Rのソ フトウェア開発キット (SDK) を使用して次世代の分析機能を独自に開発する方法についても説明します。
データを活用した競争力の強化
今日のビジネス環境において組織の競争力を強化する上では、大量のデータを有益なインサイトに変換し、 顧客行動、市場機会、ビジネストレンド、製品品質、セキュリティ脅威などを把握できるかどうかが重要になっ ています。このようにデータの重要性が高まるとともに、多くの組織がビッグデータ分析プラットフォームを 導入し、データから実用的なインサイトを獲得しようと取り組んでいます。 多くの場合、分析プログラムの作成や拡張の契機となるのは、新規プロジェクト発足時や、既存プロジェク トで、組織に必要な情報を得られていない場合です。先見の明のある組織の多くは、適切な情報を適時に組 織で活用する方法として、このタイミングでビッグデータ分析に注目しています。 組織でプロジェクト用の分析プラットフォームを検討する場合は、幅広い点に注意することが重要です。特に、 全体的な戦略を策定する際に考慮すべき機能としては、ビッグデータの収集、将来のデータ量に対応できる 分析クエリの実行と拡張、エンドユーザーによる分析の使用拡大への準備、さらには将来使用される高度な 分析への準備が挙げられます。 最終的には、分析の力によってデータの民主化が可能になり、組織での情報に基づく的確な意思決定、競争 力の向上、真の情報収益率の実現につながります。これらは、分析主導型の企業の核心となる概念です。 分析の深さのバリエーション 留意すべきもう1つの点は、分析プラットフォームが提供する分析の深さには大きな差があることです。たと えば、NoSQLデータベースは多くの場合、Hadoop上でSQLの基本的な実装のみを提供します。また、クラ ウドベースのソリューションによっては、お客様のビジネスを完全に理解するために必要となる分析の一部し か提供されていません。 そのような限定的なビジネス分析では、情報の消費者に分析を提供するスピードとアジリティに影響が及び ます。分析エンジンが基本的なSQLしか受け付けなければ、ビジネス目標を達成するためにはカスタムコー ドが必要になる場合が一般的です。基本的なSQL-on-Hadoopエンジンでは、一部の分析にETLプロセスや データの移動が必要になり、インプレース分析はできない可能性があります。このような場合、クエリの開 発とデータの移動によって、高度な分析に過剰な手間がかかるようになります。面倒なコーディングやデータ 変換が原因となり、ビジネスや分析の変革に悪影響が及びます。 分析主導型の企業の構築 分析主導型の企業においては、ビッグデータを活用することで、意思決定者が過去 (何が起きたか、なぜ起 きたか) を理解し、未来に対する予測や決定の改善に必要なインサイトや展望を獲得しています (図1)。 分析主導型の企業を構築するために、多くの組織はHP Vertica Analytics Platformのコア機能から利用を始 めています。これらの機能について以下で説明します。図1. 過去と現在を分析して未来を予測 この一連の図は、分析主導型の企業がビッグデータを使用して顧客定着率を高める方法を示しています。 情報 インサイト 意思決定 対応
診断
把握
予測
対処
予防
何が起きたか? なぜ起きたか? 今後何が起きるか? どう対処すべきか? 追加の対応は可能か? 過去6か月間の減少率は どの程度か? どのような顧客を 失ったか? どのような顧客の維持を 目指すか? どのような対応が できるか? 連絡しなければ離れて いく可能性が最も高いのは どのような顧客か? なぜ減少率が 上昇したのか? 連絡すると離れるのは どの顧客か? 顧客が必要性に気付く前に 何を提供できるか? 付加価値を提供 できるか ?HP Vertica Analytics Platform
の分析機能
HP Verticaの分析機能には、SQL-99準拠の標準SQLから、Vertica独自の分析用SQL、カスタムロジックを 使用した高度な分析機能までが揃っています。これらの機能は、HP Verticaプラットフォームのコア機能 (カ ラムストレージ、高度な圧縮、超並列処理 (MPP) アーキテクチャー) を活用することで、ビッグデータのニー ズに対する高いパフォーマンスと拡張性を実現しています。
また、HP Vertica Analytics Platformは拡張可能な設計です。Vertica MPPアーキテクチャーやデータローカ リティ計算を活用できるカスタムSQL分析機能の開発が可能です。HP Vertica Analytics Platformは一般的 な言語 (C++、Java、R) をサポートしており、ユーザー定義拡張機能 (UDx) を迅速に開発できます。
HP Vertica SQL:SQL-99
準拠の標準
SQL
HP Vertica Analytics Platformには、ANSI 99標準に基づいた幅広いSQL関数が組み込まれています。
集約関数
集 約関数は、クエリ結果セットの複 数の行グループにわたるデータを要約します。HP Vertica Analytics Platformは、次のような幅広い集約関数をサポートしています。
• Sum、Min、Max、Count、Avgなどのシンプルな関数 • 分散、共分散、標準偏差、相関を計算する統計関数 • 正規表現、高速に実行される近似関数 (ユーザー指定のエラートレランスあり) HP Verticaのコア機能を使用するこれらの集約関数の拡張性とパフォーマンスは、従来のデータベースより 何倍も優れています。 分析関数 HP Verticaの使いやすいSQL関数により、複雑なクエリを大幅に簡単に書けるようになります。これらの関 数では、標準的なSQLコードを数行使用するだけで複雑な分析要件やレポートタスクに対応でき、NoSQLフ レームワークのコードを何千行も書く必要はありません。
たとえば、単一のSQL分析関数を使用して、HP Vertica Analytics Platformで以下のような複雑な分析要件 に対応できます。
• 特定の州で最も長期にわたる顧客をランク付け • 指定した期間の小売量の移動平均を計算 • 同学年のすべての生徒の中で最高点を発見
分析関数の用途は、グラフ分析、トライアングルカウンティング、モンテカルロ法などです。これらの分析操 作は、従来のデータベースではパフォーマンスが低いため、実現できません。列形式のMPPデータベースを 備えたHP Verticaは、こうした複雑な操作に対するパフォーマンスや拡張性が優れています。 グラフ分析 グラフ分析は関係の理解に役立ちます (ソーシャルネットワーク上の関係など)。また、ネットワーク上の不 正行為やスパマーの検出にも使用できます。 グラフ分析は以前から、リレーショナルデータベースのショーストッパーでした。グラフを表現および分析す るためのテーブル構造はシンプル (通常は数個の列のみ) ですが、グラフ内の接続を表現するには自己結合 が必要となるため、組み合わせにより結果セットの行数が爆発的に増加します。行指向のデータベースプラッ トフォームでは、グラフクエリの実行中に作成される大量のデータにまったく対処できません。 一方、HP Verticaはこの作業に適切に対応できます。列指向のデータベースプラットフォームのためグラフデー タに対するパフォーマンスが非常に高く、MPPアーキテクチャーにより必要に応じたシステムの拡張も容易 です。 トライアングルカウンティング トライアングルカウンティングは、HP Verticaの分析関数によってグラフ分析の従来の課題を解決する方法の 例です。友人関係を例にして説明すると、自分の友人2人が互いに友人であった場合、この3人は友人関係 のトライアングルを形成しています。HP Verticaにより、シンプルなSQL関数を使用してトライアングルをカ ウントし、高いパフォーマンスでグラフ分析を実施できます。 モンテカルロ法 モンテカルロ法の主な仕組みは、その名が示すように、カジノに行って何度もサイコロを振り、自分が勝つ可 能性が高いか、カジノ側が勝つ可能性が高いかを判断するようなものです。この説明は単純ですが、本当の 魅力は総当たり方式の適用にあります。つまり、ゲームのルールや物理学に複雑な分析を適用する代わりに、 何度も実際にプレイして結果を確認します。
HP Vertica Analytics Platformはモンテカルロ法の実装に適したプラットフォームです。また逆に、モンテカ ルロ法はデータ分析に対する優れたツールです。特に、長時間検討を続けるよりも総当たり方式の方が有効 と考えられる状況では優れています。
地理空間
HP Vertica Analytics Platformには、地理空間分析向けの関数が組み込まれています。HP Vertica Analytics Platformに自動でインストールされる数学関数により、一般的な地理空間操作を実行できます。
また、HP Vertica Placeはさらに多くの地理空間SQL関数をHP Vertica Analytics Platformに提供します。 パッケージインストールにより、地理的位置データのレポートや分析が可能になります。地理空間情報の収 集と分析をサポートする地理空間機能が提供され、「場所」に関するより多様な分析が可能となります。 お客様の組織は、ビッグデータと位置データを組み合わせることで、正確な位置に基づくターゲット広告を 使用したパーソナライズされたマーケティングを実現できます。位置をブランドアフィニティ、消費者が興味 を持っているポイント、動的なモバイル行動と結び付ければ、最も重要な顧客に狙いを絞れます。
HP Vertica Placeは、基盤となるHP Vertica Analytics Platformのパフォーマンスと拡張性を活用していま す。ESRIシェープファイルのデータローダー、Open Geospatial Consortium (OGC) のWell-Known Text (WKT) および Well-Known Binary (WKB) 形式でのデータ表現、2次元の平面データを計算する多数のOGCベース SQL関数をサポートしており、球関数も限定的にサポートしています。
HP Vertica PlaceはHP Vertica Marketplaceからダウンロードできるほか、Dragline(version7.1.1)リリースに も主要な機能強化として含まれています。
HP Vertica
拡張
SQL:Vertica
独自の分析用
SQL
HP Verticaは幅広い拡張分析機能を提供します。これらには、セッション化、時系列分析、イベントベースのウィ ンドウ、イベント系列結合、ソーシャルメディア、パターンマッチング向けの機能が含まれています。 セッション化 セッション化 (特別なイベントベースのウィンドウ) は、クリックストリームの分析で多く使用される機能で す (特定の期間内に記録されたWebクリックからWeb閲覧セッションを特定するなど)。このような用途に は総当たり方式の手続き型手法も使用できますが、HP Vertica Analytics Platformのアプローチはシンプル、 効率的、超並列であるため、Webセッション化をアドホックに実行でき、さまざまなウィンドウパラメーター をオンザフライで決定できます。たとえば、30秒は平均的なWeb訪問セッションではないと仮定します。HP Vertica Analytics Platformは同 等のIPアドレスからのセッションの間隔を自動的に分析し、実際の平均セッション時間を決定して、そのパ ラメーターに基づいて自動的にデータをトークン化/セッション化できます。
時系列
時系列分析は、任意の変数セットの値を長期間にわたり評価して、それらの値を分析および集約用のウィン ドウにグループ化します。HP Vertica Analytics Platformは時系列分析に適したデータ構造を持つことが可能 なプラットフォームです。列指向のため、時系列データをソート、圧縮、分割でき、最適なパフォーマンスを 実現できます。
HP Vertica Analytics Platformは、補間スキームとしてギャップフィリング機能を提供しています。この機能 により、欠けているデータポイントを埋められます。既定の時系列データ間隔の範囲内で、新しいデータポ イントを作成する方法です。プラットフォームはデータ内の時系列以外の列 (タイムスライスにわたり計算さ れた分析関数の結果など) を補間し、欠けているデータポイントを出力に追加します。
イベントベースのウィンドウ
イベントベースのウィンドウ関数は、標準的なSQL分析に対するHP Vertica Analytics Platformの拡張機能 です。これらの関数を使用すると、時系列データ内のイベントの検出が容易になります。イベントベースのウィ ンドウにより、時系列データをウィンドウに分割し、データ内の重要なイベントにフラグを立てられます。こ れが特に有意義なのは財務データです (他のアクティビティのトリガーとして特定のイベントに注目して分析 する場合が多いため)。HP Vertica Analytics Platformのイベントベースのウィンドウ関数は、イベントIDを 表す整数値 (0から開始) を各入力行に割り当てます。イベントIDは、時系列データ内でユーザー指定イベン トが発生するたびに増加します。 たとえば、株価の入力ストリームを例にすると、株式アナリストはスプレッド (売り呼び値と買い呼び値の差) が0.05ドルを超えるたびに、入力された株価を新しいグループに入れたいと考える可能性があります。各グ ループをイベントのウィンドウとして見れば、ウィンドウの終点は特定のイベントタイプの発生によって定義さ れます。
HP Verticaのイベントベースのウィンドウ関数には、Conditional Change EventとConditional True Eventの 2種類があります。これらの関数はHP Vertica Analytics Platformの拡張機能です。
イベント系列結合 HP Verticaは一般的なデータウェアハウスのクエリ結合をサポートしています。また、特別なタイプの結合を 可能にするINTERPOLATE述語も提供しています。イベント系列結合はHP Vertica SQLの拡張機能であり、 測定間隔が正確に揃っていない場合 (タイムスタンプが一致しない場合など) に、2つのイベント系列の分析 を可能にします。これらの結合により、揃っていないイベントデータを直接クエリするための自然で効率的な 方法を実現でき、系列を同じ測定間隔に正規化する必要がなくなります。
ソーシャルメディア
HP Vertica Analytics Platformの分析機能を使用すると、ソーシャルメディアのコンバージョン、参照、ランディ ングページ、データソースの測定が可能になります。プラットフォームの基盤となる最適化されたストレージ 構造およびソーティングによって大量のデータを結合できるため、ソーシャルセンチメントや消費者の購買パ ターンを基にした効率的なコンバージョン率分析を実現できます。
HP Vertica Analytics Platformの時系列分析、セッション化、イベント系列パターンマッチング拡張機能を使 用すると、参照ソーシャルサイトに関するページビュー、継続時間、訪問、ランディングページのヒューリス ティックスや長期間にわたるソーシャルセンチメントを測定できるようになります。
HP Vertica Pulseはエンティティ抽出/センチメント分析エンジンです。短いテキストを自動的に分析すること で、コミュニティでの話題や、それらの話題に対する感情の把握を支援します。HP Vertica PulseはHP Vertica Marketplaceから入手できるほか、Dragline(version7.1.1)リリースにも主要な機能強化として含まれており、 1行のSQLで実行できます。ユーザーや顧客が話題にしているブランド、製品、サービス、イベントのアスペ クト (属性) を抽出可能です。また、これらの属性ごとにセンチメントスコアを割り当てられるため、コミュ ニティが関心を持っているお客様のビジネスのアスペクトに対するコミュニティの認識を追跡できるようにな ります。
パターンマッチング
HP Vertica Analytics Platformはイベント系列パターンマッチング拡張機能を通じて、パスおよびパターン分 析をネイティブでサポートしています。SQL MATCH拡張機能により、大量の履歴データを選別し、イベント のパターンを探せるようになります。パターンを正規表現として指定してから、一連の入力イベント内でパター ンを検索できます。MATCHは分析データの分割および順序付け用の従属節を提供し、パターンマッチングは 連続した行セットで実行されます。 パターンマッチングが特に有用なのは、Web閲覧行動 (ページクリック) に基づいてユーザーのアクションを 特定するクリックストリーム分析です。
HP Vertica Analytics Platformは、ファネル分析もネイティブでサポートしています。これには、標準的な SQL分析およびファネル分析向けに設計された分析拡張機能を使用します。プラットフォームのイベント系列 パターンマッチング拡張機能は、標準的なコンバージョン率、離脱/直帰率、コンバージョンパスの計算に使 用できます。標準的なSQL分析 (LAGおよび正規表現分析など) を組み合わせることで、コンバージョンパス を分析できます。
HP Vertica
ユーザー定義拡張機能
HP Vertica Analytics Platformのユーザー定義拡張機能 (UDx) を使用すると、標準的なSQLでは実行が困難 な場合が多い分析操作に対して、最適なビジネスロジックを実行できるようになります。
HP Verticaの広範なユーザー定義機能 (関数、変換、集約、分析、ローディング) により、手続き型コード のパワーと柔軟性をデータ (構造化/半構造化/非構造化) に対して利用できるようになります。その際は、 HP Vertica Analytics Platformの並列コンピューティング環境を最大限に活用します。ユーザー定義拡張機能 は、効率の最大化のためにインプロセスで実行するか、制御を強化するために専用プロセスで実行します。 どちらのモードでも、HP Verticaのユーザーインターフェイスによって手続き型拡張機能の配備と使用が容易 になり、維持可能な運用プラクティスやコードの再利用を促進できます。 手続き型と宣言型 タスクを一連のアクションに分割するために必要な手順を考慮すれば、多くの人にとっては、手続き的に問 題解決にアプローチする方が簡単です。一方、SQLは宣言型言語です。オペレーターが必要な出力を指定し、 データベースは最適な手続きを開発して効率的に答えを計算します。 HP Vertica Optimizerも例外ではありません。クラスターのデータがどのように分散しているかや、最もコ スト効果の高い結合順序を理解し、効率の良いクエリプラン (手続き内のステップ) を生成します。しかし、 SQLで表現するのが困難または煩雑な操作も存在します (特に入力が非構造化/半構造化の場合)。手続き 型言語の方が自然な場合には、ユーザー定義拡張機能が順当な選択です。
HP Vertica Marketplace
HP Vertica MarketplaceはUDxの開発や配布を支援する専用ウェブサイトです。開発者、パートナー、お客 様用のハブであり、HP Vertica Analytics Platformと統合して価値を高める拡張機能、機能強化、ソリューショ ンの作成や共有に利用できます。
これらのアドオンやソリューションには、コネクターおよびサードパーティ拡張機能、ビジネスインテリジェン スツール、Extract/Transform/Load (ETL) およびデータ変換製品、HP HAVEnビッグデータ分析プラットフォー ム用のコネクターおよびツールが含まれます。また、インダストリおよび他のOEMソリューションも含まれ ます。
HP Vertica Innovations
プログラム
HP Vertica Marketplaceでは、最新のHP Vertica Innovationsが提供されています。これらは、最先端のビッ グデータアプリケーションの作成を支援するインキュベーションプログラムの成果です。このような新しいテ クノロジーやソリューションは開発者が使用でき、その評価やフィードバックは将来の開発の指針となります。 HP Vertica Innovationsには以下が含まれています。 • HP Vertica Distributed R ̶データサイエンティストが直面するRプログラミング言語の拡張性やパフォーマ ンスの制約を克服できます。複数のノード上でR計算を実行して大規模データセットの分析を加速すること で、以前は解決できなかった問題に対処できるようになります。 • HP Vertica Pulse ̶組織でインデータベースのセンチメント分析ツールを使用できるようになります。短い データポスト (Twitterフィードや製品レビューなどのソーシャルデータを含む) にスコアを付けることで、最 も関心を集めている話題を判断し、時間の経過によるセンチメントの変化を分析し、支持者や中傷者を特 定できます。 • HP Vertica Place ̶地理空間データ (位置、ネットワーク、地域など) をほぼリアルタイムに保存および分 析します。この分析パックは、Open Geospatial Consortium (OGC) 標準ベースの機能を提供し、サードパーティ アプリケーションと統合できます。
HP Vertica Analytics Platform
の高度なビッグデータ分析
HP Vertica Analytics PlatformへのRの統合により、大規模データセットに対する高性能な予測分析が可能 になりました。HP Vertica Distributed Rは、R言語を拡張してRでの並列プログラミングをサポートし、数 テラバイトのデータに対して拡張および実行できるアルゴリズムをデータサイエンティストが書けるようにし ました。R言語へのユーザー定義拡張機能により、データサイエンティストはデータベースにRプログラムを 配備して、高いパフォーマンスと拡張可能なインデータベーススコアリングを実現できます。 予測分析 予測分析は、従来の記述的分析よりもプロアクティブで深い分析です。記述的分析はデータのスライス & ダ イスにより、何が起きたか、何が起きているか、なぜ起きたかを把握する上で有用です。一方、予測分析では、 履歴データからパターンを把握することで今後何が起きるかを予測できます。
HP Vertica Analytics Platformは統計計算用にRをネイティブでサポートしています。モデリングや分類用の パブリックなRライブラリや関数が多数存在し、HP Vertica Analytics Platformに容易にインストールできま す。プラットフォームのR実装はインデータベースで実行され、R関数を並列化できるため、HP Verticaの基 盤となるMPPプラットフォームを活用できます。
HP Vertica Analytics PlatformのSDKにより、R関数の開発や、多数のパブリックなR機能の統合が可能 になります。データ表現に関しては、多種多様な商用およびオープンソースの可視化ツールをHP Vertica Analytics Platformとともに使用できます。
データ収集
HP Vertica Analytics Platformは、サードパーティおよびオープンソースのデータベース、データ管理ツール、 データ分析パッケージとの統合を可能にします。好みや開発スキルに応じ、HP Vertica SDKを使用してカスタ ムのC++、Java、Rコードを書くことができます。これらの機能により、ビッグデータのニーズに合わせてHP Verticaを簡素化および拡張できます。
次のような接続オプションがあります。
• ODBC (Open Database Connectivity) ̶データベース管理システムへのアクセス用の標準的なAPI
• JDBC (Java Database Connectivity) ̶ Javaプログラムとデータソース間の接続を提供するコールレベルAPI • Apache Hadoop ̶業界標準ハードウェアのクラスター上で大規模データセットを保存/処理するオープン
ソースのソフトウェアフレームワーク
• Apache Hive ̶分散ストレージ内の大規模データセットに対するクエリと管理を可能にするデータウェアハ ウスパッケージ
• HP Vertica Flex Zone ̶急増する半構造化データ/構造化データのロード、探索、分析、収益化を迅速か つ容易に実現できる製品
以下はHP Vertica Analytics Platformのコア機能とそれを実現するプラットフォーム機能の概要です。
機能 プラットフォーム機能 センチメント分析 時系列分析、セッション化、イベント系列パターンマッチング 拡張機能、センチメント分析エンジン(HP Vertica Pulse) ソーシャルメディア監視 イベント系列パターンマッチング、時系列分析、最終反復ソー シャルコンバージョン、セッション化 パターンおよびパス分析 パターン認識、予測モデリング 時系列分析 ギャップフィリングおよび補間 予測モデリングおよび統計分析 線形回帰、ロジスティック回帰、Random Forest 顧客セグメンテーション K平均法 地理空間分析 地理空間SQL関数 (HP Vertica Place)
メリットの活用
:
ケーススタディ
顧客分析
さまざまなソーシャルメディアプラットフォーム上で100種類以上のゲームを提供しているオンラインゲーム 企業が急成長を続け、同社の分析プログラムでは成長への対応が困難になっていました。同社はデータ主導 型の組織ですが、MySQLデータベースのパフォーマンスが原因となり、A/Bテストの実行や数千万人のユー ザーに関するレポートの取得が不可能になっていました。同社はHP Vertica Analytics Platformを試用してテストし、実運用環境に導入しました。テスト作業や分析 作業をHP Vertica Analytics Platformに移行することで、以前は9時間かかっていたA/Bテスト結果クエリ が12秒で戻るようになりました。同社では、1日あたり合計約8億行のイベントデータが追加されています。 最大のテーブルは、1兆2,000億行あるイベントテーブルです。また、ユーザーのディメンションテーブルは5,000 万行で、それより小規模なテーブルも複数あります。
運用分析
ある大手通信会社は、HP Vertica Analytics Platformをネットワークパフォーマンスデータ分析に使用するこ とで、ネットワーク使用率を詳細に把握できるようになり、機器購入のコストを数百万ドル削減できました。 同社ではHP Vertica Analytics Platformのクラスターを複数配備して、分析チームが使い慣れたSQLコマン ドで膨大なデータをクエリし、わずかな時間で結果を取得できるようにしました。また、データネットワーク の使用状況データを長期間にわたって保存および分析することで、動向の予測を容易にしました。
さらに、HP Vertica Analytics Platformは同社が使用している可視化ツールとシームレスに接続できるため、 同社は時刻、ピーク時間帯、設定日数に応じてさまざまな指標のステータスを表示するダッシュボードを作 成しました。また、HP Vertica Analytics Platformを使用して何十億もの記録に関する因果関係を分析し、 「What-If」シナリオを実行することで、同社はデータ分析が持つ新たな可能性に気付きました。
患者分析
ある大手医療ソリューション企業は、医療機関向けの電子医療記録を実現するアプリケーションプラット フォームを扱っています。また、ケアの提供を迅速化し、無駄やミスを排除するための医療機関のプロセス 最適化も支援しています。 顧客が求める迅速なレスポンスと全体的なパフォーマンスをプラットフォームが提供できるように、同社は約 2,000個のレスポンスタイマーをプラットフォームに組み込んでいます。これらのタイマーは、特定のアプリ ケーション機能 (患者情報の追加/アクセス、投薬指示/処置の入力など) に要した時間を検出します。デー タ量が増加し続ける中で、既存のレガシーデータウェアハウスは深刻なパフォーマンス問題に直面し、同社 は変化の必要性を認識しました。同社は他の高度な分析プラットフォームも5個テストしましたが、最終的にHP Vertica Analytics Platformを 選択し、同社が提供するアプリケーションプラットフォームや別の医療ソリューションの支援に活用していま す。HP Vertica Analytics Platformによって、同社は高度なパフォーマンス監視や医療データ分析を、アプリ ケーションプラットフォームや独自の医療情報レポートソリューションに統合しています。
このアプリケーションアーキテクチャーにより、臨床医が患者情報を最適なタイミングと場所で入手できるよ うになります。また、適切な指標やレポート機能も利用できます。同社はHP Vertica Analytics Platformが 提供するパフォーマンス情報を活用することで、パフォーマンス問題への適切な対処を実現し、使用パター ンを分析して継続的な改善につなげています。
センサーデータ分析
HP ProLiant Gen8サーバーのリリースとともに、遠隔測定データをHPに送信する「Call Home」機能が導入 されました。HPは受信した遠隔測定ストリームをロードし、そのデータを分析して、問題 (保証イベントなど) が発生したハードウェアやソフトウェアの構成内にある一定のパターンを探す取り組みを始めました。保証イ ベントが発生すると、HPにはサポートのコストがかかり、お客様の満足度も低下します。
HPは分析で発見した問題について、お客様にプロアクティブに通知したいと考えていました。たとえば、「HP ProLiant XYZにABZソフトウェアをインストールすると、X%の確率で障害が発生します。次の方法で問題 を解決できます」と通知するなどです。
遠隔測定のデータは、24時間365日ストリームされています。キーストロークや構成変更があるたびに、ロ グがHPに送信されます。障害のシナリオや修正方法はエンジニアが判断する必要がありますが、HP Vertica Analytics Platformを使用すれば、エンジニアは障害が発生しているパターンを詳細に把握でき、障害の影 響が広範囲に及ぶ前に修正できるようになります。
HP Vertica Analytics Platformは、オンザフライでの動的な予測の作成機能、スピードおよび圧縮、パターン の検出を支援するインデータベースアルゴリズムのサポートにおいて付加価値を提供します。
HP
の専門知識とサポートであらゆる要素を統合
HPは分析主導型の組織への変革をサポートします。HP Vertica Analytics Platformの幅広い機能や補完的な サードパーティソリューションを最大限に活用できるよう、HPは一連のプロフェッショナルサービスやデータ サイエンティストの専門知識を提供しています。
これらの分析エキスパートのサポートにより、HP Vertica Analytics Platformの機能の適切な組み合わせを特 定し、プラットフォームのC++、Java、RのSDKを使用してサードパーティおよびオープンソースのソリューショ ンとお客様の分析環境を統合できます。また、分析導入のベストプラクティスや、さまざまな組織でのアプロー チについて理解を深められるようサポートします。 発展を続けるエコシステム HPの専門知識に加えて、my.vertica.comを通じてHP Verticaユーザーコミュニティの知識も活用できます。 このポータルでは、ソフトウェアダウンロードやドキュメント、ディスカッションフォーラムにアクセスできる ため、社内のチームが専門領域の知識を増やし、共有し、発展させる上で役立ちます。
まとめ
HP Vertica Analytics Platformは新時代のデータ分析プラットフォームであり、ビッグデータを活用したビジ ネス分析向けに新規に設計されています。このプラットフォームはインデータベース分析機能に最適な環境を 提供すると同時に、Rなどの高度な分析ライブラリとの緊密な統合も実現します。 HP Verticaの広範な分析機能には、SQL-99準拠の標準SQL、Vertica独自の分析用SQL、ユーザー定義拡張 機能、カスタムロジックを使用した高度なビッグデータ分析機能などが含まれます。プラットフォームの組み 込み機能の活用に加えて、プラットフォームのC++、Java、RのSDKを使用して次世代の分析機能を独自に 開発することもできます。
最終的には、HP Vertica Analytics Platformにより、組織での情報に基づく的確な意思決定、競争力の向上、 真の情報収益率の実現が可能になります。これらは、分析主導型の企業の核心となる概念です。
詳細情報
HP Vertica Analytics Platformの 詳 細 情 報 (ケース スタディ、ホワイト ペーパーな ど) につ いては、