• 検索結果がありません。

Joint Content Development Proposal Tech Docs and Curriculum

N/A
N/A
Protected

Academic year: 2021

シェア "Joint Content Development Proposal Tech Docs and Curriculum"

Copied!
40
0
0

読み込み中.... (全文を見る)

全文

(1)

徹底解説!

Hortonworksが提供する次世代

データプラットフォーム

蒋 逸峰 & 河村 康爾

Hortonworks

(2)

2 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

DATA AT REST

蓄積されたデータ

DATA IN MOTION

流れているデータ

のための情 報

判断 ・ 行動

リアルタイム

データ基盤

Hortonworks

DataFlow (HDF)

ビッグデータ基盤

Hortonworks Data

Platform (HDP)

EDGE

CLOUD

総合的な管理、セキュリティやガバナンス

ON-PREMISES

(3)
(4)

4 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

(5)

ELT

(6)

6 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

YARNはOSとしてリソース管理を行い、

柔軟なAPIにより様々なアプリケーション

が共存できるようになる

HDFSは構成・非構造化データを

蓄積する巨大なデータストア

これにより、様々な組織や部署のひとが

共用Hadoop/Sparkクラスタを使う

Division A

Division B

(7)

HDFS –

Hadoop Distributed File System

構造・非構造化データ

非常に高いスケーラビリティ

高い可用性と耐久性 (No SPOF)

スナップショット

(8)

8 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

Hive 2 –

SQL

SQL

BI

Hive

DWH

JSON,

CSV

HDFS &

YARN

Hive 2

BIツール

データ導入

蓄積/計算

ETL/SQL

BI

(9)

Hive LLAP

Hive 2

(10)

10 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

蓄積されたデータから、次に何が起こるかを予測する

精度の高い予測を得るために必要なもの

大量のデータ

高度な機械学習アルゴリズム

大量の計算

(11)

Spark

豊富な言語サポート:Scala, Java, Python, R

使いやすいMLlibライブラリ:誰でもできる機械学習

スケールアウト実行エンジンやインメモリキャッシュによる高速モデル作成

Zeppelin:ブラウザでをモデル作成、検証および共有

DWH

JSON,

CSV

HDFS &

YARN

Hive 2

BIツール

予測モデル

非構造

データ

(12)
(13)

Ambari –

– HDP

– File View

– Hive View

(14)

14 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

AD/LDAP

Ranger

HDFS

Hive

YARN

– Audit

(15)

DEMO:

Ambari

HDP

Ambari View

Zeppelin

(16)

16 © Hortonworks Inc. 2011 – 2017 All Rights Reserved

(17)
(18)

18 © Hortonworks Inc. 2011 – 2017 All Rights Reserved

: 3

Real-Time

Prescriptive

Analytics

リアルタイム分析

Real-Time

Predictive

Analytics

Real-Time

Descriptive

Analytics

今何をすべきか?

何が起こり得るか?

今、もうすぐ

今何が起きているか?

(19)

: 3

Real-Time

Prescriptive

Analytics

リアルタイム分析

Real-Time

Predictive

Analytics

Real-Time

Descriptive

Analytics

今何をすべきか?

何が起こり得るか?

今、もうすぐ

今何が起きているか?

(20)

20 © Hortonworks Inc. 2011 – 2017 All Rights Reserved

Descriptive Analytics

/

BI

HDF

Descriptive Analytics

:

-> RDBMS -> ETL (

) -> DWH -> BI

– HDF:

->

-> HDF

https://en.wikipedia.org/wiki/Prescriptive_analytics

(21)

30

(22)

22 © Hortonworks Inc. 2011 – 2017 All Rights Reserved

HDP

クラスタ

データ分析

どうやってデータを集めてくればよい?

Web App, Logs, RDBMS, NoSQL

TCP, HTTP, WebSocket,

JMS, Syslog, Email, Image

JSON, CSV, XML, Avro, Parquet

(23)

Apache NiFi

MiNiFi

Web App, Logs, RDBMS, NoSQL

TCP, HTTP, WebSocket,

JMS, Syslog, Email, Image

JSON, CSV, XML, Avro, Parquet

… etc. 多種多様な入力

エッジ、オンプレ、クラウド間

セキュアなデータ転送

HDP

クラスタ

(24)

24

© Hortonworks Inc. 2011 – 2016. All Rights Reserved

DEMO:

Apache NiFi

(25)

: 3

Real-Time

Prescriptive

Analytics

リアルタイム分析

Real-Time

Predictive

Analytics

Real-Time

Descriptive

Analytics

今何をすべきか?

何が起こり得るか?

今、もうすぐ

今何が起きているか?

(26)

26 © Hortonworks Inc. 2011 – 2017 All Rights Reserved

Predictive Analytics

HDF

https://en.wikipedia.org/wiki/Prescriptive_analytics

(27)

Real-Time Predictive Analytics

Question:

?

(28)

28 © Hortonworks Inc. 2011 – 2017 All Rights Reserved

MiNiFi

Web App, Logs, RDBMS, NoSQL

TCP, HTTP, WebSocket,

JMS, Syslog, Email, Image

JSON, CSV, XML, Avro, Parquet

… etc. 多種多様な入力

エッジ、オンプレ、クラウド間

セキュアなデータ転送

HDP

クラスタ

(29)

Storm

MiNiFi

Web App, Logs, RDBMS, NoSQL

TCP, HTTP, WebSocket,

JMS, Syslog, Email, Image

JSON, CSV, XML, Avro, Parquet

… etc. 多種多様な入力

エッジ、オンプレ、クラウド間

セキュアなデータ転送

HDP

クラスタ

HDF

クラスタ

ストリーミング

アプリケーション開発

データ分析

PMML

(30)

30 © Hortonworks Inc. 2011 – 2017 All Rights Reserved

SAM, Schema/Model Registry

SAM

Storm

MiNiFi

Web App, Logs, RDBMS, NoSQL

TCP, HTTP, WebSocket,

JMS, Syslog, Email, Image

JSON, CSV, XML, Avro, Parquet

… etc. 多種多様な入力

エッジ、オンプレ、クラウド間

セキュアなデータ転送

HDP

クラスタ

HDF

クラスタ

ストリーミング

アプリケーション開発

データ分析

PMML

(31)

DEMO:

SAM (Streaming Analytics Manager)

GUI

Schema Registry

Model Registry

(32)

32 © Hortonworks Inc. 2011 – 2017 All Rights Reserved

: 3

Real-Time

Prescriptive

Analytics

リアルタイム分析

Real-Time

Predictive

Analytics

Real-Time

Descriptive

Analytics

今何をすべきか?

何が起こり得るか?

今、もうすぐ

今何が起きているか?

(33)

Prescriptive Analytics

Descriptive

Predictive Analytics

Descriptive/Predictive Analytics

HDF

(34)

34 © Hortonworks Inc. 2011 – 2017 All Rights Reserved

Real-Time Prescriptive Analytics

Question:

?

Context:

12

2

3

30

(35)
(36)

36 © Hortonworks Inc. 2011 – 2017 All Rights Reserved

OSS

SAM

Storm

MiNiFi

Web App, Logs, RDBMS, NoSQL

TCP, HTTP, WebSocket,

JMS, Syslog, Email, Image

JSON, CSV, XML, Avro, Parquet

… etc. 多種多様な入力

エッジ、オンプレ、クラウド間

セキュアなデータ転送

HDP

クラスタ

HDF

クラスタ

ストリーミング

アプリケーション開発

インフラ運用管理

データ分析

PMML

認可(AuthN)ポリシー管理

(37)
(38)

39 © Hortonworks Inc. 2011 – 2017 All Rights Reserved

HDF + HDP

SAM

Storm

MiNiFi

Web App, Logs, RDBMS, NoSQL

TCP, HTTP, WebSocket,

JMS, Syslog, Email, Image

JSON, CSV, XML, Avro, Parquet

… etc. 多種多様な入力

エッジ、オンプレ、クラウド間

セキュアなデータ転送

HDP

クラスタ

HDF

クラスタ

ストリーミング

アプリケーション開発

インフラ運用管理

データ分析

PMML

認可(AuthN)ポリシー管理

(39)

HDP

HDF

HDP

HDF

Descriptive:

Predictive:

Prescriptive:

3

(40)

42

© Hortonworks Inc. 2011 – 2016. All Rights Reserved

参照

関連したドキュメント

In Section 4, we prove a stronger version of the Cli¤ord inequality for real hyper- elliptic curves, which sharpen Huisman’s general result for real curves [8]: if X is a

This implies that a real function is realized by a stable map if and only if it is continuous, thus further leads to an admissible representation of the space of continuous

We study the real roots of the Yablonskii–Vorob’ev polynomials, which are spe- cial polynomials used to represent rational solutions of the second Painlev´ e equation.. It has

Nonetheless, in the Segre-nondegenerate case, which is less general than the holomorphically nondegenerate case, we have been able to show directly that the jets of h converge on

Several equivalent conditions are given showing their particular role influence on the connection between the sub-Gaussian estimates, parabolic and elliptic Harnack

In he following numerical examples, for simplicity of calculations he start-up time parameter is dropped in Model 1. In order to keep system idle ime minimal, the "system

Exit times of Symmetric α -Stable Processes from unbounded convex domains..

Li, “Simplified exponential stability analysis for recurrent neural networks with discrete and distributed time-varying delays,” Applied Mathematics and Computation, vol..