エンタープライズマーケティング部 佐々木邦暢 (@_ksasaki)
マネージド AI サービスと GPU IaaS
クラウドで GPU が活きる二つの選択肢
Amazon AI
Google Cloud Vision API 等
IBM Watson
Microsoft Cognitive Services
Amazon EC2 – P2 インスタンス
Google Compute Engine
IBM Bluemix Infrastructure
Microsoft Azure – N シリーズ
IDCF - “GPU BOOST” タイプ
Amazon AI
開発者向け人工知能サービス (API 群)
Amazon Polly
Amazon
Rekognition
Amazon Lex
音声やテキストを使用した 会 話 型 イ ン タ ー フ ェ イ ス を 持つアプリケーションを構築 ディープラーニングを使用して 文章をリアルな音声に変換 ディープラーニングに基づく イメージ認識サービスP2 インスタンス
Tesla K80 を搭載する GPU インスタンス
インスタンス名 GPU 数 GPU メモリ (GB) CUDA コア数 vCPU 数 メモリ (GB)
p2.xlarge
1 (K80 半分) 12 2,496 4 61p2.8xlarge
8 (K80 4枚) 96 19,968 32 488p2.16xlarge
16 (K80 8枚) 192 39,936 64 732GPU 対応の AMI 各種
GPU ドライバや各種フレームワーク・アプリケーション導入済み
AWS 提供
NVIDIA 提供
Deep Learning AMI
64-bit, Amazon Linux 2015.05.04
NVIDIA GPU ドライバ
MXNet, Caffe, TensorFlow, Theano, Torch
NVIDIA DIGITS 4 AMI
NVIDIA DIGITS 4 on Ubuntu 14.04 (64-bit) NVIDIA CUDA Toolkit 7.5 AMI
CUDA Toolkit 7.5 on Amazon Linux 2016.03 (64-bit) Windows AMI (NVIDIA GPU ドライバ付)
分散型ディープラーニングを簡単に
CloudFormation で GPU クラスタを自動デプロイ
AWS は MXNet をデフォルトのディープラーニング
フレームワークとして採用し、そのコードやドキュメン
テーションに貢献しています。
その一環として、GPUクラスタを簡単に構築可能な、
CloudFormation テンプレートが公開されています。
VPC の作成、セキュリティやオートスケーリングの設定
から、GPU ドライバやフレームワークのインストールまで
完全に自動化されます。
MXNet と CloudFormation
https://github.com/dmlc/mxnet/tree/master/tools/cfnAWS パブリックデータセット
無料でアクセス可能な大規模データ
データセット名 内容ランドサット
ランドサット 8 号衛星により作成中の地球全土の衛星画像コレクションSpaceNet
コンピュータビジョンアルゴリズムの開発における革新を促進するために衛星画像とラベリングされたトレーニングデータを集めたデータベース地勢タイル
世界各地の地表の標高などの地勢を示すデータセットNASA NEX
NASA が保守管理する地球の科学的データセットのコレクション。気候変化予測や地表の衛星画像などが含まれるTCGA
がんゲノムアトラス (TCGA) からの未処理および処理済みのゲノム、トランスクリプトミクス、およびエピゲノミクスのデータで、がんゲノムクラウドを介して認定された 研究者のみが利用可能マルチメディアコモンズ
オーディオビジュアル機能と注釈を備えた 1 億近い画像と動画のコレクションJapan Census Data
日本の国勢調査、事業所・企業統計調査、経済センサスパブリックデータセットの利用例
SpaceNet を NVIDIA DIGITS で解析
SpaceNet は NVIDIA もその立ち上げにかかわった
オンライン衛星画像リポジトリです
ディープラーニングフレームワークの Web フロントエンド
である NVIDIA DIGITS で DetectNet というオブジェ
クト検出ネットワークを使って、 SpaceNet の画像か
ら建物を検出する方法を、 PARALLEL FORALL
ブログで解説しています
https://devblogs.nvidia.com/parallelforall/exploring-spacenet-dataset-using-digits/
NVIDIA DIGITS による物体検出
Microsoft Cognitive Services
インテリジェンス アプリケーション
言語
視覚
音声
Azure N シリーズ GPU インスタンス
2 種類の NVIDIA GPUを搭載
名称 コア数 メモリ SSD RDMA GPU NV6 6 56 GB 380 GB - M60 半分 (GPU 1基) NV12 12 112 GB 680 GB - M60 1枚 (GPU 2基) NV24 24 224 GB 1.5 TB - M60 2枚 (GPU 4基) NC6 6 56 GB 380 GB - K80 半分 (GPU 1基) NC12 12 112 GB 680 GB - K80 1枚 (GPU 2基) NC24 24 224 GB 1.5 TB - K80 2枚 (GPU 4基) NC24r 24 224 GB 1.5 TB InfiniBand K80 2枚 (GPU 4基) Visualization の NV 系 Tesla M60搭載 Compute の NC 系 Tesla K80 搭載NVIDIA と Microsoft の協業
Cognitive Toolkit (旧称: CNTK) を Azure と DGX-1 の双方に最適化
NVIDIA Tesla GPU
NVIDIA DGX-1 Azure Data Center NVIDIA GPUDL Toolkit
Microsoft Cognitive Toolkit
(旧称: CNTK)
様々なマイクロソフト製品・サービスを支え AI を民主化
Cortana パーソナルアシスタント 多言語間翻訳Skype Bing サーチエンジン HoloLens拡張現実IBM Watson
日本語に対応した様々な API
自然言語分類 検索およびランク付け 会話 文書変換
IBM Bluemix Infrastructure
GPU 搭載のベアメタルサーバーを月単位 / 時間単位で
GPU 種別 GPU メモリ(GB) CUDA コア数 CPU コア数CPU メモリ(GB) ディスク
Tesla K80
24
4,992
2 x E5-2620 v3
12
64
1TB SATA
2 x E5-2650 v3
20
2 x E5-2690 v3
24
2 x E5-2620 v4
16
128 2x 800GB SSD
Tesla M60
16
4,096
2 x E5-2620 v3
12
64
1TB SATA
2 x E5-2650 v3
20
2 x E5-2690 v3
24
Hourly ※ この他、 GRID K2 と Tesla K10 が選択可能Google Cloud Platform
Google のコアとなるインフラストラクチャ、データ解析、機械学習を活用
Cloud Machine Learning
Vision API
Speech API
Natural Language API
Translation API
Google Compute Engine
Google の IaaS に Tesla K80 と P100 がまもなく登場
Tesla K80 と Tesla P100 を利用可能
様々なインスタンスに GPU をアタッチ可能
分単位の課金で効率的に利用
近日登場予定!
IDCF クラウド
Tesla M40 搭載 “GPU BOOST” 仮想マシン
インスタンス名 GPU GPU メモリ(GB) CUDA コア数 vCPU 数 メモリ (GB) SSD (GB)