AWSで実現する
次世代シミュレーション環境
2015年11月26日
Who am I
• 名前:小川 貴士 (おがわ たかし)
• 所属:
アマゾン ウェブ サービス ジャパン株式会社
ソリューションアーキテクト
• 主な担当エリア:CAE / HPC
アジェンダ
• AmazonとAWSについて
• Intel社とのパートナーシップ
• HPC分野におけるAWS利用のメリット
• 利用イメージ
• HPC on AWS 事例
アマゾンについて
創業:1994年7月
本社:米国ワシントン州シアトル
創業者&CEO:ジェフ・ベゾス
AWSクラウドの起源は、
アマゾン社内の
ビジネス課題を解決
するために
生まれた
既存のインフラをサービス化して対応
データセンター ストレージ機器 テープ装置 サーバーAPI
コア サービス プラットフォーム サービス エンタープライズ アプリケーション インフラストラクチャー セキュリティ&管理・運用
サーバー、ストレージ、DBから、アプリケーションまで
50を超えるクラウドサービスを提供
世界中にクラウドサービス拠点を展開
11
のリージョン 1. US EAST (Virginia) 2. US WEST (N. California) 3. US WEST 2 (Oregon) 4. EU WEST (Ireland) 5. JAPAN (Tokyo)6. South America (Sao Paulo)
7. ASP 1 (Singapore)
8. ASP 2 (Sydney)
9. GovCloud
10. BJS 1 (Beijing China) limited preview
11. EU (Frankfurt)
30
のアベイラビリティ・ゾーン53
のエッジロケーション企業ユースの皆様の高い要望にお応えできる
高いセキュリティ
数多くの第三者認証:
セキュリティ・コンプライアンスに関
する、多くの第三者認証を取得
データセンター:
強固なデータセンターを
複数利用可能
セキュリティ技術:
堅牢なセキュリティ設定や暗号化、
多要素認証
弾力性
コスト削減
俊敏性
AWSクラウドが選択される理由
グローバル展開
幅広い機能
Amazon EC2(Elastic Compute Cloud)
• 数分で起動し、1時間ごとの従量課金で利用可能な仮想マシン
• ノード追加・削除、マシンスペック変更も数分で可能
• 管理者権限(root / Administrator) で利用可能
• 社内PCと同じIntelアーキテクチャ採用
1 任意のゾーンに 分散配置可能 リージョン アベイラビリティゾーンB アベイラビリティゾーンA高性能インスタンスの変遷
CC1 CC2 C3 C4 vCPU 16 32 32 36 RAM (GiB) 23 60.5 60 60 CPU Xeon X5570 2.93GHz (Nehalem) Xeon E5-2670 2.6GHz (Sandy Bridge) Xeon E5-2680v2 2.8GHz (Ivy Bridge) Xeon E5-2666v3 2.9GHz (Haswell) NIC 10Gbps 10Gbps 10Gbps 10Gbps Launch Dateシステムのコモディティ化は演算コストの低減を加速させ、 設計、研究開発はシミュレーションが主体に 製品設計の例 • 流体力学の演算 • アンテナ出力 • デジタル信号解析 • 温度、電磁界 • 有限要素解析 • 不良要因解析 シミュレーションの世界はより身近に、より幅広いエリアに浸透。
広がるシミュレーションの世界
• 計算機利用者様のご要望
– コア数制限無く使いたい
– 最適な環境(OS/コンパイラ)を選びたい
– 待ち時間を短縮してほしい
– 最新のCPUを使いたい
– 計算機の運用を楽にしたい
計算機環境の課題
悩めるケース①
多数のジョブをすぐに実行したい、短時間で完了したい
1日 1週間 コア数 コア数 従来は手持ちの限られたリソースで、逐次処理していたジョブも AWSなら必要な台数、インスタンスを起動して、一斉処理。 しかも費用は「時間×台数」なのでどちらも同じ。CAE/HPCアプリケーションの要件や
規模に合わせて、最適なクラスターを
オンデマンドで起動
悩めるケース②
ピーク稼働に合わせて用意された システムは稼働率が低く非効率 →従来は計算機のリソースに合わせて 仕事をする必要があった。
悩めるケース③
刻々と変化する計算需要について行くのが大変
AWSなら日々変化する需要の増減にも対 応。さらに計算需要の増加にも長期的に 対応可能 →その時の仕事に計算機側を合せる 時代に! Time Time従来だとシステム更新までは長い道のり
悩めるケース④
計算機の更新が大変
システム企 画 ベンチマー ク依頼 RFP ベンダ決定 システム設 計 ファシリ ティ準備 設置・構築 テスト 運用開始 CC1 CC2 C3 C4 CPU Xeon X5570 (Nehalem) Xeon E5-2670 (Sandy Bridge) Xeon E5-2680v2 (Ivy Bridge) Xeon E5-2666v3 (Haswell)Launch Date Jul, 2010 Nov, 2011 Nov, 2013 Jan, 2015
・ハードウェア保守 ・ネットワーク管理/保守 ・電源管理 ・空調管理 ・設置場所の費用/運用 計算機の規模が大きくなればなるほど 大変に、、、
悩めるケース⑤
計算機の管理が大変
面倒な物理的管理は全てAWSにお任せ。 本来の仕事に集中できる。AMIとmarketplace
• 一度作成したOS環境はAMI として保存しておくことが 可能。 →AMIから何台でもEC2インスタンス を起動することが可能 • AWS以外にサードパーティ もAMIを提供 →例えばLustreが導入済みのAMIや、 OpenFOAM導入済みのAMI etc. インスタンス Amazon S3 AMIAvailability Zone-1a Availability Zone-1b
カスタム AMI AMIからインス タンスを起動 使って、インスタカスタムAMIを ンスを複数台起動 カスタムAMIを作成 必要に応じて共有設定
g2.2xlarge 8 vCPU 15GB RAM 1x NVIDIA GPU 1536 Cores 4GB Mem G2.2xlarge ( 2013)
Intel® Intel Xeon E5-2670 2.6GHz (Sanday Bridge) 1 NVIDIA Kepler GK104 GPU
I/O Performance: High
G2.8xlarge 32 vCPU 60GB RAM 4x NVIDIA GPU 1536 Cores x 4 4GB Mem x 4 G2.8xlarge (2015)
Intel® Intel Xeon E5-2670 2.6GHz(Sanday Bridge) 4 NVIDIA Kepler GK104 GPU
I/O Performance: Very High (10 Gigabit Ethernet)
可視化もクラウド上で
• 特徴 (http://aws.amazon.com/jp/workspaces/) – 任意のデバイスからアクセス可能 – マネジメントコンソールを数回クリックするだ けでデスクトップを展開 – 社内ディレクトリとの統合 • 価格体系 (http://aws.amazon.com/jp/workspaces/pricing/) – 起動したWorkSpaces数に応じた月額課金 – インフラストラクチャ(コンピューティング、 ストレージ、ストリーミング用帯域幅)および ソフトウェアアプリケーションをふくむ – プラスバンドルにはMicrosoft OfficeとTrend Micro Anti-Virusが付属Amazon WorkSpaces:フルマネージド型 VDIサービス
AWS Cloud
Availability Zone
Availability Zone
Virtual Private Cloud
Internet Gateway Domain Controller VPC Subnet VPC Subnet Domain Controller WorkSpaces WorkSpaces WorkSpaces WorkSpaces Client Mobile Client Internet
自社オフィス環境 社内サーバルーム or データセンター環境 SSH/SCP ssh端末で操作。 データは scpで転送 ログイン ノード
従来のHPC環境
計算ノード ライセンス サーバ マスターサーバ NFSサーバ Internet VPN / 専用線自社オフィス環境 AWSクラウド環境 SSH/SCP ssh端末で操作。 データは scpで転送 ログイン ノード
AWSでも基本的なシステム構成は同じ
計算ノード ライセンス サーバ マスターサーバ NFSサーバ Internet VPN / 専用線Corporate Data Center Elastic Data Center M
AWSなら、必要な時に必要なだけ利用可能
従来のクラスタ 構成は固定 ジョブが 無ければ 無駄発生$ aws ec2 run-instances \
--image-id ami-5769f956 \ --key-name plc id_rsa \ --security-groups default \ --instance-type c4.8xlarge
Corporate Data Center Elastic Data Center M 必要に応じて 必要な台数で クラスタを構成
AWSなら、必要な時に必要なだけ利用可能
従来のクラスタ 構成は固定 ジョブが 無ければ 無駄発生Corporate Data Center Elastic Data Center M
AWSなら、必要な時に必要なだけ利用可能
従来のクラスタ 構成は固定 ジョブが 無ければ 無駄発生 処理が終了すると インスタンスを終了課金停 止ツールでお手軽にクラスタ構成も可能
Placement Group 計算ノード マスターノード ジョブ管理 NFS共有 ストレージ http://star.mit.edu/cluster/index.html $ starcluster start –s 16 コマンド発行ドライブヘッド設計のための 高スケールシミュレーション: 数百万もの並列パラメータスタディ 従来1か月にも及ぶシミュレーションを8時間 で完了 ピーク時に70,000以上のコア、 700TFlops を超えるピーク性能 AWSスポットインスタンスを活用、掛かった コストは約 $5600
HGST様の設計シミュレーション事例
http://cyclecomputing.com/blog/hgst-buys-70000-core-cloud-hpc-cluster-breaks-record-8-hours/本田技研工業様のシミュレーション事例
http://www.slideshare.net/AmazonWebServices/bdt201/ https://www.youtube.com/watch?v=G4SAgcacea4
• オンプレミスで運用しているレンダリングシステムの一部としてAWSのリソースを使用 • Spotインスタンスの利用により合計40000coreのリソースを$0.47/node で利用