IAサーバ(機種#A):成功
IAサーバ(機種#B):成功
CPU Socket#0 CPU Socket#1
Host
CPU Socket#1 CPU Socket#0
Host
IAサーバ(機種#A):6VM
IAサーバ(機種#B):6VM
VM VM VM VM VM
VM VM VM VM
VNFM VIM
VM作成×4 (空リソース:大) VM作成×2 (空リソース:小)
VM VM VM
ヒーリング
①オートヒーリング
(VNFM起動)
②オートヒーリング
(VIM起動)
③マニュアルヒーリング
IA Server
VNFc
VNFc
OSS
VNFM
NFVO
IA Server
VNFc
VNFc VNFc
OSS
VIM VNFM
NFVO
VNFc
VNFc
故障
VNFc
故障
ヒーリング
ヒーリング
判断
IA ServerVNFc
VNFc VNFc
OSS
VNFM
NFVO
故障
ヒーリング 判断
故障
ヒーリングとは
• VNFc(VM)障害やHW障害時に正常なHW上にVMを再生成し障害から復旧させる機能
– オートヒーリング: 仮想化基盤が障害状況に応じて自動的に実施 – マニュアルヒーリング: 障害監視等を通じて人手によって実施
• HW故障の自動復旧により駆けつけ稼働(OPEX)の削減が可能
オートヒーリングの動作
サーバ異常を検出 VNFMへ通知
別ServerにVMを配置
IA Server
VNFc
IA Server
VNFc
OSS
VIM VNFM
NFVO
VNFc
VNFc
故障 ヒーリング
VNFMは障害情報から ヒーリング要否を判断
VMを起動通信ソフトを復旧
サーバベンダ毎に故障情報ポリシーが異なる
①障害検知可能な故障部位
②故障レベル
③故障検出方法
障害情報をNova schedulerを考慮せず
• 故障ノードに再配置
• リブートするHWに再配置
STEP1:HW監視装置はNFVI Server障害を検出し, 障害情報の正規化を実施
STEP2:HW監視装置は正規化した障害情報を
VIMに送信STEP3:VIMは正規化された障害情報を
元にヒーリング実施判断し,NFVI ServerのIPMIを使いNFVI Serverの停止
(Fencing機能)
STEP4:VIM/VNFMはNFVI Serverの停止を検出し
他のNFVI ServerにVMを起動するIA Server
OSS
VIM VNFM
NFVO
HW監視装置
①
故障②
③
キャリアネットワーク観点からの解決法
CPU MEM NIC
致命的な障害 重度の障害 軽度の障害 警告 情報
DISK PSU FAN Temp
CPU MEM NIC DISK
PSU FAN Temp
CPU MEM NIC DISK
PSU FAN Temp
CPU MEM NIC DISK
PSU FAN Temp
NFVI(ベンダ:A)
テンプレート
NFVI(ベンダ:B)
テンプレート HW監視装置
NFVI(ベンダ:A) NFVI(ベンダ:B)
障害情報 障害情報
ハードウエア差分をなくすための障害情報の統一化
• 仮想化基盤システム内で用いる障害情報は統一的な表現とする
–
障害レベルの定義と構成品を定義–
異なる汎用IAサーバの障害情報を定義した障害情報にマッピングし正規化–
障害情報のマッピング処理は一元的に実施する必要がある為,HW監視装置での実施–
正規化はテンプレートを用いる事で汎用IAサーバの追加毎に機能追加なく実現可能オペレータのポリシーを 元に定義
障害情報をマッピング
Fault ID Fault severity
1011 CPU 警告
1012 CPU 軽度の障害
1013 CPU 重度の障害
OPNFV Doctor
• ハード故障を即座に検知し切替指示を行う機能を開発
• 当初のScopeは開発完了
仮想化レイヤー ハード
ソフト ソフト
ハード
仮想化管理 システム ハード
稼働中 予備
仮想化レイヤー ハード
ソフト
ハード
仮想化管理 システム ハード
稼働中 故障
発生
故障
切替 指示 ソフト
予備
ハードウェア等の故障情報をリアルタイム把握し、
ドキュメント内
NFV
(ページ 34-40)