VM作成×4 (空リソース：大)

IAサーバ（機種＃A）：成功

IAサーバ（機種＃B）：成功

CPU Socket#0 CPU Socket#1

Host

CPU Socket#1 CPU Socket#0

Host

IAサーバ（機種＃A）：６VM

IAサーバ（機種＃B）：６VM

VM VM VM VM VM

VM VM VM VM

VNFM VIM

VM作成×4 (空リソース：大) VM作成×2 (空リソース：小)

VM VM VM

ヒーリング

①オートヒーリング

（VNFM起動）

②オートヒーリング

（VIM起動）

③マニュアルヒーリング

IA Server

VNFc

OSS

VNFM

NFVO

IA Server

VNFc

VNFc VNFc

OSS

VIM VNFM

NFVO

VNFc

故障

VNFc

故障

ヒーリング

判断

IA Server

VNFc

VNFc VNFc

OSS

VNFM

NFVO

故障

ヒーリング判断

故障

ヒーリングとは

• VNFc(VM)障害やHW障害時に正常なHW上にVMを再生成し障害から復旧させる機能

– オートヒーリング: 仮想化基盤が障害状況に応じて自動的に実施 – マニュアルヒーリング: 障害監視等を通じて人手によって実施

• HW故障の自動復旧により駆けつけ稼働（OPEX）の削減が可能

オートヒーリングの動作

サーバ異常を検出 VNFMへ通知

別ServerにVMを配置

IA Server

VNFc

IA Server

VNFc

OSS

VIM VNFM

NFVO

VNFc

故障ヒーリング

VNFMは障害情報からヒーリング要否を判断

VMを起動通信ソフトを復旧

サーバベンダ毎に故障情報ポリシーが異なる

①障害検知可能な故障部位

②故障レベル

③故障検出方法

障害情報をNova schedulerを考慮せず

• 故障ノードに再配置

• リブートするHWに再配置

STEP1：HW監視装置はNFVI Server障害を検出し, 障害情報の正規化を実施

STEP2：HW監視装置は正規化した障害情報を

VIMに送信

STEP3：VIMは正規化された障害情報を

元にヒーリング実施判断し,

NFVI ServerのIPMIを使いNFVI Serverの停止

(Fencing機能)

STEP4：VIM/VNFMはNFVI Serverの停止を検出し

他のNFVI ServerにVMを起動する

IA Server

OSS

VIM VNFM

NFVO

HW監視装置

①

故障

②

③

キャリアネットワーク観点からの解決法

CPU MEM NIC

致命的な障害重度の障害軽度の障害警告情報

DISK PSU FAN Temp

CPU MEM NIC DISK

PSU FAN Temp

CPU MEM NIC DISK

PSU FAN Temp

CPU MEM NIC DISK

PSU FAN Temp

NFVI(ベンダ:A）

テンプレート

NFVI(ベンダ:B）

テンプレート HW監視装置

NFVI(ベンダ:A） NFVI(ベンダ:B）

障害情報障害情報

ハードウエア差分をなくすための障害情報の統一化

• 仮想化基盤システム内で用いる障害情報は統一的な表現とする

–

障害レベルの定義と構成品を定義

–

異なる汎用IAサーバの障害情報を定義した障害情報にマッピングし正規化

–

障害情報のマッピング処理は一元的に実施する必要がある為,HW監視装置での実施

–

正規化はテンプレートを用いる事で汎用IAサーバの追加毎に機能追加なく実現可能

オペレータのポリシーを元に定義

障害情報をマッピング

Fault ID Fault severity

1011 CPU 警告

1012 CPU 軽度の障害

1013 CPU 重度の障害

OPNFV Doctor

• ハード故障を即座に検知し切替指示を行う機能を開発

• 当初のScopeは開発完了

仮想化レイヤーハード

ソフトソフト

ハード

仮想化管理システムハード

稼働中予備

仮想化レイヤーハード

ソフト

ハード

仮想化管理システムハード

稼働中故障

発生

故障

切替指示ソフト

予備

ハードウェア等の故障情報をリアルタイム把握し、

ドキュメント内 NFV (ページ 34-40)

VM作成×4 (空リソース：大)

IAサーバ（機種＃A）：成功

IAサーバ（機種＃B）：成功

Host

Host

IAサーバ（機種＃A）：６VM

IAサーバ（機種＃B）：６VM

VM VM VM VM VM

VM VM VM VM

VNFM VIM

VM作成×4 (空リソース：大) VM作成×2 (空リソース：小)

VM VM VM

ヒーリング

①オートヒーリング

（VNFM起動）

②オートヒーリング

（VIM起動）

③マニュアルヒーリング

VNFc

VNFc

OSS

NFVO

VNFc

VNFc VNFc

OSS

NFVO

VNFc

VNFc

VNFc

ヒーリング

ヒーリング

判断

VNFc

VNFc VNFc

OSS

NFVO

ヒーリング 判断

ヒーリングとは

• VNFc(VM)障害やHW障害時に正常なHW上にVMを再生成し障害から復旧させる機能

– オートヒーリング: 仮想化基盤が障害状況に応じて自動的に実施 – マニュアルヒーリング: 障害監視等を通じて人手によって実施

• HW故障の自動復旧により駆けつけ稼働（OPEX）の削減が可能

オートヒーリングの動作

サーバ異常を検出 VNFMへ通知

別ServerにVMを配置

VNFc

VNFc

OSS

NFVO

VNFc

VNFc

VNFMは障害情報から ヒーリング要否を判断

VMを起動通信ソフトを復旧

サーバベンダ毎に故障情報ポリシーが異なる

①障害検知可能な故障部位

②故障レベル

③故障検出方法

障害情報をNova schedulerを考慮せず

• 故障ノードに再配置

• リブートするHWに再配置

STEP1：HW監視装置はNFVI Server障害を検出し, 障害情報の正規化を実施

STEP2：HW監視装置は正規化した障害情報を

STEP3：VIMは正規化された障害情報を

(Fencing機能)

STEP4：VIM/VNFMはNFVI Serverの停止を検出し

OSS

NFVO

HW監視装置

①

②

③

キャリアネットワーク観点からの解決法

NFVI(ベンダ:A）

NFVI(ベンダ:B）

NFVI(ベンダ:A） NFVI(ベンダ:B）

ハードウエア差分をなくすための障害情報の統一化

• 仮想化基盤システム内で用いる障害情報は統一的な表現とする

–

–

–

–

ヒーリング判断

VNFMは障害情報からヒーリング要否を判断