6.4 実験
6.4.2 評価プログラムと実験環境
図6.10と表6.2に本提案方式の評価プログラムおよび評価環境を示す.
評価に用いた学習用ログデータは,企業内のプログラム開発向けに実運用して いるシステムのログファイルを用いた.なお,本システムでは,プログラム開発 で使われるシステムのため,ログファイルのメッセージが最も多く出力されるデ
!!
Server1!
"#$%&'!
()%)*%#$+,!
-.!
-.!
-.!
-.!
-.!
-.!
"#$%/!
!!
Server1!
"#$%&0!
()%)*%#$+,!
-.!
-.!
-.!
-.!
-.!
-.!
"#$%1!
!!
Server1!
"#$%&2!
()%)*%#$+,!
-.!
-.!
-.!
-.!
-.!
-.!
"#$%3!
"#$%4!
"#$%5!
Switch2!
"#$%6! "#$%7! "#$%(!
"#$%8!
Storage2!
"#$%9!
-#:;<+,!
"#$%=! -#:;<+3!
*+$!+$"&
#$%&!
'()*+,& 7>.
-./!
?.@8A!
7>.&
#$%&&
*%#$)B+"&
#$%&!
0123! 456'(73!
8+9:;&
<=>,?)@-,&
:ABCDC!
EF.1G>HIC(!
'()*+,&
JK-./!
!!
Server1!
"#$%&,!
()%)*%#$+,!
-.!
-.!
-.!
-.!
-.!
-.!
"#$%C!
"#$%4!
"#$%D!
Switch1!
"#$%E! "#$%7! "#$%(!
"#$%8!
Storage1!
"#$%9! -#:;<+,!
"#$%F!
-#:;<+C!
図 6.10: 評価プログラムと評価環境
!"#$"#%&!'!(")*+,-&!%./*%01*2*%"3!(,#4-"%&)"!!4-"*+,-&!%./*%01*2*.5637228
!"#$"#%&!'!(")*+,-&!%./*%01*2*%"3!"#$"#%&!'!(")*+,-&!!(,#4-"%63%98 88888&&8
<#$%&'(>
)*+,-1:./#012-1:!345678%9-":)*+,-2:./#012-2:!345678%9-":4;<=>
>
<?>>
図 6.11: ログファイル統計データのフォーマット
バックレベルの設定で運用している.本実験では,図6.10左図に示すシステムに て,スイッチの構成が取得できないケースを想定し実験を行った.
評価プログラムでは,構成情報を推定する推論エンジンを実行する前に,ログ ファイルとCIMを使った学習としてリソースの情報を抽出し,6.3.2節に示すよ うに各リソースの統計データを算出しログファイル統計データを出力する.ログ ファイルからリソースの情報抽出方法として,図6.10のリソース名マッチングモ ジュールにて,Serverの構成情報とStorageの構成情報に格納された各リソース
のIDやAddressの情報およびIPアドレスやFCアドレスのフォーマットと,ロ
グファイル中のメッセージ文字列が一致しているものを抽出する.図6.11にログ ファイル統計データのフォーマットと例を示す.
表 6.2: 開発・実験環境
物理サーバ
PC x 4台(CPU: Intel Corei7 3.4GHz, Memory16GB,Network Port数2) 仮想サーバ VMware ESXi5
VM 24 VM
ストレージ
Hitachi AMS 2100(Network Port数4, うち2Portのみ結線し利用)x 2台 スイッチ
Brocade SilkWorm 3200(Network Port数8, うち6Portのみ結線し利用) x 2台 開発環境
MacBook Air(Intel Corei5, Memory 4GB) Mac OS 10.8.4, Java6
構成情報DB MySQL5.5.2
学習用CIMデータ CIM Schema 2.35.0のMOFファイル
学習用ログデータ
16週間分のログファイル
(Size1.4GB,リソース情報数: 228,704レコード)
【対象】仮想サーバの/var配下のログ一式,
スイッチの保守用ログ一式,
ストレージの保守用ログ一式
学習エンジンの実行マシン
SGI Altix UV1000(Intel Xeon 2.66GHz (1536Core中32Core使用), Memory12TB(うち256GB使用)) 構成情報推定エンジンの
実行マシン 開発環境と同一
CIMデータからの構成情報の抽出では,図6.10のCIM統計モジュールにて,テ キスト形式でCIM定義を記述しているMOF(Managed Object Format)ファイル を使い,Elementクラス名と,Associationクラスの定義情報より各Elementクラ スの接続情報を抽出する.その後,推論エンジンにて,ログファイル統計データ を用いベイズ推定と隠れマルコフモデルにて構成情報の推定を行う.
この学習処理と推定処理を分離した実装は,学習にかかる処理時間と推論にか かる処理時間の差を考慮したためである.学習にかかる時間は,表6.2の仮想サー バ,ストレージ,スイッチの16週間の全てのログファイルを対象とした場合,学 習エンジンの実行マシンに示す高性能な並列計算機で約1時間30分,開発環境の マシンで約2時間40分であった.推論エンジンでの推定処理の時間としては,開 発環境のマシンで5回の平均を取ったところ,ベイズ推定では0.8秒,隠れマルコ フモデルでは2.1秒であった.このように,学習と推論には大きな時間差がある.
また,学習頻度は週や月単位の定期実行,構成変更時に行えば良く,推論時に毎
!"!#$
%!"!#$
&!"!#$
'!"!#$
(!"!#$
)!"!#$
*!"!#$
+!"!#$
,!"!#$
-!"!#$
%!!"!#$
./01/0$ ./01/02.34056/$ ./01/02.34056/2.7839:$
;<=>?@AB>CDE%EFGH$
;<=>?@AB>CDE&EIJH$
;<=>?@AB>CDE'EIJH$
;<=>?@AB>CDE(EIJH$
図 6.12: ログファイル種類による正解率(隠れマルコフモデル)
回実施する必要はない.さらに,隠れマルコフモデルとベイズ推定共にログファ イルの統計データを使うため,ログファイル統計データは同一のものが利用可能 である.