既存の解析処理流れと連続実行条件 - 既存の解析処理

5.2 既存の解析処理

5.2.2 既存の解析処理流れと連続実行条件

図5.2 に，VMを利用した性能プロファイリングシステムでの既存の解析処理流れを示す．

三種類の処理が逐次的に実行される．処理1は，VMM上の動作プログラムに対する解析処理で，既存のプロファイリングシステムの解析処理と同じである．具体的には，文献[71] 2.1 節で説明されているシンボル解決処理後に，シンボル単位で頻度集計を行い，頻度順で結果を出力する．なお，ここで言うシンボルはプログラムの関数名のことである．処理2では，

文献[71] 3.4節と3.5節および文献 [78] 2.3節で述べられている手法を用いて，VMM上の収集データからVMの収集データをVM単位で疑似的に生成する．処理3は，処理2で生成された各VMの疑似収集データを用いて，処理1と同じ解析処理をVM毎に逐次的に行う．なお，格納データの読込み開始から処理3の全VMの解析処理が終了するまでの時間を解析処理時間と呼ぶ．

䠄ฎ⌮1䠅 VMM䛾ゎᯒฎ⌮

䞉䝅䞁䝪䝹ゎỴ 䞉㢖ᗘ㞟ィ䞉㞟ィ⤖ᯝ䛾ฟຊ

᱁⣡䝕䞊䝍ㄞ㎸䜏㛤ጞ

䠄ฎ⌮2䠅

VMMୖ䛾཰㞟䝕䞊䝍䛛䜙 VM䛾཰㞟䝕䞊䝍䜢VM༢఩

䛷␲ఝ⏕ᡂ

䠄ฎ⌮3_i䠅

VM_i䛾ゎᯒฎ⌮ 䠄i=1,2,3, …䠅䞉䝅䞁䝪䝹ゎỴ

䞉㢖ᗘ㞟ィ䞉㞟ィ⤖ᯝ䛾ฟຊ

ゎᯒฎ⌮䛾⤊஢

䠄ฎ⌮3_i䠅䠄ฎ⌮3₁䠅䠄ฎ⌮3₂䠅䠄ฎ⌮3₃䠅

䈈

ゎᯒฎ⌮

᫬㛫

図 5.2 仮想計算機を利用した性能プロファイリングシステムにおける既存の解析処理の流れ分散化した性能プロファイリングシステムにおいて，継続的な性能プロファイリングを行うために，データ格納時間t₀，データ収集時間t₁，および解析処理時間t₂が満たすべき関係は，図5.3 のような関係である．

この関係は，1台の解析処理計算機が解析対象とするVMM数をnとすると，式 5.1 である．

䝕䞊䝍཰㞟ฎ⌮ ゎᯒฎ⌮

᫬㛫

᫬

᫬㛫

t

₁

t

₀

t

₀

t

₂

⿕ ᐃィ⟬ᶵ ゎᯒฎ⌮ィ⟬ᶵ

᱁⣡

཰㞟ゎᯒ

᱁⣡

図 5.3 継続的な性能プロファイリング時のデータ収集，データ格納，および解析の各処理時間の関係

t₀+t₁ >(t₀+t₂)×n (5.1)

5.2.3 既存の解析処理時間評価

複数のVMがある場合，図 5.2 の処理3が各VMに対して逐次的に実行されるため，VM 数の増加に比例して解析処理時間の増加が懸念される．そこで，VM数の変化に対する既存の解析処理時間を実測し評価する．

実験環境と解析処理に用いる収集データ条件を表 5.1 に示す．収集データの収集環境は，

文献[78] の実験環境と同条件に合わせた．データ収集時に各VM上では，文献[78] と同じ姫野ベンチマーク[73]に含まれるjacobi関数を繰り返し実行していた．文献[78] より，データ格納も含めたオーバヘッドとデータ収集のカバレッジの観点から，この環境における最適なデータ収集時間は60秒となるので，本評価で用いる収集データも60秒で収集したデータを用いる．解析に用いる収集データは，解析処理計算機のローカルディスクに予め格納されているものとし，図5.2 に示すようにローカルディスクからデータを読込み開始するところから解析処理時間の測定を開始する．

また，継続的に性能プロファイリングを行うための条件として，式 5.1 において，n=1，データ収集時間t₁=60とすると，解析処理時間t₂は60秒以下となる必要があり，これを本論文の解析処理時間の目標とする．

表 5.1 実験環境と解析処理に用いる収集データ条件ホスト環境（被測定計算機，解析処理計算機）

CPU Intel Xeon E5-2697v3 2.60 GHz 14コア× 1

Memory 24 GB

LAN 1 Gbps Ethernet

Disk HDD SATA 7200 rpm 250 GB

OS CentOS Linux 7.2.1511 64 bit

（kernel 3.10.0-327.28.2.el7.x86 64）

VMM qemu-kvm-2.3.0-31.el7.16.1 ゲスト環境

VM数 1, 2, 3, ..., 10

vCPU数 1

Memory 4 GB

OS CentOS Linux 7.2.1511 64 bit

（kernel 3.10.0-327.28.2.el7.x86 64）収集データ条件

データ収集周期 1 ミリ秒データ収集時間 60 秒 1VM時データサイズ 86 MB

図 5.4 に，VM数1の時の収集データからVM数10の時の収集データまで，各VM数の収集データの解析処理時間の測定結果を示す．この結果を見ると，VM数が1〜7までならそのままで目標の60秒以下を満たせることがわかる．しかし，VM数8以上で継続的に性能プロファイリングが行えないこととなる．

次に，同じ収集データをSSD(NVMe PCI3.0x4)上において，図 5.4 の場合と同様に，解析処理した場合の処理時間を図 5.5 に示す．この結果より，ディスクをSSDに変えただけ

18.83 25.13

31.82 38.54

45.09 52.05

59.07 66.74

74.42 81.82

0 10 20 30 40 50 60 70 80 90

1 2 3 4 5 6 7 8 9 10

ゎᯒฎ⌮᫬㛫䠄⛊䠅

VMᩘ

┠ᶆ䝷䜲䞁

図 5.4 仮想計算機を利用した性能プロファイリングシステムにおける解析処理時間

では，解析処理時間は短縮されないことがわかる．即ち，ディスクがボトルネックにはなっていないことがわかる．理由は，収集データなど解析に利用するデータが全てサイズ的に計算機の物理メモリに載るためと考えられる．例えば，本測定環境と条件で10VMの時に格納した1回分の収集データとそのほかの解析に利用するオブジェクトファイルなども含めた全データサイズは833MBとなり，解析処理計算機の物理メモリ24GB上ですべて処理されうることになる．

ディスクによる性能差はないので，以降の解析処理時間の測定でも，前段研究の文献 [78]

と同じく，ディスクはHDDを使用することとする．

0 10 20 30 40 50 60 70 80 90

1 2 3 4 5 6 7 8 9 10

HDD SSD

ゎᯒฎ⌮᫬㛫䠄⛊䠅

VMᩘ

図 5.5 解析に使用するデータがHDDにある場合とSSDにある場合の解析処理時間の比較

ドキュメント内目次 (ページ 96-100)