• 検索結果がありません。

キャッシュの影響を考慮したリソースサイジングに関する検討

N/A
N/A
Protected

Academic year: 2021

シェア "キャッシュの影響を考慮したリソースサイジングに関する検討"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会第 81 回全国大会. 5A-03. キャッシュの影響を考慮したリソースサイジングに関する検討 日野 泰子† †. 松浦 陽平†. 三菱電機株式会社 情報技術総合研究所. 1. はじめに システム開発の上流工程において行われるサ イジングは,性能目標を達成するために必要な リソース量を見積もる作業である.負荷試験と は異なり得られる情報が限られているため,性 能指標値が従う性能モデルを仮定し,流用元や PoC の計測結果をもとに性能指標値を見積もる. 一般的な性能モデルとして,待ち行列理論に基 づくモデルが挙げられる.このモデルでは,解 析の容易性からサービス時間が指数分布に従う と仮定することが多い(例えば,[1]) .一方で, キャッシュ等の影響により,リソースのレイテ ンシは多峰分布になりやすいことが知られてお り[2],現実とモデルの間にずれが生じている. 本稿は,サービス時間が 2 峰型の分布に従うと みなすことによって,キャッシュの影響を反映 した性能モデルを提案するものである. 2. 先行研究 参考文献[1]で提案している性能モデルは,評 価対象サーバの CPU,I/O,アプリをそれぞれ M/M 型の待ち行列モデルとし,それらを接続するこ とでサーバ全体の性能モデルを構築している. ここで M/M 型とは,リクエストの到着過程をポア ソン到着,サービス時間分布を指数分布と仮定 した待ち行列モデルである.サービス時間分布 を固定しているため,必要な計測値が各ノード の平均サービス時間(評価対象の処理 1 件当たり に消費される CPU 時間・I/O 時間)のみと少ない ことが特長である一方で、サービス時間分布が 指数分布から外れる対象には適さない. 3. 目的 先行研究の手法は,適用は容易なものの,キ ャッシュの効果を考慮することができない.そ こで,キャッシュの影響を考慮した性能モデル を提案することを本稿の目的とした.ただし, 性能モデルに含まれるパラメータは,計測によ って特定可能なもののみとする. Study on the Effect of Cache on Computing Resource Sizing † Information Technology R&D Center, Mitsubishi Electric Corporation.. 1-11. 4. 提案する性能モデル 4.1 全体像 本稿では,サイジングの対象を CPU に限定する ものとする.性能モデルには待ち行列モデルの M/G/N を採用し,サービス時間分布はキャッシュ の影響をモデル化した分布とする. M/G/N は解析解が得られないため,性能指標の 計算には近似式を用いる.近似式には,サービ ス時間分布の特性が変動係数𝑐𝑐𝑠𝑠 として残るため, 4.2 においてモデル化したサービス時間分布の変 動係数を定式化する.また,サービス時間分布 に含まれるパラメータの特定方法を 4.3 に示す. 4.2 サービス時間分布のモデル化 キャッシュにヒットした場合,ヒットしなか った場合,それぞれのサービス時間が従う単峰 型の分布(以下,分布𝐻𝐻ℎ𝑖𝑖𝑖𝑖 , 分布𝐻𝐻𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 )を用意し, キャッシュミス率を𝑅𝑅で重み付けし混合した分布 をサービス時間の分布(以下,分布𝐻𝐻)とする (図 1) .本来,キャッシュは数段階に分けられ るが,ここではまとめて扱う.. 図 1 サービス時間分布のモデル化の考え方. 分布𝐻𝐻ℎ𝑖𝑖𝑖𝑖 , 𝐻𝐻𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 は,ガンマ分布𝛤𝛤(𝛼𝛼, 𝛽𝛽)で定式化 し,𝛼𝛼 = 5は共通,𝛽𝛽は 𝐸𝐸[𝐻𝐻𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 ] = 𝑋𝑋 𝐸𝐸[𝐻𝐻ℎ𝑖𝑖𝑖𝑖 ]とな るよう定める. 上記のようなモデル化を行うと,分布𝐻𝐻の平均 は次式で求められる. 𝐸𝐸[𝐻𝐻] = (1 − 𝑅𝑅)𝐸𝐸[𝐻𝐻ℎ𝑖𝑖𝑖𝑖 ] + 𝑅𝑅 𝐸𝐸[𝐻𝐻𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 ] 𝛼𝛼 𝑋𝑋𝑋𝑋 5(1 − 𝑅𝑅 + 𝑅𝑅𝑋𝑋) = (1 − 𝑅𝑅) + 𝑅𝑅 = 𝛽𝛽 𝛽𝛽 𝛽𝛽 ⋯ �式 1�. Copyright 2019 Information Processing Society of Japan. All Rights Reserved..

(2) 情報処理学会第 81 回全国大会. また,分散は次式で求められる. 𝑉𝑉[𝐻𝐻] = 𝐸𝐸[𝐻𝐻 2] − {𝐸𝐸[𝐻𝐻]}2 = (1 − 𝑅𝑅)𝐸𝐸�𝐻𝐻ℎ𝑖𝑖𝑖𝑖 2 � + 𝑅𝑅 𝐸𝐸�𝐻𝐻𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 2 � − {𝐸𝐸[𝐻𝐻]}2 ⋯ �式 2� 分布𝐻𝐻ℎ𝑖𝑖𝑖𝑖 ・𝐻𝐻𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 はガンマ分布であることから, 20 20𝑋𝑋 2 ⋯ �式 3� 𝐸𝐸�𝐻𝐻ℎ𝑖𝑖𝑖𝑖 2 � = 2 , 𝐸𝐸�𝐻𝐻𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 2 � = 2 𝛽𝛽 𝛽𝛽 となる.(式 1)および(式 3)より,𝑉𝑉[𝐻𝐻]は𝛽𝛽, 𝑋𝑋, 𝑅𝑅 の関数と分かる。さらに,分布𝐻𝐻の変動係数𝑐𝑐𝐻𝐻 も, 𝐸𝐸[𝐻𝐻] ⋯ �式 4� 𝑐𝑐𝐻𝐻 = �𝑉𝑉[𝐻𝐻] より,𝛽𝛽, 𝑋𝑋, 𝑅𝑅 の関数として求められる.よって, 分布𝐻𝐻の変動係数𝑐𝑐𝐻𝐻 を特定するために必要なパラ メータは,𝛽𝛽, 𝑋𝑋, 𝑅𝑅 となる.. 4.3.3 サービス時間分布のパラメータ𝛽𝛽 キャッシュミス率と同時に,十分に低い処理 頻度における平均 CPU 使用率を計測し,処理 1 件 で消費する CPU 時間の平均𝐸𝐸[𝑇𝑇𝑠𝑠 ]を求めておく(従 来手法と同様であるため,具体的な方法は省略 する).𝑇𝑇𝑠𝑠 は平均サービス時間と見なせるため, (式 1)より、 𝐸𝐸[𝐻𝐻] = 𝐸𝐸[𝑇𝑇𝑠𝑠 ] 5(1 − 𝑅𝑅 + 𝑋𝑋𝑋𝑋) 𝛽𝛽 = ⋯ �式 5� 𝐸𝐸[𝑇𝑇𝑠𝑠 ] となり,𝛽𝛽を求めることができる.. 5. 提案モデルを用いたサイジング方法 4 章で求めた𝑐𝑐𝐻𝐻 を M/G/N の近似式に適用するこ とで,CPU の使用量を見積もることができる. 平均待ち時間の近似式として Kimura(1986a)の 4.3. パラメータの計測方法 近似[3]を採用すると,平均 CPU 使用時間𝐸𝐸[𝑇𝑇𝑅𝑅 ]は, 4.3.1 キャッシュミス率𝑅𝑅 M/M/N に お け る 同 条 件 で の 平 均 待 ち 時 間 を CPU に実装されているパフォーマンスカウンタ 𝐸𝐸[𝑊𝑊(𝑀𝑀)] , 同 様 に M/D/N の 平 均 待 ち 時 間 を からキャッシュミス率を取得することが可能で 𝐸𝐸[𝑊𝑊(𝐷𝐷)]として,以下のように求められる. ある.Linux 系のマシンであれば,perf コマンド 𝐸𝐸[𝑇𝑇𝑅𝑅 ] = 𝐸𝐸[𝑇𝑇𝑠𝑠 ] + 𝐸𝐸[𝑇𝑇𝑤𝑤 ] を用いて,値を取得できる.ただし,仮想環境 1 + 𝑐𝑐𝐻𝐻 2 では,perf コマンドで取得できる値に制限があ = 𝐸𝐸[𝑇𝑇𝑠𝑠 ] + 2𝑐𝑐𝐻𝐻 2 1 − 𝑐𝑐𝐻𝐻 2 + りキャッシュミス率を取得できないことがある. 𝐸𝐸[𝑊𝑊(𝑀𝑀)] 𝐸𝐸[𝑊𝑊(𝐷𝐷)] まず,以下のコマンドで,取得できる項目を ⋯ �式 6� 出力し,キャッシュミス率に当たる項目の名称 上記𝐸𝐸[𝑇𝑇𝑅𝑅 ]は,処理要求の到着頻度の関数となる. を確認する. 従って、性能目標で定められた処理要求の到着 # perf list 頻度における𝐸𝐸[𝑇𝑇𝑅𝑅 ]を(式 6)によって算出し,許 確認した名称および計測対象の処理を実行する 容される CPU 使用率と照らし合わせることで,必 コマンドを指定して,キャッシュミス率を計測 要な計算機台数を見積もることができる. する. # perf stat -e <cache-misses> <command> 6. まとめと今後の展望 なお,計測対象は,コマンドでなくプロセス ID 本稿では,キャッシュの影響を受けたサービ で指定することも可能である. ス時間分布を 2 峰型の分布でモデル化した性能モ. 4.3.2 キャッシュ性能係数𝑋𝑋 処理は同等だが,キャッシュミス率の異なる サンプルプログラムを用意し,その計測結果か らキャッシュ性能係数𝑋𝑋を算出する. まず,サンプルプログラムとして,アクセス する要素の順番を変えた配列処理のプログラム を 2 種類用意する.それぞれを実行したときの平 均キャッシュミス率(𝑅𝑅𝐴𝐴 , 𝑅𝑅𝐵𝐵 )および平均処理時 間(𝑇𝑇𝐴𝐴 , 𝑇𝑇𝐵𝐵 )を計測する.キャッシュミスがない 場合の処理時間を𝑇𝑇とすると, 𝑇𝑇𝐴𝐴 = (1 − 𝑅𝑅𝐴𝐴 )𝑇𝑇 + 𝑅𝑅𝐴𝐴 𝑋𝑋𝑋𝑋 𝑇𝑇𝐵𝐵 = (1 − 𝑅𝑅𝐵𝐵 )𝑇𝑇 + 𝑅𝑅𝐵𝐵 𝑋𝑋𝑋𝑋 となるため,計測した𝑇𝑇𝑖𝑖 および𝑅𝑅𝑖𝑖 を代入し連立方 程式を解くことで,キャッシュ性能係数𝑋𝑋が算出 できる.. 1-12. デルを提案するとともに,性能モデルに含まれ るパラメータの計測の方法を示した. 今後は,実機を用いてサイジング精度の評価 を行うとともに,仮想環境での計測方法を検討 する. 参考文献 [1] Brendan Gregg, “詳解 システム・パフォー マンス”, オライリー・ジャパン(2017) [2] 小杉 優等, “大規模 IoT システムにおける計 算機リソースサイジングの研究”, FIT2015 ( 第 14 回 情 報 科 学 技 術 フ ォ ー ラ ム ) (2015). [3] 木村 俊一, “確率光学シリーズ 1 待ち行列の 数理モデル”, 朝倉書店(2016). Copyright 2019 Information Processing Society of Japan. All Rights Reserved..

(3)

参照

関連したドキュメント

るにもかかわらず、行政立法のレベルで同一の行為をその適用対象とする

過交通を制限することや.そのためのゲートを設 置することは,日本において不可能となっている [竹井2005: 91】。

鋼板中央部における貫通き裂両側の先端を CFRP 板で補修 するケースを解析対象とし,対称性を考慮して全体の 1/8 を モデル化した.解析モデルの一例を図 -1

そこで本解説では,X線CT画像から患者別に骨の有限 要素モデルを作成することが可能な,画像処理と力学解析 の統合ソフトウェアである

心臓核医学に心機能に関する標準はすべての機能検査の基礎となる重要な観

私たちの行動には 5W1H

 海底に生息するナマコ(海鼠) (1) は、日本列島の

点から見たときに、 債務者に、 複数債権者の有する債権額を考慮することなく弁済することを可能にしているものとしては、