CPU 使用率の解析 - RIP *+-F RIP *+/F - 九州大学学術情報リポジトリ

**RIP +-F RIP +/F**

4.2.4 CPU 使用率の解析

RIP 処理後段における高い CPU 使用率の原因を調査する．前述のように RIP処理は連続印刷時の性能向上を目的にパイプライン化される.しかしRIP 処理後段においてCPU使用率が100％に近い状態が継続し，RIP処理前段のタスク実行が制限される事が判明した．動的振舞解析による制御タスクのCPU 使用時間（図4.14）から,

RIP処理後段におけるCPUの使用率は，GEU制御タスク29%，RPU制御タ

スク16%，HDD制御タスクとHDD書き込みタスクを合わせて30%， RIP前

半処理タスク11%，その他15%である．プリント処理におけるHDD制御タスクの目的はGEU処理後の中間生成データを圧縮してHDDに保存し，エラー発生時の回復処理時間を短縮することである．そこでエラー発生時の動作について動的振舞解析を実施した．通常印刷時のRIP処理前段から印刷完了までの処理時間と，HDDに保存したGEU処理後の中間生成データを用いたプリント処理から印刷完了までの処理時間を比較した．JEITAで規定された印刷性能測定

4.3. SRMSによる組込みシステムの評価第 4. 基本方式の適用

GEU!"#$%&'()*

+,-./0*

GEU12'3456*

GEU78+9:;<'=>*

+,-.3?*

GEU!"#$%&'()*

+,-./0*

GEU12'3456*

Cyan Plane

Magenta Plane

図4.13 GEU処理における効率的なシーケンス

用の標準ファイル32種類のファイルの中で，31種のファイルにおいて通常印刷が，中間生成データからの印刷よりも短時間で完了することを確認した．つまり，GEU処理後の中間生成データをHDDに保存して，エラー発生時の回復処理の時間を短縮する効果は限定的である．これらによりCPU使用率の30%を占めているHDD制御タスクとHDD書き込みタスクの実行時間を削除できることが判明した.

4.3 SRMS による組込みシステムの評価

本研究で提案するリバースモデリング手法とモデル・シミュレーションを組み合わせた評価手法をMFP - Multi Function Peripheral/Printer(ディジタル複合機）に適用する．リバースモデリング手法を適用して，MFPの性能評価モデルを作成する．性能評価の指標は印刷処理の時間とメモリー使用量であり，対象とした機能は印刷機能である．性能評価モデルの作成においては，シングルプロセッサのシステム・アーキテクチャとマルチコア・アーキテクチャの２種

4.3. SRMSによる組込みシステムの評価第 4. 基本方式の適用

!"#$%&&'()*+,-./01234

#!"

$!"

%!"

&!"

'!!"

' '' #' (' $'

)*+,-./'!!012

345678

9:4;<

=>?

9:4=<

9:4;<

@ A5 BC DEF 945 BC

DEF

G H H BC DEF RIP!"#$% RIP!"&$%

CPU'()%

図4.14 制御タスクのCPU使用時間

類のアーキテクチャを表現するモデルを高い抽象度によって記述する．

次に同手法を，消費エネルギーの検証を行うことを目的として，MFPに搭載するSoC-System On a Chip(システムLSI)に適用する．SoCの消費エネルギー評価モデルも性能評価モデル同様にリバースモデリングによって作成する．

SoCの消費エネルギー評価モデルは３種類の異なる省エネルギー技術を適用する．

4.3.1 MFP の性能評価モデルの作成

マルチ・ファンクション・プリンター（MFP)に対して提案手法を適用する．

シングルプロセッサのシステム・アーキテクチャを採用する現行のMFPにリバースモデリングを適用して，性能評価モデルである現行システムモデルを作成する．要求分析の結果として得られた次期のシステムに対する機能要求と，

性能要求に基づくシステム・アーキテクチャの変更を現行システムモデルに施すことで，次期システムの性能を評価するために用いるモデルである次期システムモデルを作成する．本論文において新しく次期システムモデルに採用したシステム・アーキテクチャはマルチコア・アーキテクチャである．

性能評価の指標は印刷処理の時間とメモリー使用量であり，対象とした機能は印刷機能である．同じく対象とした動作は複数ページの連続印刷である．既存

4.3. SRMSによる組込みシステムの評価第 4. 基本方式の適用

!"#

$%&' ()

$%&'

,-./01

$%&'*+

2345617 8

$%&'*+

2345617 9

$%&'*+

2345617 :

$%&'*+

2345617

;

<=>

,-$%&'*+

2345617 8

$%&'*+

2345617 9

$%&'*+

2345617 :

$%&'*+

2345617

;

!"#

$%&' ()

$%&'

,-./01

$%&'*+

2345617 8

$%&'*+

2345617 9

$%&'*+

2345617 :

$%&'*+

2345617

;

<=>

,-$%&'*+

2345617 8

$%&'*+

2345617 9

$%&'*+

2345617 :

$%&'*+

2345617

;

図4.15 現行MFPのシステム構成

のシステムである現行MFPに対して静的解析と文書解析を実施した結果，印刷処理は次の５つの処理単位で構成され，それらが順次，実行されることを確認した．

(i) ホストPC等からPostScriptなどのデータを受信する印刷データ受信 (ii) データ処理に適した表現に印刷記述言語データを変換する内部表現生成

(iii) データ処理に適した表現に印刷記述言語データを変換する内部表現生成

(iv) 画像データを印刷エンジンに送信する印刷準備

(v) 用紙の処理（印刷エンジンでの印刷，ドラム間移動，排出）

現行MFP のMPU構成はシングルプロセッサであり．内部表現処理には４つの専用ハードウェア・アクセラレータを用いる(図4.15)．

ここでモデリングの対象となるハードウェアリソースと，ソフトウェアの動的振舞は印刷処理に関連するものに限定する．

次期MFPに新しく採用するシステム・アーキテクチャは，AMP構成の関数

4.3. SRMSによる組込みシステムの評価第 4. 基本方式の適用

!"#$%&

'()

,-./

3)$%&

4567891:

!"#$%&

!;<=

>?!;<= 3)$%&

!;<=

,-./2+

@ABCD=E F ,-./2+

@ABCD=E G

!HB='IJ=

,-./2+

@ABCD=E K ,-./2+

@ABCD=E L 45

,-./

01 4567891:

>?!;<=

,-./2+

@ABCD=E F ,-./2+

@ABCD=E G

!HB='IJ=

,-./2+

@ABCD=E K ,-./2+

@ABCD=E L

!"#$%&

'()

,-./

3)$%&

4567891:

!"#$%&

!;<=

>?!;<= 3)$%&

!;<=

,-./2+

@ABCD=E F ,-./2+

@ABCD=E G

!HB='IJ=

,-./2+

@ABCD=E K ,-./2+

@ABCD=E L 45

,-./

01 4567891:

>?!;<=

,-./2+

@ABCD=E F ,-./2+

@ABCD=E G

!HB='IJ=

,-./2+

@ABCD=E K ,-./2+

@ABCD=E L

図4.16 次期MFPのシステム構成

呼び出し型マルチコア・アーキテクチャである．また2つのプロセッサのハードウェアは同一のホモジニアス構成である．そこで次期MFPシステムに，現行 MFPと同一のプロセッサをサブMPUとして追加する．次に２つのMPU間の通信を目的とするメッセージキューを追加する．オペレーティングシステムは

Linuxをそれぞれのプロセッサで動作させ，印刷処理のプログラムを実行する．

メモリー領域は，メインMPUのメモリー領域，サブMPUのメモリー領域，それぞれのMPUからアクセスが可能な共有メモリー領域の３つの領域によって構成する (図4.16)

MFPにおける並列処理

次に現行MFPに対して動的振舞解析を適用いて，印刷処理時間のボトルネックの解析を実施した(4.2章動的振舞解析による実行トレースの取得と分析)．

この解析の結果から，印刷処理における内部表現生成が，印刷処理時間のボトルネックの１つであることが判明した．また内部表現生成は，ページ間での相互依存性が無いことから複数ページ印刷において，並列処理を適用することにより性能向上が見込める処理である．そこで，内部表現生成の処理を印刷ページ単位で分割，それぞれのMPUに割り当てることで処理を並列化する．ジョブ管理と奇数ページの内部表現生成ならびに内部表現処理はメインMPUに，偶

4.3. SRMSによる組込みシステムの評価第 4. 基本方式の適用数ページの内部表現生成をサブMPUにそれぞれ割り当てる．メインMPUで動作する内部表現生成のソフトウェアは，その処理対象が奇数ページに限定されることを除いて，現行MFPと共通である．サブMPU では内部表現生成のソフトウェアを動作させるために必要となる最小構成のオペレーティングシステムと，偶数ページの内部表現生成のソフトウェアが動作する (図4.16)．

MFPの動作シナリオ

動的振舞解析に用いた動作シナリオは，社団法人電子情報技術産業協会

（ JEITA : Japan Electronics and Information Technology）が定める印刷性能の評価用画像データ24)を用いた2ページ連続印刷である．画像データに依存して印刷処理時間が偏よること避けるために，評価用画像データから内部表現生成の処理時間と，印刷処理全体における内部表現生成の処理時間の比率の異なる5種類の画像データを組み合わせて用いる．これらの画像データを用いて合計25組みの連続印刷を実システムで動作させることで実行トレースデータを取得し動的振舞モデルを作成した．

システムの構成

現行MFPの性能評価モデルである現行MFPモデルは，MPUを表す１個のタイムリソースモデル，内部表現処理に用いる４個のハードウェア・アクセラレータを表す６個のタイムリソースモデル，メモリーを表す１個のメモリー・

リソースモデルで構成する(図4.17)．

ハードウェア・アクセラレータには１つのタイムリソースモデルで表す２種類のハードウェア・アクセラレータと，2つのタイムリソースモデルで表す２種類のハードウェア・アクセラレータがある．次期MFP の性能評価モデルである次期MFPモデルは，現行MFPモデルを再利用することで作成する．次期 MFPモデルに採用するアーキテクチャがAMP構成のマルチコア・アーキテクチャであることから，現行MFPモデルに対して，2つ目のプロセッサとしてタイムリソースモデルを追加する．メモリー・リソースモデルは複数のメモリー領域を表現することが可能であることから追加を必要とせず，内部モジュールであるメモリー・モジュールの割り当てを変更することで次期MFPモデルへ

4.3. SRMSによる組込みシステムの評価第 4. 基本方式の適用

!"#$%

&'()

*+,-./)

0123456 789:./)

9:;<=/$%

>?$@ABCD

>E!%$F

%(GHI$J ./)

#.H$I$J ./)

%(GHI$J ./)

#(F24K

#.H$

LMN"O$%

!"#$%

&'()

*+,-./)

0123456 789:./)

9:;<=/$%

>?$@ABCD

>E!%$F

%(GHI$J ./)

#.H$I$J ./)

%(GHI$J ./)

#(F24K

#.H$

LMN"O$%

図4.17 現行MFPの性能評価モデル

!"#$%

&'()

*+,-./)

0123456 789:./)

9:;<=/$%

>?$@ABCD

>E!%$F

%(GHI$J ./)

#.H$I$J ./)

%(GHI$J ./)

#(F24K

#.H$

LMN"O$%

%(GHI$J ./) RS24K

!"#$%

&'()

*+,-./)

0123456 789:./)

9:;<=/$%

>?$@ABCD

>E!%$F

%(GHI$J ./)

#.H$I$J ./)

%(GHI$J ./)

#(F24K

#.H$

LMN"O$%

%(GHI$J ./) RS24K

図4.18 次期MFPの性能評価モデル

の対応を実現する(図4.18).

4.3.2 SoC の消費エネルギー評価モデルの作成

SoCのエネルギー評価モデルの作成にあたって，動的振舞モデルを作成するためにSoCが搭載された MFPの実機から実行トレースデータを取得する．実

ドキュメント内九州大学学術情報リポジトリ (ページ 87-99)