• 検索結果がありません。

CPU 使用率の解析

ドキュメント内 九州大学学術情報リポジトリ (ページ 87-99)

RIP *+-F RIP *+/F

4.2.4 CPU 使用率の解析

RIP 処理後段における高い CPU 使用率の原因を調査する.前述のように RIP処理は連続印刷時の性能向上を目的にパイプライン化される.しかしRIP 処理後段においてCPU使用率が100%に近い状態が継続し,RIP処理前段のタ スク実行が制限される事が判明した. 動的振舞解析による制御タスクのCPU 使用時間(図4.14)から,

RIP処理後段におけるCPUの使用率は,GEU制御タスク29%,RPU制御タ

スク16%,HDD制御タスクとHDD書き込みタスクを合わせて30%, RIP前

半処理タスク11%,その他15%である.プリント処理におけるHDD制御タス クの目的はGEU処理後の中間生成データを圧縮してHDDに保存し,エラー発 生時の回復処理時間を短縮することである.そこでエラー発生時の動作につい て動的振舞解析を実施した.通常印刷時のRIP処理前段から印刷完了までの処 理時間と,HDDに保存したGEU処理後の中間生成データを用いたプリント処 理から印刷完了までの処理時間を比較した.JEITAで規定された印刷性能測定

4.3. SRMSによる組込みシステムの評価 第 4. 基本方式の適用

GEU!"#$%&'()*

+,-./0*

GEU12'3456*

GEU78+9:;<'=>*

+,-.3?*

GEU!"#$%&'()*

+,-./0*

GEU12'3456*

Cyan Plane

Magenta Plane

4.13 GEU処理における効率的なシーケンス

用の標準ファイル32種類のファイルの中で,31種のファイルにおいて通常印刷 が,中間生成データからの印刷よりも短時間で完了することを確認した.つま り,GEU処理後の中間生成データをHDDに保存して,エラー発生時の回復処 理の時間を短縮する効果は限定的である.これらによりCPU使用率の30%を 占めているHDD制御タスクとHDD書き込みタスクの実行時間を削除できる ことが判明した.

4.3 SRMS による組込みシステムの評価

本研究で提案するリバースモデリング手法とモデル・シミュレーションを組 み合わせた評価手法をMFP - Multi Function Peripheral/Printer(ディジタル複 合機)に適用する.リバースモデリング手法を適用して,MFPの性能評価モデ ルを作成する.性能評価の指標は印刷処理の時間とメモリー使用量であり,対 象とした機能は印刷機能である.性能評価モデルの作成においては,シングル プロセッサのシステム・アーキテクチャとマルチコア・アーキテクチャの2種

4.3. SRMSによる組込みシステムの評価 第 4. 基本方式の適用

!"#$%&&'()*+,-./01234

!"

#!"

$!"

%!"

&!"

'!!"

' '' #' (' $'

)*+,-./'!!012

345678

9:4;<

=>?

9:4=<

9:4;<

@ A5 BC DEF 945 BC

DEF

G H H BC DEF RIP!"#$% RIP!"&$%

CPU'()%

4.14 制御タスクのCPU使用時間

類のアーキテクチャを表現するモデルを高い抽象度によって記述する.

 次に同手法を,消費エネルギーの検証を行うことを目的として,MFPに搭 載するSoC-System On a Chip(システムLSI)に適用する.SoCの消費エネル ギー評価モデルも性能評価モデル同様にリバースモデリングによって作成する.

SoCの消費エネルギー評価モデルは3種類の異なる省エネルギー技術を適用 する.

4.3.1 MFP の性能評価モデルの作成

マルチ・ファンクション・プリンター(MFP)に対して提案手法を適用する.

シングルプロセッサのシステム・アーキテクチャを採用する現行のMFPにリ バースモデリングを適用して,性能評価モデルである現行システムモデルを作 成する.要求分析の結果として得られた次期のシステムに対する機能要求と,

性能要求に基づくシステム・アーキテクチャの変更を現行システムモデルに施 すことで,次期システムの性能を評価するために用いるモデルである次期シス テムモデルを作成する.本論文において新しく次期システムモデルに採用した システム・アーキテクチャはマルチコア・アーキテクチャである.

性能評価の指標は印刷処理の時間とメモリー使用量であり,対象とした機能は 印刷機能である.同じく対象とした動作は複数ページの連続印刷である.既存

4.3. SRMSによる組込みシステムの評価 第 4. 基本方式の適用

!"#

$%&' ()

$%&'

*+

,-./01

$%&'*+

2345617 8

$%&'*+

2345617 9

$%&'*+

2345617 :

$%&'*+

2345617

;

<=>

?+

,-$%&'*+

2345617 8

$%&'*+

2345617 9

$%&'*+

2345617 :

$%&'*+

2345617

;

!"#

$%&' ()

$%&'

*+

,-./01

$%&'*+

2345617 8

$%&'*+

2345617 9

$%&'*+

2345617 :

$%&'*+

2345617

;

<=>

?+

,-$%&'*+

2345617 8

$%&'*+

2345617 9

$%&'*+

2345617 :

$%&'*+

2345617

;

4.15 現行MFPのシステム構成

のシステムである現行MFPに対して静的解析と文書解析を実施した結果,印 刷処理は次の5つの処理単位で構成され,それらが順次,実行されることを確 認した.

(i) ホストPC等からPostScriptなどのデータを受信する印刷データ受信 (ii) データ処理に適した表現に印刷記述言語データを変換する内部表現生成

(iii) データ処理に適した表現に印刷記述言語データを変換する内部表現生成

(iv) 画像データを印刷エンジンに送信する印刷準備

(v) 用紙の処理(印刷エンジンでの印刷,ドラム間移動,排出)

現行MFP のMPU構成はシングルプロセッサであり.内部表現処理には4 つの専用ハードウェア・アクセラレータを用いる(図4.15).

ここでモデリングの対象となるハードウェアリソースと,ソフトウェアの動 的振舞は印刷処理に関連するものに限定する.

 次期MFPに新しく採用するシステム・アーキテクチャは,AMP構成の関数

4.3. SRMSによる組込みシステムの評価 第 4. 基本方式の適用

!"#$%&

'()

*+

,-./

01

,-./

2+

,-./

01

3)$%&

4567891:

!"#$%&

!;<=

>?!;<= 3)$%&

!;<=

,-./2+

@ABCD=E F ,-./2+

@ABCD=E G

!HB='IJ=

!HB='IJ=

,-./2+

@ABCD=E K ,-./2+

@ABCD=E L 45

,-./

01 4567891:

>?!;<=

,-./2+

@ABCD=E F ,-./2+

@ABCD=E G

!HB='IJ=

!HB='IJ=

,-./2+

@ABCD=E K ,-./2+

@ABCD=E L

!"#$%&

'()

*+

,-./

01

,-./

2+

,-./

01

3)$%&

4567891:

!"#$%&

!;<=

>?!;<= 3)$%&

!;<=

,-./2+

@ABCD=E F ,-./2+

@ABCD=E G

!HB='IJ=

!HB='IJ=

,-./2+

@ABCD=E K ,-./2+

@ABCD=E L 45

,-./

01 4567891:

>?!;<=

,-./2+

@ABCD=E F ,-./2+

@ABCD=E G

!HB='IJ=

!HB='IJ=

,-./2+

@ABCD=E K ,-./2+

@ABCD=E L

4.16 次期MFPのシステム構成

呼び出し型マルチコア・アーキテクチャである.また2つのプロセッサのハー ドウェアは同一のホモジニアス構成である.そこで次期MFPシステムに,現行 MFPと同一のプロセッサをサブMPUとして追加する.次に2つのMPU間の 通信を目的とするメッセージキューを追加する.オペレーティングシステムは

Linuxをそれぞれのプロセッサで動作させ,印刷処理のプログラムを実行する.

メモリー領域は,メインMPUのメモリー領域,サブMPUのメモリー領域,そ れぞれのMPUからアクセスが可能な共有メモリー領域の3つの領域によって 構成する (図4.16)

MFPにおける並列処理

次に現行MFPに対して動的振舞解析を適用いて,印刷処理時間のボトルネッ クの解析を実施した(4.2章 動的振舞解析による実行トレースの取得と分析).

この解析の結果から,印刷処理における内部表現生成が,印刷処理時間のボトル ネックの1つであることが判明した.また内部表現生成は,ページ間での相互 依存性が無いことから複数ページ印刷において,並列処理を適用することによ り性能向上が見込める処理である.そこで,内部表現生成の処理を印刷ページ 単位で分割,それぞれのMPUに割り当てることで処理を並列化する.ジョブ 管理と奇数ページの内部表現生成ならびに内部表現処理はメインMPUに,偶

4.3. SRMSによる組込みシステムの評価 第 4. 基本方式の適用 数ページの内部表現生成をサブMPUにそれぞれ割り当てる.メインMPUで 動作する内部表現生成のソフトウェアは,その処理対象が奇数ページに限定さ れることを除いて,現行MFPと共通である.サブMPU では内部表現生成の ソフトウェアを動作させるために必要となる最小構成のオペレーティングシス テムと,偶数ページの内部表現生成のソフトウェアが動作する (図4.16).

MFPの動作シナリオ

動的振舞解析に用いた動作シナリオは,社団法人電子情報技術産業協会

( JEITA : Japan Electronics and Information Technology)が定める印刷性能 の評価用画像データ24)を用いた2ページ連続印刷である.画像データに依存 して印刷処理時間が偏よること避けるために,評価用画像データから内部表現 生成の処理時間と,印刷処理全体における内部表現生成の処理時間の比率の異 なる5種類の画像データを組み合わせて用いる.これらの画像データを用いて 合計25組みの連続印刷を実システムで動作させることで実行トレースデータを 取得し動的振舞モデルを作成した.

システムの構成

現行MFPの性能評価モデルである現行MFPモデルは,MPUを表す1個の タイムリソースモデル,内部表現処理に用いる4個のハードウェア・アクセラ レータを表す6個のタイムリソースモデル,メモリーを表す1個のメモリー・

リソースモデルで構成する(図4.17).

ハードウェア・アクセラレータには1つのタイムリソースモデルで表す2種 類のハードウェア・アクセラレータと,2つのタイムリソースモデルで表す2 種類のハードウェア・アクセラレータがある.次期MFP の性能評価モデルで ある次期MFPモデルは,現行MFPモデルを再利用することで作成する.次期 MFPモデルに採用するアーキテクチャがAMP構成のマルチコア・アーキテク チャであることから,現行MFPモデルに対して,2つ目のプロセッサとしてタ イムリソースモデルを追加する.メモリー・リソースモデルは複数のメモリー 領域を表現することが可能であることから追加を必要とせず,内部モジュール であるメモリー・モジュールの割り当てを変更することで次期MFPモデルへ

4.3. SRMSによる組込みシステムの評価 第 4. 基本方式の適用

!"#$%

&'()

*+,-./)

0123456 789:./)

9:;<=/$%

>?$@ABCD

>E!%$F

%(GHI$J ./)

#.H$I$J ./)

%(GHI$J ./)

#(F24K

#.H$

LMN"O$%

PQ

!"#$%

&'()

*+,-./)

0123456 789:./)

9:;<=/$%

>?$@ABCD

>E!%$F

%(GHI$J ./)

#.H$I$J ./)

%(GHI$J ./)

#(F24K

#.H$

LMN"O$%

PQ

4.17 現行MFPの性能評価モデル

!"#$%

&'()

*+,-./)

0123456 789:./)

9:;<=/$%

>?$@ABCD

>E!%$F

%(GHI$J ./)

#.H$I$J ./)

%(GHI$J ./)

#(F24K

#.H$

LMN"O$%

PQ

%(GHI$J ./) RS24K

!"#$%

&'()

*+,-./)

0123456 789:./)

9:;<=/$%

>?$@ABCD

>E!%$F

%(GHI$J ./)

#.H$I$J ./)

%(GHI$J ./)

#(F24K

#.H$

LMN"O$%

PQ

%(GHI$J ./) RS24K

4.18 次期MFPの性能評価モデル

の対応を実現する(図4.18).

4.3.2 SoC の消費エネルギー評価モデルの作成

SoCのエネルギー評価モデルの作成にあたって,動的振舞モデルを作成する ためにSoCが搭載された MFPの実機から実行トレースデータを取得する.実

ドキュメント内 九州大学学術情報リポジトリ (ページ 87-99)