プロファイルフェーズ

2.4 モデルベース開発ソフトウェアの自動並列化フレームワークムワーク

2.4.1 プロファイルフェーズ

本フレームワークでは入力となるソフトウェアと対象のマルチコアプロセッサ向けに最適化を行うために，プロファイルフェーズで自動生成コードのプロファイリングを行う．プロファイルフェーズでは自動生成されたCコードを入力とし，

OSCAR自動並列化コンパイラがプロファイル用Cコードに変換する．このプロファ

イル用CコードをMATLAB/Simulink環境でSoftware-in-the-loop Simulation (SILS) もしくはターゲットの組み込みプロセッサ環境でProcessor-in-the-loop Simulation

(PILS)で実行することにより，プロファイルデータが生成される．検証時にプロ

ファイル用Cコードを用いることで，検証時に使われる実用的な入力からプロファイルデータを作成可能となる．また，PILSでプロファイルを行う場合，ターゲットの組み込みプロセッサ向けの最適化が可能となる．

このプロファイルデータに対して，スクリプトを使用し，プロファイルデータの集計・表示を行う．このスクリプトで集計されたプロファイルデータを並列実行フェーズに活用する．

また，OSCAR自動並列化コンパイラによる解析結果に並列性がない場合は，こ

の並列性解析結果とこのプロファイル情報を可視的に表すことによって，モデルの改善に活用することができる．

2.4.2 _{並列実行フェーズ}

自動生成されたCコードと2.4.1節前述のプロファイルデータを再度入力とし，

第3章以降で後述する種々の並列処理最適化を行った後に，並列化Cコードを自動生成する．並列化Cコードの並列化指示文にはOSCAR API [KGAH⁺13]を使い，

OSCAR API標準解釈系を用いてターゲットプロセッサのランタイムライブラリに

変換し，任意のマルチコアプロセッサ上で動作可能とする[佐藤10]．

図2.6: モデルベース開発ソフトウェアの自動並列化フレームワーク

また，用途に合わせて，MATLAB/Simulink上のAPIとなるMEX関数[Matd]を自動生成して，SILSやPILSの環境上で並列処理の動作を実現する．

2.5 _まとめ

本章ではMATLAB/Simulinkによるモデルベース開発の概要とMATLAB/Simulink におけるマルチコアプロセッサの利用方法について述べ，提案するモデルベース開発ソフトウェアの並列化フレームワークを提案した．

現在の自動車分野や航空機分野を代表とした組み込みソフトウェアの開発では

MATLAB/Simulinkを使ったモデルベース開発が普及し，開発効率の改善や生産性

の向上に一定の効果が得られている．その中でも，このMATLAB/Simulinkでは

Embedded Coderを使った自動Cコード生成をサポートしており，開発者による設

計書ベースのコーディングを不要としている．

一方，現在の自動コード生成ツールでは，汎用的な組み込みハードウェアをター

ゲットとしていて，組み込み分野で普及しているマルチコアプロセッサを自動で有効利用できるまでに至っていない．マルチコアプロセッサを支援する商用ツールとしては，Parallel Computing ToolboxやRTI-MP等が挙げられるが，開発者によるモデルの分割を要する．そのため，現時点でモデルベース開発ソフトウェアをきめ細かく自動並列化をすることはできない．

関連研究では，抽象的なSimulinkモデル情報から自動で方程式レベル，サブシステムレベル，ブロックレベル等の並列化を行う手法が提案されているものの，並列化の範囲が制約される等きめ細かな並列化をすることや任意のハードウェア向けに最適化するような手法は提案されていない．

そこで，本論文ではこれらの手法とは異なり，OSCAR自動並列化コンパイラを使った自動生成されたコードレベルから全域に渡って並列化を行うフレームワークを提案した．自動生成されたコードレベルで並列性を抽出するため，任意のモデルベース開発ツールに対応することも可能であり，さらには柔軟にターゲットハードウェア向けに最適化することが可能である．

また，提案したモデルベース開発ソフトウェアの自動並列化フレームワークではプロファイルフェーズと並列化フェーズに分かれる．プロファイルフェーズで

は，OSCAR自動並列化コンパイラを使って，プロファイリング用のCコードを生

成する．そのプロファイル用のCコードをSILS環境もしくはPILS環境で実行後，

スクリプトを使いプロファイル情報を統計する．その後，このプロファイル情報を使い，設計モデルの改善もしくは並列化の際の最適化に役立てる．

並列化フェーズではこのプロファイル情報と自動生成Cコードを使い，種々の最適化を行い，並列化Cコードを生成する．この並列化CコードにはOSCAR API を含み，任意のマルチコアプロセッサ環境で並列実行可能とする．

また，用途に合わせてMEX関数を自動生成し，MATLAB/SimulinkのSILS環境で並列実行を実現する．これにより，モデルベース開発の中でシームレスにマ

ルチコアプロセッサを利用することが可能になると考えられる．

第 3 _章

モデルベース開発ソフトウェアの粗粒度タスク並列処理 ^†

†本章は論文「MATLAB/Simulinkで設計されたエンジン制御Cコードのマルチコア用自動並列化」に基づく．

3.1 _まえがき

モデルベース開発は様々なリアルタイム制御のような組み込みソフトウェアで用いられて，現在までにソフトウェアの開発期間の削減や開発効率の改善が報告されている[KLBS04, HHZ⁺14, WHKS14, Car14, KLBS14,下浦]．モデルベース開発によりソフトウェアの生産性が改善されている一方で，現在ではこのような組み込みソフトウェアは複雑化・大規模化が顕著となっていて，リアルタイム性の確保が難しくなっている．そのため，リアルタイム性を確保するために，今後のリアルタイム制御系ソフトウェアでは高速化が必要不可欠となっている．

このような問題に対して，現在では組み込みプロセッサにおける動作周波数向上の限界の面から，マルチコアプロセッサを使ったリアルタイム制御系ソフトウェアの高速化が期待されている．例えば，リアルタイム制御で代表的なエンジン制御でマルチコアプロセッサの活用は未だ報告されていないものの，近年ではこのようなエンジン制御ソフトウェアに対して，マルチコアプロセッサを利用するための研究がされており[FWJR15, SJK15, MGW15]，2015年から2016年にはマルチコアプロセッサを使ったElectronic Control Unit (ECU)の開発が始まると言われている[MGW15]．

現在までに，このようなエンジン制御のようなリアルタイム制御向けのマルチコアプロセッサの有効性や並列タスクの割り当て方式等が提案されてきている [FWJR15, SJK15, MGW15]．また，parMERASAではこのようなリアルタイム制御をマルチコアプロセッサ上で並列実行する試みがなされており[UBG⁺13]，Parallel

Design Patterns (PDPs)を基にしたリアルタイム制御系ソフトウェアの並列化を提

案している[JGU13, JGU14]．

上記の従来研究では，並列タスクの割り当て方式や並列化ソフトウェアの開発方法を提案しているものの，自動でマルチコアプロセッサを利用するための並列タスクの自動抽出や自動割り当てに関しては一切提案されていない．そのため，今

後複雑化が顕著なエンジン制御のようなリアルタイム制御をマルチコアプロセッサでリアルタイム実行するには自動並列処理技術が必要不可欠である．

そこで，本章ではモデルベース開発されたリアルタイム制御系ソフトウェアをマルチコアプロセッサ向けに自動並列化を行い，高速化を行う．このようなリアルタイム制御には商用のIntelコンパイラ[Int]やPGIコンパイラ[PGI]等で自動並列化が可能なループ構造を持たないため，代入文や条件分岐，関数間に存在する粗粒度タスク間の並列性に着目し，モデルベース開発されたリアルタイム制御系ソフトウェアのマルチコアプロセッサ上での粗粒度タスク並列処理手法の提案を行う．

特に，少ない粗粒度並列性の中から最大限の性能向上を得るために，モデルベース開発ソフトウェアの粗粒度タスク並列性の向上手法，オーバーヘッドを最小化した粗粒度タスク並列処理手法及びリアルタイム制御向けローカルメモリ活用手法について提案する．さらには，リアルタイム制御系ソフトウェアの代表例としてモデルベース開発されたエンジン制御ソフトウェアに対して，提案手法を使った性能評価を行い，その結果について述べる．

本章の構成は以下の通りである．まず，第3.2節ではMATLAB/Simulinkでモデルベース開発されたリアルタイム制御系ソフトウェアの特徴について述べ，第3.3 節では従来から提案されているOSCAR自動並列化コンパイラを使ったモデルベース開発ソフトウェアの粗粒度タスク並列処理の概要について述べる．次に，第3.4 節ではリアルタイム制御系ソフトウェアの少ない粗粒度タスク並列性から最大限の並列性を抽出するための並列性向上手法について述べ，第3.5節ではリアルタイム制御系ソフトウェアを効果的に粗粒度タスク並列処理するためのオーバーヘッド削減手法について述べる．さらには第3.6節ではプロファイリングを使った精度改善手法，第3.7節ではリアルタイム制御系プロセッサ特有のローカルメモリを有効利用する手法について述べる．そして，第3.8節では提案手法を使ったモデルベー

ドキュメント内 Studies on Automatic Parallelization for Model-Based Development Software on Multicore Processors (ページ 39-46)

2.4 モデルベース開発ソフトウェアの自動並列化フレー ムワークムワーク

2.4.1 プロファイルフェーズ

2.4.2 並列実行フェーズ

2.5 まとめ

第 3 章

モデルベース開発ソフトウェアの粗粒 度タスク並列処理 †

3.1 まえがき