第 3 章 簡易実行による実行時間予測手法 [8] と提案手法 11
4.3 まとめ
第 5 章 おわりに
本稿では、並列プログラムの簡易実行による実行時間予測手法、及び通信予測 の効率化手法について述べた。そして、本手法を姫野ベンチマークに適用し、実 行時間予測を行った。評価対象はサイズMに限って測定をした。結果は、実際の 実行時間に比べて1/100の時間で、予測の誤差5%以内で予測をすることが実現で きた。また、従来の簡易実行手法に比べて、誤差5%以内の予測をするのにかかる 時間が1/20となり、予測の効率化を実現できた。姫野ベンチマークは単純なルー プ構造で構成されているが、そのようなプログラムに対して、簡易実行による実 行時間予測手法が有効であることが示すことができた。
今後の課題として3つ取り上げる。1つは、今回姫野ベンチマークのみしか実験 を行うことができなかったので、他の多くのプログラムへ適用することである。2 つ目は、ループ部分のループ回数削減を動的に決められるようにすることである。
そして3つ目は、プログラムの自動化である。現在はすべて手動でソースプログ ラムを修正しているので、将来的にはすべて自動で予測を完了することが目標で ある。
謝辞
本研究を進めるにあたり、数々のご指導をいただいた山名早人助教授に感謝いた します。また、岩渕先輩をはじめ、山名研究室の諸先輩方にも様々なアドバイス をいただき、非常に参考になりました。この場を借りて厚く御礼申し上げます。
参考文献
[1] Kazuto Kubota, Ken’ichi Itakura, Mitsuhisa Sato and Taisuke Boku: ”Practi-cal Simulation of Larege-S”Practi-cale Parallel Programs and Its Performance Analy-sis of the NAS Parallel Benchmarks,” Proceedings of Euro-Par’98, pp.244-254, 1998.
[2] Kazuto Kubota, Mitsuhisa Sato, Ken’ichi Itakura and Taisuke Boku: ”Ac-curacy of fast performance prediction by instrumentation tool EXCIT,” Pro-ceedings of HPC Asia’98, Singapore, pp.1031-1038, 1998.
[3] Taisuke Boku, Tomoaki Harada, Takashi Sone, Hiroshi Nakamura and Kisaburo Nakazawa: ”INSPIRE: A general purpose network simulator gen-erating system for massively parallel processors,” Proceedings of PER-MEAN’95, pp.24-33, 1995.
[4] Phillip M. Dickens, Phillip Heidelberger and David M. Nicol: ”Parallelized Direct Execution Simulation of Message-Passing Parallel Programs,” IEEE Transactions on Parallel and Distributed Systems, Vol.7, No.10, pp.1090-1105, Oct. 1996.
[5] Sundeep Prakash, Ewa Deelman and Rajive Bagrodia: ”Asynchronous Par-allel Simulation of ParPar-allel Programs,” IEEE Transactions on Software Engi-neering 2000, vol.26, pp.385-400, 2000.
[6] Maurice Yarrow and Rob Va der Wijngaart: ”Communication Improvement for the LU NAS Parallel Benchmark: A Model for E cient Parallel Relaxation Schemes,” NAS Technical Report NAS-97-032, 1997.
[7] Edward Rothberg, Jaswinder Pal Singh and Anoop Guputa: ”Working Sets, Cache Sizes, and Node Granularity Issues for Large-Scale Multiprocessors,”
Proceedings of ISCA ’93, pp.14-25, 1993.
[8] 岩渕寿寛, 堀井洋, 山名早人: ”MPIプログラムの簡易実行による実行時間予 測手法の評価,” 情報処理学会研究報告(HPC), No.95, pp.131-136, 2003.
[9] 水谷泰治, 伊野文彦, 萩原兼一: ”部分的なタスク実行によるマスタスレーブ 方並列プログラムの高速な性能予測,” 情報処理学会研究報告(HPC), No.98, pp.13-18, 2004.
[10] Gabriel Marin and Jonh Mellor-Crummey: ”Cross-Architecture Perfor-mance Predictions for Scientific Applications Using Parameterized Models,”
Sigmetrics-Performance 2004
[11] Marc Snir, Steve Otto, Steven Huss-Lederman, David Walker and Jack Don-garra: ”MPI-The Complete Reference, The MPI Core second edition,” The MIT Press, 1998.
[12] William Gropp and Ewing Lusk: ”Users guide for MPICH, a portable Im-plementation of MPI,” Mathmatics and Computer Science Division, Argonne National Laboratory, University of Chicago, July 1998.
[13] Greg Burns, Raja Daout and James Vaigl: ”LAM: An Open cluster environ-ment for MPI,” Proceedings of Supercomputing Symposium ’94, pp.379-386, University of Toront, 1994.
[14] 姫野ベンチマーク http://accc.riken.jp/HPC/HimenoBMT/