近年, グリッドコンピューティング (Grid Computing) というシステムが注目を浴びている. グリッドコンピュー ティングとは, ネットワークを介して複数のコンピュー タを結ぶことで仮想的に高性能なコンピュータを作り出 し, 利用者に対して高い処理能力や記憶容量を提供する システムのことである.
一般的にグリッドコンピューティングは, 複数のコン ピュータを連携させ, 並列処理を行わせることによって 実現されており, 独自のスケジューラによる制御により, その構成されるコンピュータ群は必ずしもホモジニアス な環境である必要性がないことを特徴としている. した がって主にコンピュータ資源の準備という観点から, 比 較的低コストでの実現が可能であり, 同様に複数コンピュー タを仮想的にまとめ上げる, いわゆるクラスタコンピュー
ティングの拡張として主に研究が進められている[1]. また, グリッド環境の実現にはオペレーティングシス テムとグリッドアプリケーションの間を取り持つミドル ウェア, すなわちグリッドミドルウェアの実装が必要不 可欠であり, そちらの開発も同様に進められている. 現 在では実際にGlobus AllianceのGlobus Toolkit[2]や, Sun MicrosystemsのSun Grid Engine[3]などが一般 向けグリッドミドルウェアとして公開されており, ビジ ネスや学術研究などさまざまな分野における利用が試み られている.
本研究ではそれらグリッドコンピューティングの研究, 開発の一環として, 1CD-Linuxを用いたグリッド環境 の構築, およびその資源的, 時間的コストを削減するた めの開発と検証を行った. その結果, 既存のコンピュー タ環境にほとんど手を加えることなく, 簡便にグリッド 環境を構築できるシステムを実現し, 計64台の実行ホス トによるグリッド環境の構築を約十数分程度で終えるこ とに成功した. また, 並列分散処理可能なベンチマーク ソフトを用いた計測により, 今回構築したグリッド環境 が既存の並列計算機と同等の性能を持つことを確認する ことができた.
1CD-Linux を用いたグリッド環境の構築と検証
A system called grid computing has lately attracted considerable attention. It enables us to use a “ virtual supercomputer” by using computing resources within an organization. Although grid computing is very attractive, we need a lot of time and human resources to construct the system. The time and human resources become substantial costs in constructing a large scale grid. In this paper, we propose the 1CD-Linux that enables us to construct the grid in reasonably small costs, and show that the grid con- structed by 1CD-Linux on PCs gives a high performance same as the commercial parallel computer.
Key Words: Grid Computing, 1CD-Linux, Time costs, Resource costs, Parallel benchmark, Parallel computer
手 島 翼
奥 村 勝
吉 村 賢 治
**
***,****
*****
Construction and Examination of Grid Computing with 1CD-Linux
Tsubasa T
ESHIMA, Masaru O
KUMURA, Kenji Y
OSHIMURA*平成19年5月31日受付
**電子情報工学専攻
***電気工学科
****総合情報処理センター研究開発室
*****電子情報工学科 1. はじめに
2. 本研究の概要 2.1 背景
グリッドコンピューティングを導入することのメリッ トは概要からも明らかである通り, クラスタリングのそ れに類似している. 例としては拡張性, 可用性, 汎用性 などが挙げられ, 特に拡張性に関してはグリッドを構成 するコンピュータの数を増やすだけで容易に全体的な性 能向上を図ることが可能である. またクラスタリングと 異なりグリッドコンピューティングでは必ずしもホモジ ニアスな環境を前提とはしていないため, 拡張の際に必 要となるコンピュータ資源の準備に関してはその種類, 性能を揃える必要性がなく, より容易に拡張を実現する ことが可能となっている.
ちなみに, グリッドコンピューティングの説明におい てしばしば 「コンピュータ」 という表現が使われている が, これはグリッドコンピューティングが, 演算を行う あらゆる機械を資源として利用できることを明確にする ためである. しかし現在の所, 一般的にグリッドを構成 するために利用されるコンピュータ資源としては, 汎用 性と普及率の高さを理由にx86 系CPUを搭載したパー ソナルコンピュータ (以下PC) がそのほとんどを占め ている. 本研究においてもグリッドを構成するためのコ ンピュータ資源としてPCをターゲットとしており, 例 えば, 大学や企業などにおいて普段遊休状態にある複数 台のPCをグリッドとして構成し, 資源を有効活用する ことなどを実際の利用ケースとして想定している.
しかしながらグリッドコンピューティングにもいくつ かのデメリットがあり, 必ずしも前述のメリットを完全 に活かし切れているとは限らない. したがって, 本研究 ではまずそれらのデメリットに着目し, その問題点を解 消することを目的とする.
2.2 事前考察
まず始めに, グリッドコンピューティングの導入時に おけるデメリットを大きく分けるならば, 「資源的コス ト」 と 「時間的コスト」 の2つに分けることができる.
資源的コストとしては, まずグリッドを構成するための 資源, すなわちPCなどのコンピュータ資源を複数台準 備する必要性があることが挙げられる. 前述の通り, そ の資源の準備に関してはクラスタリングよりも比較的容 易ではあるものの, その環境をグリッド化させるために はグリッドミドルウェアの導入が必要不可欠である. そ れに伴い, 各コンピュータ資源においてグリッドミドル ウェアに合わせた環境, および設定の変更が必要となり, 場合によってはデーモンの起動やポートの開放だけでは なく, オペレーティングシステムそのものから入れ替え なければならないケースも考えられる. 前節ではグリッ
ドコンピューティングのメリットとして余剰や遊休状態 にある資源の有効活用を述べたが, 実際はその反面, 一 度グリッド化してしまった環境を元に戻すことは容易で はないのもまた事実である. そのため, 例えば, 昼間は 多数の利用者が居るが夜間は全く使われていない, など という制限付きの資源に関してはグリッドを構成するた めの資源として扱うのは非常に難しい. これも資源のソ フトウェア的コストという意味合いから, 資源的コスト の1つとして考えなければならない.
次に時間的コストとしては, グリッドミドルウェアの 導入, およびそれに伴う環境設定などに要する時間的な コストが挙げられる. 時間的コストは資源的コストと同 様に, グリッドミドルウェア周辺の設定だけに限らず, 場合によってはオペレーティングシステムの変更に要す る時間までもが必要となるケースが考えられる. さらに 当然のことながら, このコストはグリッドを構成する各々 のコンピュータに対して生じるものであるため, その資 源の数が増加すればそれに比例して時間的コストも増加 するという問題を抱えている. これはグリッドコンピュー ティングのメリットの1つである拡張性と相反するもの であり, 構成する資源の数を増やすことでグリッド全体 の性能を向上させるという目的においては大きな障害と なりうる要素である.
以上のように, グリッドコンピューティングの導入時 におけるデメリットとして 「資源的コスト」 と 「時間的 コスト」 の2つに注目するならば, 主にそれらの原因は グリッドミドルウェアの導入, およびそれに準ずる要因 によるものであることがわかる. しかしながら近年, 一 般に公開されているグリッドミドルウェアの開発におい てはこれらの問題点が取り上げられ, 解消される様子は ほとんど見られない. どちらかと言えば, 現在, グリッ ドミドルウェアの開発要点として注目されているのはビ ジネス用途に向けた可用性や汎用性についてであり, 導 入時における簡便性や拡張時におけるコストというもの はあまり重要視されていないようである. したがってこ れらのデメリットが解消されないということ自体が, 利 用者にとってグリッドコンピューティングを導入する際 の敷居を高めている要因の1つであるとも言える.
加えてグリッドコンピューティングの導入時における 問題点として 「グリッド適正」 の問題がある. グリッド 適正とは, 任意の環境がどれほどグリッドコンピューティ ングを行うのに向いているか, すなわちどれだけグリッ ド環境として性能を発揮することができるかを意味する.
これは, 実際にグリッドコンピューティングを利用する にあたり任意の環境をグリッド化したとしても, その環 境によって必ずしもグリッドの恩恵を得られるとは限ら ないことから, グリッドコンピューティングの研究では
しばしば取り上げられる問題の1つである. このグリッ ド適正の問題はグリッドを構成するコンピュータ環境と 実行する処理の親和性に起因しており, 実際にその資源 環境でグリッドを構築し, 処理を行ってみるまでその適 性を知ることは極めて困難である. さらに前述の資源的, 時間的コストの問題からグリッド環境の構築そのものが 簡便性に欠けており, この問題はグリッドコンピューティ ングにおける複合的な, より悩ましい問題の1つとして 注目しなければならない.
2.3 目的と方法
本研究の目的は, グリッドコンピューティングにおけ るデメリット, およびそこから生じる問題点を解消し, より利便性の高いグリッドコンピューティングを開発す ることである. 特に本論文においては, 前節で取り上げ た問題点の中でも以下の3つに注目することにした.
(1) 資源的コストに関する問題
・グリッドミドルウェアを導入するにあたり, 既存の ソフトウェア的環境を変更しなければならない.
・一度変更を加えた環境を元に戻すことは困難である.
(2) 時間的コストに関する問題
・グリッドミドルウェアの導入およびそれに伴う環境 の変更のため, 一定以上の時間を要する.
・時間的コストはグリッドを構成するコンピュータ資 源の数に比例して増加する.
(3) グリッド適正に関する問題
・既存の環境がどの程度のグリッド適正を持つかは実 際にグリッド環境を構築し, その性能評価を行う まで知ることができない.
・既存の環境をグリッド化することは, 資源的, 時間 的コストの面から非常にリスクが高い.
本論文における開発, 検証の流れとして, まず3章で は, (1)資源的コストに関する問題 および (2)時間的コ ストに関する問題 の解消のため 1CD-Linuxの技術を 用いることによってグリッドミドルウェア導入の簡便化 を試みる. そして4章では, その成果を用いて実際にグ リッド環境を構築し, その上で並列分散処理可能なベン チマークソフトを用いた計測を行うことで (3)グリッド 適正に関する問題 で必要とされている情報としてグリッ ド環境の性能評価を行う. 特にグリッド環境の性能評価 にあたっては, 先の開発で時間的コストの解消がどれほ ど成されているかの検証も兼ねるため, グリッドを構成 するノード数を最大64台まで拡張し, その構築に要する 時間なども評価する.
3. 1CD-Linux上におけるグリッド環境の構築 3.1 概要
本章では, 資源的, 時間的コストによる問題の解決を 目的とし, グリッド環境構築におけるその作業の簡便化 を図る. 具体的方法としてはグリッドミドルウェアを導 入した環境を1CD-Linux化し, その上でグリッド環境 を構築するという手法をとる. まず3.2節で1CD-Linux, 3.3節では今回使用するグリッドミドルウェアSun Grid Engineの概要をそれぞれ述べる. そしてその後3.4節で 1CD-Linux上におけるグリッド環境構築の概要を述べ, 3.5節にてその実験および検証について述べる.
3.2 1CD-Linux
1CD-Linuxとは1枚のコンパクトディスク (以下 CD) か らLinuxを 起 動 す る シ ス テ ム で あ る (Live Linuxとも呼ばれる). 1CD-Linuxは, Linuxがそのま ま利用できる状態でCDに記録されており, PCの電源 を 投 入 後CDド ラ イ ブ に そ のCDを 投 入 す る だ け で
Linuxシステムを起動し利用することができる. また
CDから直接Linuxシステムを起動するため, ハード ディスクドライブ (以下HDD) を一切必要とせず, デー タの書き込みを行う場合にはメインメモリ上に作成され たRAMディスクを利用する. また, CDからLinux を直接起動することができる, HDDを必要としないと いう理由から, 以下のような特徴を持っている.
HDDへオペレーティングシステムやソフトウェ アなどをインストールする必要がない.
電源の投入後, およそ3分程度でLinuxが利用 可能な状態で起動する.
Linuxシステムそのものだけでなく, 任意のソ
フトウェアやその設定もまとめてディスクイメー ジとし, CDに記録することができる.
RAMディスクは揮発性のメモリ上に作成される ため, 起動中にどのような状態になっても再起動 しさえすれば環境を元に戻すことができる.
まず, についてであるが, これらはすなわち任意 のLinux環境を簡便に再現できることを意味している.
特にに関しては, グリッド環境を1CD-Linux化でき る可能性を示しており, もしそれが実現できたならば大 きな時間的コストの削減が期待される. さらに, に ついてであるが, これらは既存の環境に変更を加えるこ となく, 一時的に任意の環境を構築することができるこ とを意味している. したがって, 2.2節の事前考察でも 述べたような期限付きの余剰な資源を利用したグリッド
環境の構築など, 最終的に構築した環境を元に戻すこと が前提である場合に, 資源のソフトウェア的コストの解 決に効果を発揮することができる.
以上のように1CD-Linuxの特性は, グリッド環境構 築におけるデメリットとの相性が良く, また一般に公開 されているグリッドミドルウェアの多くがLinuxシス テムをサポートしているため, 本研究における利用価値 は非常に高いものと考えられる.
3.3Sun Gird Engine
Sun Grid Engine(以下SGE) はSun Microsystems が公開しているフリーのグリッドミドルウェアの1つで ある. バッチジョブシステムの機能に主眼が置かれてお り, 標準でジョブスケジューラが実装されていることを 特徴としている. また, 他のグリッドミドルウェアでは あまり見られることのない自動インストールスクリプト が標準で実装されており, その設定を含めた導入は比較 的容易なものとなっている. だがその一方, 閉じたネッ トワーク内に限定された任意のグループ内でのみ利用さ れるグリッド, いわゆるクラスタグリッドの構築を前提 としているため, セキュリティにおいては若干緩い面も 見られる. また, ファイルの転送に関する機能を標準で 備えていないため, NFSなどのファイル共有機能を別 途準備しなければならない.
以上のように, SGEにもネットワークエリアの限定 やセキュリティの面など幾つかの問題点は見られる. し かし一時的な環境構築を目的とする1CD-Linuxにおい てそれは大きな問題とはならず, むしろ自動インストー ルスクリプトの存在や, それに伴う導入時の時間的コス トの低さは本研究の目的と一致する点が多い. したがっ て本論文では1CD-Linux上でグリッド環境を構築する ためのミドルウェアとしてSGEを採用することにした.
3.4 グリッド環境構築1CD-Linux 3.4.1 コンピュータ資源の分類
一般的にグリッド環境において構成されるコンピュー タ資源は, 大きく分けて 「管理ホスト」 と 「実行ホスト」
の2つに分類される. 管理ホストとはジョブ (処理) の 投入や削除, およびその結果の回収などを役割とするコ ンピュータである. 通常, 利用者は管理ホストを通して
グリッドコンピューティングの処理能力などの提供を受 けることになるため, このホストはいわゆるグリッド環 境の窓口としての役割も担っている. それに対し, 管理 ホストからのジョブの投入を受付け, 実際に処理を行う コンピュータのことを実行ホストと呼ぶ. そもそもグリッ ドコンピューティングとは複数のコンピュータをネット ワークを介して結ぶことで仮想的に高性能なコンピュー タを作り出すものであるため, 当然のことながらこの実 行ホストは複数台存在することが前提となっている. ま た, これまで述べてきたグリッド環境の拡張とは, 事実 上この実行ホストの台数を増やすことを意味し, この実 行ホストこそがグリッドを構成する主たる要素であると も言える. 以上のような分類による一般的なグリッド環 境の構成イメージを図1に示す.
3.4.2 1CD-Linux化における問題点
まず, 前節で述べたホストの分類が, グリッドミドル ウェアを導入する際にも大きな影響を与えることに注意 しなければならない. 例えばSGEの場合, 管理ホスト と実行ホストとでインストール用のパッケージそのもの が異なっており, また動作要件やインストール後の設定 なども大きな違いが存在する. 特に注意すべき点を挙げ るならば, 管理ホスト側でNFSなどのファイル共有機 能を実装しなければならないことが挙げられる(注1). こ れはグリッド環境内においてデータの転送やジョブの制 御を行うためのものであり, 実行ホスト群からデータの 読み込みや書き込みを受付けなければならないことから, 管理ホストはスペック的にある程度のメモリやディスク 容量が必要となる.
と こ ろ が 3.2 節 で も 述 べ た よ う に , 1CD-Linuxは HDDを使用せずメインメモリを利用したRAMディス クを使用するため, データの書き込みに関してはあまり 大きなディスク容量を確保できない. したがって本研究 で試みようとしているグリッド環境の1CD-Linux化に おいて, 主に処理能力を要求される実行ホストはともか く, 大きなディスク容量を要求される管理ホストの構築 は非常に困難なものであると考えられる. だが本研究に おいて問題視しているグリッド環境の構築における資源 的, 時間的コストに着目すると, それらのコストは管理 ホストの構築より, むしろ必然的に絶対数の多い実行ホ ストの構築時に生じるコストの方が大きいと言える. ま た仮に, 管理ホストを1CD-Linux化したとしても, 前 述のディスク容量の問題から大きくメインメモリを削ら れるためその性能を完全に発揮できるとは限らず, マシ ンスペックによっては起動することすらできないケース も十分に考えられる.
以上のような理由から管理ホストを1CD-Linuxで構 築する必要性は低いと判断した. よって本研究では実行
▤ℂࡎࠬ࠻
ታⴕࡎࠬ࠻⟲
࡙ࠩ
࡚ࠫࡉߩ
ഀࠅᒰߡ
⚿ᨐߩ࿁
㓸⸘
ࠣ࠶࠼
ߩ↪
↪⚿ᨐ
ࠣ࠶࠼ⅣႺ
図1 グリッド環境の構成イメージ
ホスト群のみ1CD-Linuxを用いて構築を行い, 管理ホ ストに関しては通常どおりHDDを使用した実機での構 築を行うこととした.
3.4.3 グリッド環境構築の自動化
実行ホスト, 管理ホストのいずれも, グリッドミドル ウェアをインストール済みの環境を1CD-Linux化する ことにより, そのインストールの手間は省け, ある程度 の時間的コストを削減することができる. しかしグリッ ドミドルウェアおよびその周辺の設定に関しては, ホス ト名, IPアドレスなど動的な情報を必要とするものが 存在するため, あらかじめ静的な情報設定のみしか行え ない1CD-Linuxにおいては, それらの設定作業は別途 手動で行わなければならない. また, 管理ホストはあら かじめジョブの投入先となる実行ホストの一覧を作成し なければならないため, 実行ホストが新たに追加される 度にそれぞれ登録作業を行う必要性がある. したがって, 例え1CD-Linuxの利用によりグリッドミドルウェアの インストールの手間が一部省けたとしても, 前述したよ うな動的情報を必要とする設定作業は手動で行わなけれ ばならず, 実行ホスト数が増加すると手動での設定では 手に負えなくなることは言うまでもない.
本研究では, ホストの動的情報の取得, 設定, および グリッドミドルウェアのインストールという, 本来手動 で行う一連の作業を自動で実行するプログラムの作成を 行い, 実行ホストのひな形環境に対しブート時の自動起 動プログラムとしてあらかじめ組み込むことにした. ま た, 管理ホストに関してはHDDを搭載したPCでの構 築を行うため, SGEはあらかじめインストールを済ま せておき, 実行ホストからの要求を受付けるサーバプロ グラムのみを組み込んだ.
実行, 管理の両ホストにそれぞれ組み込んだプログラ ムの機能は下記の通りである.
実行ホスト側のプログラムの機能
・自ホストのIPアドレスの取得
・ブロードキャストメッセージによる管理ホストの検索
・管理ホストへのエントリー要求
・管理ホストからの割り当てホスト名の設定
・管理ホストの公開ディレクトリへのマウント
・SGEの自動インストール 管理ホスト側のプログラムの機能
・実行ホストからのエントリー要求受付け
・実行ホストに対するホスト名の割り当て
・実行ホスト一覧の登録
同プログラムの処理手順を図2に示す.
3.4.4 実行ホスト構築用1CD-Linuxの作成
本研究では実行ホスト用の1CD-Linux環境として, フリーのLinuxシステムの1つであるFedora Core 6[4]
をベースにした. それに加え, 3.4.3節で述べたグリッ ド環境を自動構築するためのプログラム, および4章の 実験で使用する各種ベンチマークソフトをあらかじめイ ンストールしておくことで, 環境構築時の時間的コスト の削減を図る. また, 1CD-Linuxを記録するCDには 容量的制約があるため, 1CD-Linux環境を作成する時 点で不必要なパッケージやファイルはできる限り削除し た.
その後 , 最 終 的に完 成した1CD-Linux環 境を基に 1CD-LinuxのCD作成のためのISOイメージの作成を 行うのだが, ISOイメージの作成に関しては, その作成 ツールとしてMake One Linux[5]を利用した. Make One LinuxはMake One Linuxプロジェクトから公開 されている1CD-Linux作成用のツールの1つで, ひな形 環境の構成の複製から, ISOイメージの作成までを自動 で行ってくれるプログラムである. 今回, 同ツールを使 用することで容易に1CD-Linuxの作成を行うことができ た. なお, 今回作成した実行ホスト構築用の1CD-Linux のISOイメージのサイズは約350MBであった.
3.5 動作検証
3.5.1 検証の概要と実験環境
3.4.4 節 に お い て 作 成 し た 実 行 ホ ス ト 構 築 用 1CD-
Linuxを用いて実際にグリッド環境を構築し, その環
境がグリッドコンピューティングとして正常に動作する
▤ℂࡎࠬ࠻ ታⴕࡎࠬ࠻
Ԙࠨࡃࡊࡠࠣࡓ 㐿ᆎ ԙ⥄ࡎࠬ࠻IPߩขᓧ
Ԛ▤ℂࡎࠬ࠻ฬߩ
⸳ቯ ԛࠛࡦ࠻ⷐ᳞ߩ
ฃା
Ԝታⴕࡎࠬ࠻ฬߩ
ഀࠅᒰߡቯ
Ԟታⴕࡎࠬ࠻৻ⷩ
߳ߩ⊓㍳
ԝࠛࡦ࠻ⷐ᳞
߳ߩᔕ╵ㅍା
ԙࠢࠗࠕࡦ࠻
ࡊࡠࠣࡓ㐿ᆎ Ԛ⥄ࡎࠬ࠻IPߩขᓧ
ԛ▤ℂࡎࠬ࠻߳ߩ
ࠛࡦ࠻ⷐ᳞ㅍା
㧔ࡉࡠ࠼ࠠࡖࠬ࠻㧕
Ԝ▤ℂࡎࠬ࠻IP ⵍഀࠅᒰߡ ࡎࠬ࠻ฬߩฃା
ԝታⴕࡎࠬ࠻ฬߩ
⸳ቯ
Ԟ▤ℂࡎࠬ࠻ߩ NFS㗔ၞࠍ ࡑ࠙ࡦ࠻
ԟSGEߩࠗࡦࠬ࠻࡞
ታⴕࡎࠬ࠻IPࠕ࠼ࠬ
▤ℂࡎࠬ࠻IPࠕ࠼ࠬ
ታⴕࡎࠬ࠻ߩࡎࠬ࠻ฬ
㧔㗔ၞ߳ߩࡑ࠙ࡦ࠻ಣℂ㧕
Ԙ1CD-Linuxߦࠃࠆ Linuxߩേ
▤ℂࡎࠬ࠻ ታⴕࡎࠬ࠻
Ԙࠨࡃࡊࡠࠣࡓ 㐿ᆎ ԙ⥄ࡎࠬ࠻IPߩขᓧ
Ԛ▤ℂࡎࠬ࠻ฬߩ
⸳ቯ ԛࠛࡦ࠻ⷐ᳞ߩ
ฃା
Ԝታⴕࡎࠬ࠻ฬߩ
ഀࠅᒰߡቯ
Ԟታⴕࡎࠬ࠻৻ⷩ
߳ߩ⊓㍳
ԝࠛࡦ࠻ⷐ᳞
߳ߩᔕ╵ㅍା
ԙࠢࠗࠕࡦ࠻
ࡊࡠࠣࡓ㐿ᆎ Ԛ⥄ࡎࠬ࠻IPߩขᓧ
ԛ▤ℂࡎࠬ࠻߳ߩ
ࠛࡦ࠻ⷐ᳞ㅍା
㧔ࡉࡠ࠼ࠠࡖࠬ࠻㧕
Ԝ▤ℂࡎࠬ࠻IP ⵍഀࠅᒰߡ ࡎࠬ࠻ฬߩฃା
ԝታⴕࡎࠬ࠻ฬߩ
⸳ቯ
Ԟ▤ℂࡎࠬ࠻ߩ NFS㗔ၞࠍ ࡑ࠙ࡦ࠻
ԟSGEߩࠗࡦࠬ࠻࡞
ታⴕࡎࠬ࠻IPࠕ࠼ࠬ
▤ℂࡎࠬ࠻IPࠕ࠼ࠬ
ታⴕࡎࠬ࠻ߩࡎࠬ࠻ฬ
㧔㗔ၞ߳ߩࡑ࠙ࡦ࠻ಣℂ㧕
Ԙ1CD-Linuxߦࠃࠆ Linuxߩേ
図2 グリッド環境自動構築プログラムの処理手順
かの検証を行った. 管理, 実行, 両ホストにおける検証 項目は以下の通りである.
実行ホストでの検証項目
・ネットワークが使用可能であるか.
・DHCPサーバより正常にIPアドレスを取得してい るか.
・管理ホストから割り当てられたホスト名が設定され ているか.
・管理ホストの公開ディレクトリをマウントし,SGE のインストールが正常に行われているか.
管理ホストでの検証項目
・ホスト名が設定されているか.
・エントリー要求のあった実行ホストがリストに登録 されているか.
・実行ホストに対してジョブが正常に投入できるか.
また, 実験環境を図3に, 同環境における各ホストの スペックを表1にそれぞれ示す.
3.5.2 検証結果
図3に示す実験環境において, 実際に1CD-Linuxを 用いたグリッド環境の構築を試みたところ, 3.5.1節で 示した検証項目は全て正常に動作していることを確認す ることができた. また, 3.4.3節で作成したグリッド環 境自動構築プログラムもそれぞれ正常に動作し, 管理ホ ストと実行ホスト間の自律的な連携により, Linuxの 起動からSGEのインストールおよび設定までが全て自 動で行われることを確認した.
特に1CD-Linuxを用いている実行ホストに関しては, 電源の投入から1CD-Linuxのブートまでに約2分, そ の後SGEの自動インストール完了までに約1分と, 合 わせても数分で1実行ホストの準備を完了することがで きた (図4参照). また, 必要なソフトウェアのインス トールおよび管理ホストへの登録も, 電源の投入とCD の挿入以外に手動で操作を行うことは何もなく, すべて 自動的に行えることが確認できた. 通常ならばLinux のインストールだけでもPC1台につき約数十分必要と なり, 手動での作業も少なくないことを考えると, 今回 の目標の1つとしてあった1CD-Linuxを用いることに よる時間的コストの削減は十分に成されているものと言 える. また, 資源的コストの観点から見ても, 今回の検 証におけるPC_BにはHDDを搭載していないことから もわかる通り, 既存のソフトウェア的環境には一切変更 が加えられていない(注2). これは, 電源を落とせば既存 の環境へと戻すことが可能であることを意味しており, 2章でも述べた資源のソフトウェア的コストの削減が成 されていることを確認できたと言える.
4. グリッド環境の構築と性能評価 4.1 概要
本章ではまず, 1CD-Linuxを用いることによるグリッ ド環境構築の簡便性の確認を目的とし, 1CD-Linuxを 用いることによって資源的および時間的コストの削減が どれほど成されるかを確認する. そしてその後, グリッ ド適正に関する情報の取得を目的とし, ベンチマークを 用いたグリッド環境の性能評価を行う.
本章の流れとしては, まず4.2節で実験を行う環境お よびそこでのグリッド環境構築結果を述べる. また, 4.3節では予備実験として1CD-Linux上における性能評 価の妥当性について検証し, 4.4節, 4.5節で実際にベン チマークソフトを用いた並列分散処理能力の計測結果に ついて述べる. そして最後に4.6節では, 4.4節での計測 結果を基に並列計算機との比較を行い今回構築したグリッ ド環境の性能に関する考察を行う.
4.2 グリッド環境の構築
2.1節でも述べたように, 本研究ではグリッド環境構
⚂3ಽᓟ
図4実行ホスト用CD-Linuxの起動画面
ࠬࠗ࠶࠴ࡦࠣHUB 㧔100Mbps㧕
PC_B
01 PC_B
02 PC_B
03 PC_B
04
PC_A ▤ℂࡎࠬ࠻
ታⴕࡎࠬ࠻⟲
㧔1CD-Linux㧕 DHCP
ࠨࡃ
ࠬࠗ࠶࠴ࡦࠣHUB 㧔100Mbps㧕
PC_B
01 PC_B
02 PC_B
03 PC_B
04
PC_A ▤ℂࡎࠬ࠻
ታⴕࡎࠬ࠻⟲
㧔1CD-Linux㧕 DHCP
ࠨࡃ
図3 動作検証用実験環境
表1CD-Linux動作検証用ホストのスペック
Name CPU Memory NIC HDD 台数
PC_A Pentium4-3.0GHz 2048MB 1Gbps 有 1 PC_B Pentium4-1.6GHz 256MB 100Mbps 無 4
築のためのコンピュータ資源として, 普段遊休状態にあ るPC群をターゲットとしている. そこで今回, 福岡大 学総合情報処理センターのPC教室の1つを実行ホスト 群の構築環境として利用した. この教室は普段, 講義用 のPC教室として使用されているが, 休日は教室内の PCも含め全く使用されない. 本実験では, 普段遊休状 態にあるPC群の一時的グリッド化を想定し, このPC 教室に別途管理ホストを持ち込むことでグリッド環境の 構築とその性能評価を行うこととした. 実験環境の構成 を図5に, 各PCのスペックを表2にそれぞれ示す.
この環境において実際に1CD-Linuxを用いたグリッ ド環境の構築を行ったところ, 約十数分で64台全ての実 行ホストの起動と管理ホストへの登録が完了し, グリッ ド環境として利用する準備が完了した. この構築に要し た時間のほとんどが, 各PCの電源を投入しCDを挿入 するのに要した時間であり, 実行ホスト1台あたりの準 備完了に要した時間は実質3.5.2節の検証のときと変わ らない. また, 逆に構築したグリッド環境を元の環境に 戻す場合も, 単純に実行ホストの電源を切り, CDを取 り出すだけでよい. 本研究の1CD-Linuxの場合, リモー トで全ホストに対するシャットダウン要求を行うことが できるため, 実質, 環境を元に戻す作業もLinuxのシャッ トダウンが完了するのを待ち, CDを取り出す作業だけ である.
以上から, 本研究で開発したグリッド環境構築1CD- Linuxは, 資源的, 時間的コストの削減を十分に実現 できたものと言える.
4.3 1CD-Linux上における性能評価の妥当性 4.3.1 実験概要
本格的に性能評価を行う前に, ベンチマークソフトに よる計測結果が本当に妥当なものであるかを検証しなけ ればならない. なぜならば, 性能評価を行う対象のほと んどが1CD-Linuxを用いて動作するコンピュータが対 象となるからである. したがって, 一般的にそのような 環境を想定していないと思われるベンチマークソフトで は, その計測結果が正しいものであるという確証が持て ない. そのため本研究では, 予備実験としてHDDから Linuxを起動する通常のPCと1CD-Linuxから起動し て動作するPCのそれぞれにおいてベンチマークを実行 し, の計測結果の比較を行った.
まず実験環境に関しては, 3.5節で行った検証と同じ 環境を用い, PC_AおよびPC_B単機において 1CD- LinuxとHDDを搭載した実機環境のそれぞれで性能評 価を行った (図3, 表1参照). ただし3.5節の検証では PC_BにHDDが 搭 載 さ れ て い な か っ た た め , 今 回 PC_Bの実機計測においては別途にHDDを搭載してか ら計測を行うものとした. また, 計測ベンチマークとし
てはLinuxシステムにおける単機での性能評価を行う
こ と が で き る UNIXBENCH[6]を 用 い て い る . UNIXBENCHとはUNIX系システムにおける整数演 算, 浮動小数点演算, ファイル入出力, マルチタスク性 能などの各種ベンチマークでの測定を行うことのできる 総合ベンチマークソフトである. 各測定結果は基準性能 を基にその倍率で求められるスコア (INDEX) で出力 される.
4.3.2 計測結果
PC_AとPC_Bにおける1CD-LinuxおよびHDDを 搭載した実機環境での計測結果の比較を図6にそれぞれ 示す. まず, 1CD-Linuxと実機環境での違いに注目し たが, その計測結果には特に目立った差は見られなかっ た. あえてスコアの差が見られるものを挙げるならばそ れはFile Copyの結果で, 全般的に1CD-Linuxの方が わずかに高いスコアを出していることがわかるが, これ は 1CD-LinuxではHDDの代わりにメインメモリを利 用したRAMディスクが使用されていることが要因で あると考えられる.
以上の通り, データの書き込みに関して1CD-Linux においては多少の差異は見られるものの, 十分なメイン メモリが確保できている環境においてはベンチマークの 計測結果はほぼ正確であると言える. したがって本論文 では, 1CD-Linux上でのベンチマークによる性能評価 は妥当であると考え, 次節以降, 1CD-Linuxを用いて 構築したグリッド環境に対するベンチマーク計測につい て述べる.
ࠬࠗ࠶࠴ࡦࠣHUB 㧔1Gbps㧕
PC_Y01 PC_Y
02 PC_Y
03 PC_Y
64 PC_X ▤ℂࡎࠬ࠻
ታⴕࡎࠬ࠻⟲
㧔1CD-Linux㧕 DHCP
ࠨࡃ
…
…
ࠬࠗ࠶࠴ࡦࠣHUB㧔1Gbps㧕PC_Y01 PC_Y
02 PC_Y
03 PC_Y
64 PC_X ▤ℂࡎࠬ࠻
ታⴕࡎࠬ࠻⟲
㧔1CD-Linux㧕 DHCP
ࠨࡃ
…
…
図5CD-Linux動作検証用実験環境 表2 ベンチマーク測定用ホストのスペック
Name CPU Memory NIC HDD 台数
PC_X Pentium4-3.2GHz 1GB 1Gbps 有 1 PC_Y Pentium4-3.0GHz 1.5GB 1Gbps 無 64
4.4 姫野ベンチマークによる性能評価 4.4.1 姫野ベンチマーク
姫野ベンチマーク[7]とは, 理化学研究所の姫野が考案 した, 主にコンピュータの処理能力計測することができ るベンチマークである. 姫野ベンチマークは標準で並列 プログラムライブラリであるMPIに対応しており, 分 散メモリ型の並列計算処理ベンチマークとしても利用で きるため, グリッドコンピューティングやクラスタコン ピューティングにおいてしばしばその性能計測のために 用いられる. 計算サイズはXS, S, M, Lの4段階か ら選択でき, 計測結果はポアッソン方程式解法をヤコビ の反復法で解く際の主要なループを何回実行できるかで 決 定 さ れ , 性 能 指 標 はMFLOPS (Mega Floating point number Operations Per Second) で出力される.
本論文においても, 1CD-Linuxによって構築したグ リッド環境の性能計測の1つとしてこの姫野ベンチマー クを利用する.
4.4.2 実験概要
1CD-Linuxを用いて構築したグリッド環境に対し, 姫野ベンチマークによる性能計測を行う. 実験環境に関 しては, 4.2節で説明したとおりである (図5, 表2参 照). また, 計測対象となる実行ホストの数は1台から
64台まで変化させ, 計測に用いられる計算サイズはS, M,Lの3つをそれぞれ3回ずつ計測し平均値を求めた.
4.4.3 計測結果
4.4.2節で示した条件において姫野ベンチマークを実 行した結果を図7に示す.
まず実行ホスト数とグリッドの性能の関係に注目する と, 実行ホスト数が増加するにつれて明らかにその性能 が増加していることがわかる. 特に計算サイズSにお いては, 実行ホスト8台時の台数効果が約5.3倍, 実行
㪇 㪉㪇㪇 㪋㪇㪇 㪍㪇㪇 㪏㪇㪇 㪈㪇㪇㪇 㪈㪉㪇㪇 㪈㪋㪇㪇
㪛㪿㫉㫐㫊㫋㫆㫅㪼㩷㪉 㪮㪿㪼㫋㫊㫋㫆㫅㪼 㪜㫏㪼㪺㫃
㪫㪿㫉㫆㫌㪾㪿㫇㫌㫋 㪝㫀㫃㪼㩷㪚㫆㫇㫐㩷㪈㪇㪉㪋 㪆㩷㪉㪇㪇㪇 㪝㫀㫃㪼㩷㪚㫆㫇㫐㩷㪉㪌㪍㩷
㪆㩷㪌㪇㪇 㪝㫀㫃㪼㩷㪚㫆㫇㫐㩷㪋㪇㪐㪍
㪆㩷㪏㪇㪇㪇 㪧㫀㫇㪼
㪫㪿㫉㫆㫌㪾㪿㫇㫌㫋 㪧㫀㫇㪼㪄㪹㪸㫊㪼㪻 㪚㫆㫅㫋㪼㫏㫋 㪪㫎㫀㫋㪺㪿㫀㫅㪾
㪧㫉㫆㪺㪼㫊㫊
㪚㫉㪼㪸㫋㫀㫆㫅 㪪㪿㪼㫃㫃㩷㪪㪺㫉㫀㫇㫋㫊 㪪㫐㫊㫋㪼㫄㩷㪚㪸㫃㫃 㪦㫍㪼㫉㪿㪼㪸㪻
㪠㪥㪛㪜㪯
㪧㪚㪶㪘㪄㪩㪼㪸㫃 㪧㪚㪶㪘㪄㪈㪚㪛 䋨㪸䋩㩷㪧㪚㪶㪘㩷䈪䈱㪬㪥㪠㪯㪙㪜㪥㪚㪟⸘᷹⚿ᨐᲧセ
㪇 㪉㪇㪇 㪋㪇㪇 㪍㪇㪇 㪏㪇㪇 㪈㪇㪇㪇 㪈㪉㪇㪇 㪈㪋㪇㪇
㪛㪿㫉㫐㫊㫋㫆㫅㪼㩷㪉 㪮㪿㪼㫋㫊㫋㫆㫅㪼 㪜㫏㪼㪺㫃
㪫㪿㫉㫆㫌㪾㪿㫇㫌㫋 㪝㫀㫃㪼㩷㪚㫆㫇㫐㩷㪈㪇㪉㪋 㪆㩷㪉㪇㪇㪇 㪝㫀㫃㪼㩷㪚㫆㫇㫐㩷㪉㪌㪍㩷
㪆㩷㪌㪇㪇 㪝㫀㫃㪼㩷㪚㫆㫇㫐㩷㪋㪇㪐㪍
㪆㩷㪏㪇㪇㪇 㪧㫀㫇㪼
㪫㪿㫉㫆㫌㪾㪿㫇㫌㫋 㪧㫀㫇㪼㪄㪹㪸㫊㪼㪻 㪚㫆㫅㫋㪼㫏㫋 㪪㫎㫀㫋㪺㪿㫀㫅㪾
㪧㫉㫆㪺㪼㫊㫊
㪚㫉㪼㪸㫋㫀㫆㫅 㪪㪿㪼㫃㫃㩷㪪㪺㫉㫀㫇㫋㫊 㪪㫐㫊㫋㪼㫄㩷㪚㪸㫃㫃 㪦㫍㪼㫉㪿㪼㪸㪻
㪠㪥㪛㪜㪯
㪧㪚㪶㪙㪄㪩㪼㪸㫃 㪧㪚㪶㪙㪄㪈㪚㪛 䋨㪹䋩㩷㪧㪚㪶㪙㩷䈪䈱㪬㪥㪠㪯㪙㪜㪥㪚㪟⸘᷹⚿ᨐᲧセ
図6 UNIXBENCHによるCD-Linuxと実機での計測結果比較
㪇 㪈㪇㪇㪇 㪉㪇㪇㪇 㪊㪇㪇㪇 㪋㪇㪇㪇 㪌㪇㪇㪇 㪍㪇㪇㪇 㪎㪇㪇㪇 㪏㪇㪇㪇
㪈 㪉 㪋 㪏 㪈㪍 㪊㪉 㪍㪋
ታⴕ䊖䉴䊃ᢙ
㪤㪝㪣㪦㪧㪪
㪪 㪤 㪣
㶎㩷ታⴕ䊖䉴䊃ᢙ㩷㪈䋬⸘▚䉰䉟䉵㪣䈱⸘᷹䈲䊜䊝䊥ਇ⿷䈮䉋䉍ታⴕ䈪䈐䈭䈎䈦䈢䋮
図7姫野ベンチマークの計測結果
ホスト16台時の台数効果が約9.1倍, 実行ホスト64台時 の台数効果は約20.3倍という結果が出ており, 実行ホス トを増やすことによりそれなりの台数効果が得られるこ とがわかった.
また, 実行ホスト1台, 計算サイズLの場合の結果 であるが, これはメモリ不足により実行中エラーが発生 し, 結果を得ることができなかった. 1CD-Linux上で 計測したことが原因である可能性も考慮し, 念のため実 機 (管理ホスト1台, 実行ホスト1台) での計測も試み たが, やはり同様のエラーで結果を得ることはできなかっ た. しかし実行ホスト数が8台以上の場合における問題 サイズLの計測結果は非常に伸びが大きく, 最終的に 実行ホスト数64台で本実験中最大値の6,767MFLOPSを 記録している. 前述した実行ホスト1台時のエラーの件 も考慮すると, これはおそらく実行ホストの台数が増加 することにより, グリッドにおけるメモリの総容量が充 実したしことがその理由の1つであると考えられる.
最後に, 実行ホスト64台, 問題サイズMにおける結 果の異常性についてであるが, 実験時, 1CD-Linuxあ るいはグリッド環境に異常が発生している可能性も考慮 し, 念のためグリッド環境の再構築を試みた後, 再計測 を行っている. しかしながら値の異常性は改善せず, ま た, メモリの空き容量などにも問題が見受けられなかっ たため, 残念ながら今回その原因を突き止めるまでには 至らなかった.
4.5 NAS Parallel Benchmarksによる性能評価 4.5.1 NAS Parallel Benchmarks
NAS Parallel Benchmarks ( 以 下NPB)[8]と は , NASA Ames Research Centerで開発された, 並列コ ンピュータ向けのベンチマークであり, 並列コンピュー タの実効性能を知る上で権威あるベンチマークの1つと
して知られている.NPBは全部で8種類の対象問題から 構成されており, 問題サイズもS(sample), W(work- station), A,B, Cの5段階から選択することができる.
表3に対象問題の一覧とその内容を示す. また, 計測結 果は各対象問題毎に出力され, その性能指標はMOPS (Million Operations Per Second) である.
本研究においても, 1CD-Linuxによって構築したグ リッド環境の性能計測の1つとしてこのNPBを利用 する.
4.5.2 実験概要
1CD-Linuxを用いて構築したグリッド環境に対し, NPBによる性能計測を行う. 実験環境に関しては, 4.2 節で説明したとおりである (図6, 表2参照). 計測対 象となる実行ホストの数は1台から最大64台まで変化さ せ, 問題サイズはAを3回ずつ計測し平均値を求めた.
また対象問題に関しては, EP, MG, CG, IS, LU, SP, BTを対象とし, gcc-4.1.1でコンパイルを行うこと のできなかったFTは除外することとした.
4.5.3 計測結果
4.5.2節で示した条件においてNPBを実行した結果を 図8に示す.
まず結果を全体的に眺めてみると, 実行ホストの数が 増加しても, 必ずその性能 (MOPS) が高くなるとは 限らないということがわかる. 単純に実行ホスト数の増 加に伴ってその性能が増加していたのは対象問題EP, すなわちほとんど通信を必要としない, 浮動小数点演算 によるベンチマークのみであった. 他の対象問題におけ る結果に関しては, グラフのほとんどが山型を模ってお り, ある特定のピーク以降, 実行ホストの台数を増やす と逆に性能が低下してしまっているのが見て取れる. こ れはNPBの特徴として, EP以外の対象問題のアルゴ リズムが主に通信を多用しているのが原因である. した がって実行ホストの台数が増加しすぎると, 問題の分割 数および通信量が増加し, それに伴うオーバーヘッドに よって全体的な性能が低下してしまっているのである.
以上を考慮した上で結果を見ると, 実行ホスト数が1台 時の性能とピーク時の性能を比較することでおおよその 台数効果を確認することができる.
4.6 並列計算機との性能比較
本章の実験で構築したグリッド環境がどの程度の性能 を持っているのかを知るため, 今回, 九州大学情報基盤 センターのスカラー型並列計算機 「IBM eServer p5モ 表3 ベンチマーク測定用ホストのスペック
対象問題 内 容
EP 乗算合同法による一様乱数, 正規乱数の生 成 (浮動小数点演算).
MG 簡略化されたマルチグリッド法のカーネル.
CG 正値対称な大規模疎行列の最小固有値を求 めるための共役勾配法.
FT FFTを用いた3次元偏微分方程式の解法.
IS 大規模整数ソート.
LU Synmetric SOR iterationに よ るCFDア プリケーション.
SP Scalar ADI iterationによるCFDアプリケー ション.
BT 5x5 block size ADI iterationによるCFD アプリケーション.
表4 高性能演算サーバのスペック
Name CPU Memory
IBM eServer p5 POWER5プロセッサ
1.9GHz×16 CPU 64GB
デル595」 においても4.3節と同様に姫野ベンチマークに よる計測を行ってみた. そのスペックを表4に示す. ス ペックを見ればわかる通り, 同サーバはCPUを16搭載 しているため, 実行ホスト16台相当のベンチマーク計測 までを対象とした. また, 問題サイズはSとMの2つ をそれぞれ3回ずつ計測し, 平均値を求めた. 結果を図 9に示す.
結果を見ると, 計測に用いた問題サイズによって多少 の性能差が見られるものの, 今回1CD-Linuxによって 構築したグリッド環境でも十分並列計算機と同等の性能 を発揮できていることがわかる. 今回比較対象とした並 列計算機はグリッド環境ではないため, この結果から厳
密にはグリッド適正の評価を行うことはできないが, 本 研究の成果として1CD-Linuxを用いて構築したグリッ ド環境がどの程度の性能を持っているのか確認するため の参考になるものと考えられる.
5. まとめ
本論文では, 資源的コストおよび時間的コストの削減 を目標とした, 1CD-Linuxを用いたグリッド環境の構 築, およびその検証について報告した.
本研究の成果は1CD-Linuxを用いてグリッド環境を 実現できたことである. これにより今までグリッド環境 を構築する際に大きな負担となっていた, 実行ホスト構
㪚㪞
㪇 㪉㪇㪇 㪋㪇㪇 㪍㪇㪇 㪏㪇㪇 㪈㪇㪇㪇 㪈㪉㪇㪇
㪈 㪉 㪋 㪏 㪈㪍 㪊㪉 㪍㪋
ታⴕ䊖䉴䊃ᢙ
㪤㪦㪧㪪
㪜㪧
㪇 㪌㪇 㪈㪇㪇 㪈㪌㪇 㪉㪇㪇 㪉㪌㪇 㪊㪇㪇 㪊㪌㪇 㪋㪇㪇 㪋㪌㪇
㪈 㪉 㪋 㪏 㪈㪍 㪊㪉 㪍㪋
ታⴕ䊖䉴䊃ᢙ
㪤㪦㪧㪪
㪠㪪
㪇 㪌 㪈㪇 㪈㪌 㪉㪇 㪉㪌㪊㪇 㪊㪌 㪋㪇 㪋㪌
㪈 㪉 㪋 㪏 㪈㪍 㪊㪉 㪍㪋
ታⴕ䊖䉴䊃ᢙ
㪤㪦㪧㪪
㪣㪬
㪈㪇㪇㪇㪇 㪉㪇㪇㪇 㪊㪇㪇㪇 㪋㪇㪇㪇 㪌㪇㪇㪇 㪍㪇㪇㪇 㪎㪇㪇㪇㪏㪇㪇㪇 㪐㪇㪇㪇 㪈㪇㪇㪇㪇
㪈 㪉 㪋 㪏 㪈㪍 㪊㪉 㪍㪋
ታⴕ䊖䉴䊃ᢙ
㪤㪦㪧㪪
㪤㪞
㪇 㪌㪇㪇 㪈㪇㪇㪇 㪈㪌㪇㪇 㪉㪇㪇㪇 㪉㪌㪇㪇 㪊㪇㪇㪇 㪊㪌㪇㪇 㪋㪇㪇㪇 㪋㪌㪇㪇
㪈 㪉 㪋 㪏 㪈㪍 㪊㪉 㪍㪋
ታⴕ䊖䉴䊃ᢙ
㪤㪦㪧㪪
㪙㪫
㪇 㪈㪇㪇㪇 㪉㪇㪇㪇 㪊㪇㪇㪇 㪋㪇㪇㪇 㪌㪇㪇㪇 㪍㪇㪇㪇 㪎㪇㪇㪇
㪈 㪋 㪐 㪈㪍 㪉㪌 㪊㪍 㪋㪐 㪍㪋
ታⴕ䊖䉴䊃ᢙ
㪤㪦㪧㪪
㪪㪧
㪇 㪌㪇㪇 㪈㪇㪇㪇 㪈㪌㪇㪇 㪉㪇㪇㪇 㪉㪌㪇㪇 㪊㪇㪇㪇 㪊㪌㪇㪇
㪈 㪋 㪐 㪈㪍 㪉㪌 㪊㪍 㪋㪐 㪍㪋
ታⴕ䊖䉴䊃ᢙ
㪤㪦㪧㪪
図8NAS Parallel Benchmarksによる計測結果
㪇 㪌㪇㪇 㪈㪇㪇㪇 㪈㪌㪇㪇 㪉㪇㪇㪇 㪉㪌㪇㪇 㪊㪇㪇㪇
㪈 㪉 㪋 㪏 㪈㪍
ታⴕ䊖䉴䊃ᢙ
㪤㪝㪣㪦㪧㪪
㪪㪄㪈㪚㪛 㪪㪄㪼㪪㪼㫉㫍㪼㫉㩷㫇㪌
㪇 㪌㪇㪇 㪈㪇㪇㪇 㪈㪌㪇㪇 㪉㪇㪇㪇 㪉㪌㪇㪇 㪊㪇㪇㪇
㪈 㪉 㪋 㪏 㪈㪍
ታⴕ䊖䉴䊃ᢙ
㪤㪝㪣㪦㪧㪪
㪤㪄㪈㪚㪛 㪤㪄㪼㪪㪼㫉㫍㪼㫉㩷㫇㪌
䋨㪸䋩㩷ᆢ㊁䊔䊮䉼䊙䊷䉪㩷㩷㗴䉰䉟䉵㩷㪪 䋨㪹䋩㩷ᆢ㊁䊔䊮䉼䊙䊷䉪㩷㩷㗴䉰䉟䉵㩷㪤
図9姫野ベンチマークによるCD-Linuxと高性能演算サーバの性能比較
築における資源的, 時間的コストが削減され, より簡便 にグリッド環境を構築することができるようになった.
特にその結果の表れとも言えるのが, 64台の実行ホスト によるグリッド環境の構築であり, 今回, 一時的にしか 利用できない環境での実験を実現できたのは, まさこの 1CD-Linuxによる成果の1つであると言える.
さらに, 4章の実験で行った実行ホスト側におけるグ リッド環境の構築やベンチマークソフトによる計測はほ ぼ全てが自動化されており, グリッドミドルウェアのイ ンストールからベンチマークの準備に至るまで1CD-
Linuxを起動するだけで全てが行われるようになって
いる. したがって, 今までただ 「難しそうである」 とい う理由だけで敷居を高くされがちであったグリッドコン ピューティングの導入を, より容易にできたものと考え ている.
しかし本研究で開発した1CD-Linuxでは管理ホスト 側の資源的, 時間的コストを解消することはできず, ま た別途DHCPサーバなどを準備する必要性があった.
他にもベンチマークの計測結果において異常と思われる データの原因解明や, 1CD-Linuxの例外エラーに対す る対処など, 改善すべき点もいくつか存在する. 今後は それらの課題点を検討していくと共に, より詳細な検証 を行う. また既存のPC環境を一時的にグリッド環境と して利用することで並列計算機と同等の性能を達成でき ることが確認できたことを受け, 学内のPC教室等の PCを有効活用した大規模なグリッド環境の構築につい ても実証実験を行っていく予定である.
注
(1) 実際にはグリッドを構成する全ホストから参照でき る領域が存在しさえすればよいため, ファイルの 共有機能は必ずしも管理ホスト上に実装する必要 性はない. しかし本論文ではSun Microsystems の提供しているマニュアルに従い, 標準的なSGE の導入手順として管理ホストへのNFSの導入を前 提としている.
(2) 仮にHDDを搭載していたとしても, 1CD-Linux 側から自動的にそのHDDがマウントされることは ないため, 既存のソフトウェア的環境に変更が加 えられることはない. しかし本論文では, 1CD- LinuxがHDDにアクセスする必要性がないという ことを明確にするため, あえて実行ホストの実験 環境にはHDDを搭載していない.
謝 辞
本研究では, 工学部2005 (平成17) 年度卒業論文生の 大淵卓也氏, 2006 (平成18) 年度卒業論文生の岩熊寛樹 氏, 小松計之氏の研究成果を参考とさせていただいた.
また実験設備の利用にあたり福岡大学総合情報処理セン ター関係者方々のご協力を頂いた. ここに記して謝辞を 表す.
参 考 文 献
[1] 日本アイ・ビー・エム システムズ・エンジニアリ ング株式会社:「グリッドコンピューティングとは 何か」
[2]The Globus Alliance http://www.globus.org/
[3]Sun Microsystems - Sun Grid Engine
http://jp.sun.com/products/software/gridware/
[4]Fedora JP Project - Official Site http://fedora.jp/
[5]Make One Linux プロジェクト http://molproject.sourceforge.jp/
[6]WWW.TUX.ORG Contents of .
http://www.tux.org/pub/tux/benchmarks/
System/unixbench/
[7]Himeno benchmark xp
http://accc.riken.jp/HPC/HimenoBMT/
[8]NAS Parallel Benchmarks Changes http://science.nas.nasa.gov/Software/NPB/