• 検索結果がありません。

情報爆発時代におけるわくわくするITの創出を目指して : パートI : 情報爆発時代における新しい基盤技術 : 3.情報爆発は情報システムをも「爆発」させる

N/A
N/A
Protected

Academic year: 2021

シェア "情報爆発時代におけるわくわくするITの創出を目指して : パートI : 情報爆発時代における新しい基盤技術 : 3.情報爆発は情報システムをも「爆発」させる"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)特集 ★ 情報爆発時代 における わくわく する IT の 創出 を目指して. 【 パート I:情報爆発時代における新しい基盤技術 】. 3.. 情報爆発 は 情報システムをも 「爆発」させる. 松岡 聡* 1.  情報爆発時代の IT 基盤の危機. * 1 東京工業大学. が高く,安全安心で,かつ大規模なデータ処理を行える ような,新しいタイプの大規模分散実行基盤である「安.  情報の爆発的増大を扱う IT システム基盤も今や爆発. 全安心グリッド基盤」を実現することを目標とし,その. 的に大規模化しているが,従来の IT システムに関する. 基礎的な技術を研究する.目指す世界においては,何. 既存技術の延長だけでは,高度なセキュリティ・100. 百万 CPU やペタ∼エクサバイト以上のデータを内在す. 万オーダへのスケーラビリティ・大規模な故障に対す. る広域な IT 基盤において,さまざまな計算資源の割り. る自律的なリジリエンシー(堅固さ)などを実現する. 当て・故障に対する対処・高度なセキュリティの実現が. のは,まだまだ困難であるのが現実である.たとえば,. 人手に頼らず,高性能な仮想計算環境が分散環境上に自. 2003 年に発生した Blaster,Slammer などのウィルス. 律的に,必要に応じて構成され,かつ,その上で種々の. の広域的な感染騒動では,ソフトウェアのセキュリティ. アプリケーションが安全安心かつ高性能に実行できる.. ホールを介して感染が広がり,またその感染の過程で大. また,この目標を実現するために,多くのグループが共. 量のネットワークトラフィックが発生し,さらにイン. 同して基礎的な研究開発を行う強固な分野コミュニティ. ターネットの主要サイトに対して大規模な DDoS(分. と共有の研究基盤“InTrigger” (本特集 939 ページ). 散 Denial of Service)アタックが行われた.その結果. を形成して,大規模な情報爆発のグランドチャレンジ問. 大企業を含む多くのサーバが影響を受け,一説によれば. 題を,我々のシステムソフトウェアの成果を用いて実践. 2003 年 8 月の北米大停電に繋がった可能性がある,と. 的に実証するとともに,研究の産物を直接的に社会に提. の指摘もある.. 供していくことを目標ともしている..  また,この数年来の東証や銀行システムの停止,携帯 メールの不調,特定サービスのサイトの長期ダウンなど の社会の根幹の IT 基盤システムの不安定性は,システ ムエンジニアの汗水の努力によるシステム管理手法だけ.  アプローチ:  システムが大規模な自己の資源で自分の面倒を見る. では,情報爆発時代にはその限界を容易に超えてしまっ.  我々のプロジェクトにおける研究のアプローチでは,. ている.それらに対処するために,巨大なサーバ群を集. 分散システムにおいてセキュリティ・耐故障性/安全性・. 約し,仮想機械技術の動的配置で必要な資源確保を行. 自律構成/システムの自己モニタリングなどが,情報爆. う Cloud コンピューティングが近年注目されているが,. 発に処する IT 基盤の莫大な資源の中で,ふんだんに計. その機能は比較的単純であり, その上でのセキュリティ・. 算資源等が割り当てられることにより,分散した環境に. 複数の Cloud を跨ったスケーラビリティや耐故障性,. おいても高度な安全安心 ・ スケーラビリティ ・ 高性能を. さらに既存 IT インフラとの整合的な統合など,高度な. 得ることに新規性を見出している.これは,従来の分散. 機能はまだまだ発展途上である.. システムやその研究において,少しでも資源を節約し,.  さらに,今後の科学技術における広域な e- サイエン. 効率改善を目指していたアプローチと根本的に異なる.. ス基盤の台頭により,大規模並列計算科学技術アプリ.  たとえば,システム内の計算ノード・アプリケーショ. ケーションを巨大なスーパーコンピュータ複数に跨って. ン・ユーザなど各要素を,マジョリティの計算コストを. 実行したり,分散したペタバイト級に対して高度なデー. 費やし徹底的にモニタリングし,リアルタイムに総合. タ処理を行っていくが,大規模化に伴う環境の本質的な. 管理することにより,システム侵入や大規模故障の発. 不安定さ・安全安心な動作環境の欠如等により,現状で. 端となるイベントを早期に捕らえ,防護的対策をとる. はまだまだ信頼のおける基盤としては不十分である.  本プロジェクトでは,情報爆発時代のために,信頼性. 904. 情報処理 Vol.49 No.8 Aug. 2008. (図 -1) .  このような基盤およびその構成技術を我々は「安全安.

(2) 3.. 伴う三重系のシステムなどはシステム構築の常套手段で. 爆発するシステム上での 安全・安心な大規模コンピューティング. あるし,パソコンなどでもアンチウィルスなどの防衛ソ フトウェアに計算資源が使われるのは常識になってい る.我々の主張は,今後これらの傾向は一般化しかつ加. 単一 システム イメージ. スケーラブル プログラミング. 情報爆発 は 情報システムをも「爆発」 させる. 速することである─個々のノードレベルでは,現状の スケーラブル. ・ヴァーチャライゼーション. スケーラブル モニタリング スケーラブル セキュリティ 安定を維持する 診断・検疫 2500CPU. スケーラブル データ処理 本来の 計算を行う 5000CPU. 2 ∼ 4 個から将来は数十や数百個のマルチコア化が起こ り,また,インターネットレベルでは,Cloud などの 動的な仮想機械資源により任意の個数のノードを確保で きるなどの,計算資源がふんだんに利用できる環境が訪 れるであろう.その際に最も価値があるのはデータであ り,相対的な「計算」の価値はデフレが起こり,貴重で. 安全を守る 2500CPU. スケーラブル セキュリティ 診断・検疫. 図 -1 大規模な分散システムでは CPU 資源の半数はシステムの安全性 や安定性を確保するために費やされる必要がある.. かつ爆発する情報・データの処理の保障性・安全安心を 守ることに多大な計算コストをかけることが十分見合う ことになろう.  我々は,このような将来の状況を見越し,情報爆発を 処理するシステム全体で,計算やデータのコストをかけ ることを恐れず,インターネットや,その上の Web サー. 心グリッド基盤」と呼んでいる.無論,我々の研究の目. ビス・Cloud コンピューティングなどの,まだまだス. 標は我々自身で数百万ノードにおよぶ実際の基盤を構築. ケーラビリティ・耐故障性・セキュリティの面で脆弱な. するのではなく,むしろ基礎研究としてそのための基礎. システム基盤に盤石性をもたらし,さまざまな高度な. 技術を探求することにある.. データ処理を安心して行えるための下支えのソフトウェ.  いままで述べてきたような「情報爆発において資源を. ア基盤技術を研究開発していく.. 豊富に使ってシステムのスケーラビリティや安全安心を 確保する」というのは,一見大いなる計算資源の無駄に 見えるかもしれない.確かに,従来の並列・分散システ ムの研究は,どちらかといえば,たとえば分散アルゴ.  プロジェクトの全体構成:  我が国のソフトウェア研究パワーを集結. リズムの効果的な実装による高効率なシステム構築を目.  上記の「安全安心グリッド基盤」の基盤技術の基礎研. 指すものが多かった.しかしながら,文頭に述べたよう. 究を行うために,我が国のさまざまなソフトウェア分野. に,今の社会基盤となったインターネットを中心とする. の先進的なソフトウェア研究者が集結した:大規模並列. 大規模情報インフラと,その上での情報爆発では,デー. システム,高性能ソフトウェア,高性能数値計算,大規. タの大規模な処理・解析・提示や事故によるアクセス不. 模グリッドシステム,Peer-to-peer(P2P)型分散計算. 能・改変・遺失に対する防御,あるいは漏洩・盗難・改. システム,自己反映計算/アスペクト指向,並列・分散. ざんの検出や防止が最も重要なシステムの特質となって. プログラム言語,仮想機械,セキュアな Web サーバや. いる.つまり,分散システムの数十パーセントの効率改. メールシステム,組込み&センサなどの,いわゆるソフ. 善の価値よりは,その内在するデータの価値の方が遥か. トウェアのシステム分野に加え,ネットワーク関係:特. に大きくなっているのが現状で,その費用対効果を鑑み. にセキュリティ,モデル化,センサネットなどを含み,. れば,いわば「莫大な資源を使って全体の安全安心を守. 種々の顕著な研究実績を持つ研究者たちである.. る」ことはむしろ必然の流れといえよう..  まず,研究チーム全体の旗頭として,全部で 4 班か.  多くの大規模工業システムや製品─たとえば飛行機の. らなる計画班と,平成 19 ∼ 20 年の 15 班の公募班が,. ように効率と安全性が高い次元でバランスされなくては. 全体として以下のようなさまざまな要素技術の研究を. ならない─では,安全安心のために多くの資源を割いて. 行っている:. いる.現実社会の物理的なライフライン系の基盤におい ても,その安全安心や永続性に関し,多くの社会的コス. A. さまざまなネットワークやソフトウェアの先進的な. トを支払っている.情報システムでも,特定の状況では. 安全安心モニタリング・監視基盤:先に述べたように,. このような考え方は適用されてきた.Tandem のよう. システム自身やネットワークの状態を,多くの計算資源. にビジネス系における二重系の耐故障システム,あるい. を用いることを厭わず常時監視し,さまざまな解析を行. はミッションクリティカルな制御系において voting を. うことによって,システム全体のセキュリティや安全安 情報処理 Vol.49 No.8 Aug. 2008. 905.

(3) する IT の 創出 を目指して. ★. 特集. 情報爆発時代 における わくわく. 【 パート I:情報爆発時代における新しい基盤技術 】. 心を確保する.モニタリングや解析のオーバヘッドをな. な どは 存在 する. しかし なが ら,我 々の よ う に 数 千. るべく軽微にすることを目標としていた従来の研究と異. CPU 以上の規模と数十個所の分散を同時に自己所有の. なり,我々はモニタリングやその解析において,CPU・. インフラ構築として目指しつつ,かつ各大学の情報基. ストレージ・ネットワーク(特にルータや監視装置)を. 盤センタ等が保有する Linux クラスタ型で万オーダの. 莫大に消費することを是とする.これにより,大規模か り,高度なセキュリティや安全性を確保することが可能. CPU を有する大規模スーパーコンピュータや,商用の Cloud 基盤などとも連動を視野に入れる研究基盤は世 界的にも珍しい.我々は InTrigger を研究基盤として積. となる.. 極的な運用を行い, 単に実験を単発的に行うだけでなく,. B. 数千ものノードを跨るシステムのスケーラビリティ. 研究成果のソフトウェアをその上で展開し,情報爆発の. の保証を行うソフトウェアフレームワーク:規模にス. 研究者に積極的に利用してもらうことによって,成果普. ケーリングする並列アプリケーションや,多数のリクエ. 及とさらなる研究の深化をはかるのである.また,スー. ストが瞬間的に生じるインターネットのサービスのため. パーコンピュータとの連動で,従来にはなかった情報爆. には,今後の情報爆発用のシステム基盤は,従来の分散. 発としてのグランドチャレンジにもアタックする.. つ複雑さを伴うロバストな監視を行うことが可能とな. 処理における研究のように単なる接続性を目指すだけで はなく,並列計算やサービスの形態に応じて,効率よく 構成が変化できなくてはならない.これらの技術によ.  5 年間の道半ばにしてのさまざまな研究成果. り,たとえば分散したデータ処理基盤において,一部に.  上記の大きな目標設定を行い,5 年間続く研究の中. データの処理が集中してシステム全体のボトルネックが. ではまだまだ道半ばであるが,多くの注目すべき成. 生じることを回避したり,数千以上の CPU によって構. 果が得られつつあり,また,それらの研究の多くは,. 成される大規模な分散仮想クラスタ環境を高速に構築し. InTrigger を有効に使うことによって,大規模なスケー. たり,またそれらに故障が生じた場合でも効率よく回復. リングの実験を可能にした.これらの成果は種々の. し,さらにはシステムの自動チューニングを行う,など. ジャーナルや,IEEE IPDPS や IEEE CCGrid/HPDC,. の柔軟な対応が可能となる.. ACM Grid2008 などのメジャーな査読付きの国際学会. C. 大規模な分散システム上で,容易・スケーラブル・. で発表されており,国際的なインパクトは高まってい. かつ安全安心なプログラミングを可能にする基盤:通常. る.その成果を 1 つ 1 つ挙げるのは本稿の目的ではない;. の単なる並列・分散プログラミング言語やその環境と異. むしろ,それぞれの項目をハイライトする成果を抜粋し. なり,プログラミングシステム自身が大規模分散の抽象. て紹介することを試みよう.. 化および分離した記述をサポートしたり,あるいは内在 的に自動検出・最適化を行って,スケーラブルに実行環. 項目 A. さまざまなネットワークやソフトウェアの先進. 境に対応することによって,大規模分散にまつわるプロ. 的な安全安心モニタリング・監視基盤. グラミングのオーバヘッドを減らすことが可能となる..   ま ず, 項 目 A. に 関 し て は, 我 々 は LAN 環 境 か ら. D. 分散した大規模データ処理のための,高度に仮想化. WAN 環境に至るまで,大規模に資源のモニタリングと. され動的に構成可能,かつ安全でスケーラブルなデータ. 自動解析を行うことによるセキュリティ・安全安心の確. 処理の基盤:情報爆発時代の分散システムは,単に計算. 保を行っている.これらは従来と比較してそれ自身大規. 15. 18. を分散させるだけではなく, ペタ(10 )∼エクサ(10 ) 21. 模な計算資源をインターネットや LAN の中に要するも. ∼ゼータ(10 )バイトにものぼるデータを容易に,効. のであるが,大幅なセキュリティや安全安心がもたらさ. 率よく,かつ安全安心に処理できなくてはならない.こ. れる.. れらの技術により,インターネット上の大規模な次世代.  たとえば,国立情報学研究所の福田らは「スケーラブ. サーチや,科学技術アプリケーションなどにおける大規. ルな監視とアドレス空間の動的利用が融合した情報通信. 模な観測データの収集および処理などが可能となる.. 基盤」において,インターネットの分散した拠点におい.  また,A ∼ D までの研究を推進するために,すで. て,アドレス空間を鑑みた DoS アタック等の監視法を. に述べたように我々は数千 CPU 級の全国規模で展開. 提案している(図 -2) .これにより,インターネットの. する計算機科学のための共有分散テストベッド基盤. それぞれのホスト側だけでは断片的な情報しかなく,同. “InTrigger”の構築と運用を行っている.我が国には今. 定が困難な複雑なアタックを,グローバルな視点で解析. まで大規模な分散システムソフトウェアのための広域に. し,防御につなげることを可能としている.対照的に,. 分散した共通研究基盤が存在していなかった.また,世. 筑波大の前田らは「通信端点における分散検知モジュー. 界的に見ても,米国の PlanetLab やフランス Grid ’ 5000. ルによる侵入防止機構」の研究で,通常のようにネット. 906. 情報処理 Vol.49 No.8 Aug. 2008.

(4) 3.. 情報爆発 は 情報システムをも「爆発」 させる. • 情報爆発時代に増大する攻撃性通信に対抗する基盤 ‒ 攻撃のモデル化・類型化が重要 → 防御技術への応用 ‒ 従来の攻撃監視(Network Telescope, Darknet, etc.) では できなかった広いアドレス空間の監視を分散して可能に 従来手法 Network Telescope, Darknet, etc.. 広いアドレス 空間を監視 (固定的). 本研究提案の アプローチ それぞれ狭いアドレス 空間を協調して監視 (動的). 目標. • 無数に散らばる未使用断片ア ドレス空間を活用することで攻 撃検知を行うアーキテクチャ 成果. The Internet Cloud. • 小規模監視アドレスブロック間 に時空間的な相関(予測可能 性)があることを解明. DDoS 型攻撃 探索型攻撃. 図 -2 スケーラブルな監視とアドレス空間の動的利 用が融合した情報通信基盤(福田(NII)). •分散的な侵入検知 •情報爆発時代の大規模・  超高速ネットワークに対応 •内部からの攻撃に対応 •暗号通信に対応  インターネット. 組織内部 ネットワーク SW. IPS. バックボーン スイッチ. •IPS(侵入検出器) を各 PC などに分散配置,並列 処理による高速化や安全性を達成. IPS サーバ クライアント PC. IPS. クライアント PC. IPS. クライアント PC. SW. 図 -3 通信端点における分散検知モジュールによる 侵入防止機構(前田ら(筑波大)). ワークの入り口でネットワークの「門番」ともいえる. の関数呼び出しを常に記録し,正常に実行された場合と. IDS システムを集中して 1 カ所置くのではなく,図 -3. 故障が発生した場合を比較することで障害の原因を解析. のように,各ホストの通信の端点に分散配置することを. する.まず,正常実行時を監視することにより得られる. 提案している.これによりアタックの解析は分散化して,. 実行時のプログラムのトレースのデータより,システム. それぞれに計算パワーをかけることにより,結果的に監. の正常な振舞いを表すモデルを構築し,システムに故障. 視のスケーラビリティを大幅に上げ,ネットワークのバ. が発生した場合は,構築済みモデルと故障発生時のト. ンド幅を向上させることが可能となる.また九州工業大. レースを比較し,異常な関数呼び出しを検出する.実際. 学の中村らは「分散モニタリングによる大規模オーバレ. に,本システムは実装され実験の結果以下のような好結. イネットワークの自立制御に関する研究」 において, デー. 果を残した.大規模並列プログラミング用の標準ライブ. タセンタ内でネットワークのロギング・解析を分散的に. ラ リ で あ る MPI(Message Passing Interface) の 中. 行い,異常検知がされたときはその部分を排除するよう. でも,米国 Argonne 国立研究所などで開発され,最も. なセルフヒーリングを行うシステムの構築法を示して. 世の中で広く用いられている実装である MPICH を,並. いる.. 列マシン内にとどまらず,分散環境で利用した際には,.  また,このような監視はネットワークだけにはとどま. 適切に起動できない障害が知られていた.我々のシステ. らない.筆者らのチームは,大規模分散システムのシス. ムを用い,InTrigger 上の 3 拠点,78 ノード構成での. テムソフトウェアやアプリケーションの実行状態を常に. 障害トレースを取得し,提案モデルを用いた異常検知を. 監視し,異常原因の解析を行う方式を開発した.図 -4. 行って,同障害の原因バグに該当する個所を容易に特定. にあるように,同解析手法はシステムの各構成プロセス. できることを示した. 1). . 情報処理 Vol.49 No.8 Aug. 2008. 907.

(5) する IT の 創出 を目指して. ★. 【 パート I:情報爆発時代における新しい基盤技術 】. 故障原因解析をモニタリングした関数実行のトレースのデータ 解析へ帰着 =>自動化&並列処理スケーラビリティを達成 trace. trace. trace. trace. proc trace trace. proc proc. proc. proc. モデルと故障トレー スを比較し異常検知. f1 f3 f4. proc proc proc. trace. 異常度. 関数 f2. trace trace trace. f5. 怪しい関数 を特定. proc. 正常実行振舞い をモデル化. ケーススタディ InTrigger上での MPICH の非決定的 なバグを検出. Model. 図 -4 自動的・スケーラブルなモニタリ ングによる故障解析(松岡ら(東工大) IEEE IPDPS2008). 需要分布の変化に追随しミラーサーバ 数が変動 ミラーサーバの台数は高々30 台程度 ミラーサーバ数の推移 80. 余剰なミラーサーバが 停止し数が減少. 70 60 ミラーサーバ数. 特集. 情報爆発時代 における わくわく. 50 40 30 20 10 0 0. 10000. 20000. 30000. 40000. 経過時間[秒]. 50000. ※破線は需要分布が   変動した時刻. 図 -5 オーバレイネットワーク上の需 要に応じたミラーサーバの変動.  さらに,多種多様なシステムのモニタリングを行うこ. 項目 B. 数千ものノードを跨るシステムのスケーラビリ. とが考えられる.情報爆発のシステムソフトウェア研究. ティや安全安心性の保証を行うソフトウェアフレーム. の中でも,何らかのモニタリングを行い,スケーラビリ. ワーク. ティ・耐故障性・セキュリティを確保するという研究が.  システムの監視にとどまらず,情報爆発のためのシス. 多い.たとえば,奈良先端大の砂原らは自律型セキュア. テムソフトウェアは,情報爆発したデータの処理におい. センサネットワークにおいて mobile IP の仕組みを拡. て,大規模にシステムがスケーラブルに動作し,かつそ. 張して,セキュリティと通信距離を同時に鑑みて P2P. の安全安心性が保証される,という役割を果たさなけれ. 的に自律的にオーバレイネットワークを構成するアルゴ. ばならない.これらに関して,我々は従来は数千や数万. リズムおよびシステムを提示し,早大の中島らは OS の. 以上にスケールしなかったシステム基盤技術でさまざま. カーネルレベルのトレースを分散環境にて自動的に行. な挑戦を行っている.. い,情報収集・分析を行うシステムを提案している.こ.  たとえば,慶應大の河野らは,P2P(Peer-to-peer). れらすべてを統合して利用することにより,莫大な処理. 技術を用いて,サーバに対するリクエストの需要変動に. が要求されつつも「安全安心グリッド」の礎となること. 応じて,ミラーサーバの動的再配置をオーバレイネット. が期待される.. ワーク上で行う基盤技術を提案している(図 -5).特定. 908. 情報処理 Vol.49 No.8 Aug. 2008.

(6) 3.. 情報爆発 は 情報システムをも「爆発」 させる メモリ・LAN などが異なる状況で,自律的に最適化を 行うことが望ましい.その点,東大の須田らが性能モデ ルに基づき,かつ数理的に最適化を行う自動チューニ ングにおいて特筆すべき成果をあげている.特に,従 来はアドホックな探索が多かったチューニングにおい て,その数理構造の解明と,数理的な技術の確立を目指 し,Bayes 統計の手法を用いた最適化技法を確立した. これにより,試行過程の反復の一部も「評価」に組み 込むことが可能となり,結果として探索の場合の数の大. 図 -6 資源選択法による仮想クラスタ構築時間の比較. 幅(50% 程度)な削減が,統計的な保証を伴い可能と なった.. のサービスに対しオーバレイネットワークを通過する. 項目 C. 大規模な分散システム上で, 容易・スケーラブル・. サービスのリクエストが多くなると,システムが自律. かつ安全安心なプログラミングを可能にする基盤. 的に判断し,仮想マシン技術を用いてミラーサーバの数.  スケーラブルで安全安心を達成するシステムソフト. を増加させる.実験の結果,リクエストの増減に応じて. ウェアの基盤レイヤが構築された上で,どのようにそれ. ほぼ理想的にサーバの数を適切に配置し,負荷変動に追. をプログラミングで活かすか,が課題となる.無論,一. 従できることを示した.埼玉大の吉田らの「大規模分散. 部の分散システムの安全安心関係の機能はプログラミン. 情報共有・配信に向けた適応型ピアツーピアシステム」. グの範疇外である場合もあるが,一般的にはプログラム. の FCANng でも,上記の手法と似ているが多少異なる. 内で何らかのアプリケーション情報をシステムとやりと. 方式で,同様の効果を達成しており,大規模なインター. りするのが有利な場合も多い.そのような際に,そのた. ネットの特定のページ群への Web サーバのリクエスト. めのプログラミング言語やフレームワークなどを用いる. を P2P ネットワーク上で分散サーバ群で構築し,大規. ことによって,記述の容易性や簡便化・統一化・さらに. 模な負荷変動に耐え得るシステムを構築できることを示. は他の無関係なプログラムの部分との独立性の確保,な. している.. どの効果が期待できる(図 -7) ..  また,筆者らは仮想化技術を用いて,複数の分散し.  東工大の千葉らは,システムの直行的な機能や性質を. た計算機センタなどの資源を跨いで仮想的なクラスタ. 分離記述することが可能な「アスペクト志向」のプログ. である Virtual Private Cluster を高速に構築する技術. ラミング手法を用い,分散システムにおいて既存のプロ. を開発した. 2). .これは 1000 ノード以上の規模の大規模. グラムに分散データの同期機能や,それを用いた分散視. な仮想クラスタの構築を,従来のように何十分や数時. 覚化の機能を容易に追加できることを示した.これによ. 間かけるのではなく,スケーラブルにかつきわめて短. り,ユーザは既存のプログラムに対し,分散にかかわ. 時間(2 分程度)で構築することを可能とする.そのた. る記述を分離してそれぞれ別コンポーネンツとして記述. めに,クラスタのソフトウェアのパッケージ構成を効率. し,後から融合させることにより同期・分散にかかわる. 的にキャッシング・転送を行う新しいシステム技術を開. 高度な機能を入れ込むことが可能となった.. 発・提案し,さらに構築時間のモデル化およびそのパラ.  東大の田浦らは性能モデルと観測により,下位の. メタ学習に基づいた資源選択手法を提案した.これに. (物理レベルの)ネットワークのトポロジ(つまり,. よって,インストールシステム技術ノードごとの性能が. Ethernet のネットワークのスイッチがどのように物理. 非均一な大規模グリッド環境においても安定して高速な. 的に相互配線されているか)を,事前情報なく推定する. 構築を行え,ランダムに計算ノードを選択する最も単純. ことに成功した. な手法(FIFO や他の単純なヒューリスティック)に比. ネットワーク上で MPI によって記述された並列プログ. べて大幅に構築時間短縮を実現できることが分かった. ラムを,プロセス移送により自動的に最適化したり,通. (図 -6).これらの動的なシステム構成技術は,全体的. 信と性能のモデルに基づき効率的で自動的なデータ分配. 3). .また,それらの情報を用いて,分散. 4). に大変注目が高く,話題の Cloud における動的な配置. を行えることを示した. .このような技術により,従. を,さらに複数の Cloud を跨ぐ環境へ仮想的に拡張す. 来は均質かつ安定していた並列計算機上のみで実行可能. ることが可能となる.. だったプログラミングの記述を,情報爆発用の大規模分.  さらに,システムソフトウェアのみならず, アプリケー. 散システムで用いることが可能になる.. ションプログラムも分散環境で各サイトごとに CPU・ 情報処理 Vol.49 No.8 Aug. 2008. 909.

(7) ★. 特集. 情報爆発時代 における わくわく. する IT の 創出 を目指して. 【 パート I:情報爆発時代における新しい基盤技術 】. 「アスペクト志向」プログラミング手法を用い,分散 プログラム開発で「分散アスペクトの同期織り込み」 による開発期間の大幅短縮 (千葉ら@ 東工大 ) 千葉滋:汎用的なプログラム 変換器の研究,H19 文部科 学大臣表彰・若手科学賞. リモート画面の視覚化での 容易な分散仕様変更. 広域不均一環境用分散並列処理システム(田浦ら@ 東大) • ネットワーク構成の自動推定. ( IEEE HPDC07)からバンド幅推定へ • トポロジ推定 • 各リンクのバンド幅の自動推定⇒バンド幅地図形成. 100Mbps. 1Gbps 2Gbps. 1Gbps. • 安定な広域放送アルゴリズム (データ分配). 100Mbps. 100Mbps. 1Gbps. 100Mbps. ( IEEE CCGrid2008) • 各ホストへの転送レートは, 残りの宛先ホストに影響されない • 木構造でなくても良好な性質 多くの広域ネットワークプログラミングに適用へ. 図 -7 大規模な分散システム上で,容易・ スケーラブル・かつ安全安心なプログラム を可能にする基盤. • 情報爆発用にさまざまな新技術を研究開発 • 世界に分散するファイルシステム,複製による高バンド幅処理 • 複合RPC によるRPC 回数の削減,遠距離アクセスの高速化 • ローカル I/O 利用による超高速かつスケーラブルなファイル性能. /gfarm ggf aist file1. jp gtrc. file2. file1. file3. 総合バンド幅 1,433 MB/s. file2 file4. Gfarm File System プライベートネットワーク. 図 -8 Gfarm v2 分散ファイルシステムによ るペタバイトスケールの大規模分散データ 処理(建部ら @ 筑波大). 項目 D. 分散した大規模データ処理のための,高度に仮. に動作しており,情報爆発内のすべての研究グループが. 想化され動的に構成可能,かつ安全でスケーラブルな. 利用できる環境となっている.また,筆者らは Gfarm. データ処理の基盤. などの広域分散ファイルシステムにおいて,特定のデー.  最後に,個別のデータ処理ミドルウェアやアプリケー. タサーバやネットワークに対するアクセスの集中を自動. ションの研究開発も同時並行に行われており,情報爆発. 検出し,データの複製を行ってそれらを適宜自動的に分. において検索・解析・フィルタリング・マイニングなど. 散させることによって,単一のアプリケーションだけで. の各種データ処理をペタバイト以上のスケールで行うシ. なくシステム全体で最適なデータアクセスの状態を実現. ステム技術の礎となる.. するアルゴリズムを Gfarm 上で実現し,InTrigger 上.  筑波大の建部らは Gfarm. 5). と呼ばれる広域ファイル. でその有効性を示している. 6). .. システムを開発してるが(図 -8) ,本特定領域において.  その他にも,大規模なデータ処理を行う上位レベルの. 情報爆発に対応するために,新たにバージョン 2 の設. システムソフトウェアの研究─ P2P 環境のためのデー. 計を行い,スケーラブルな高速化や高度な耐故障性を確. タマイニング・e-Science データ処理のためのコンポー. 保することを目指している.特に Gfarm は多くのデー. ネンツ技術・ストリームデータ処理プログラムのプログ. タグリッドプロジェクトにおいて数百テラバイト級の広. ラム変換法─が行われており,さらに今後は特定領域内. 域データアーカイブの管理のミドルウェアとして用いら. の他の関連する研究グループと連携することによって,. れており,本プロジェクトにてさらにペタスケール以上. データ処理基盤研究を充実させていく.. のデータの適用へ拡張されることが期待されている.実 際,InTrigger では新旧バージョンの Gfarm が標準的. 910. 情報処理 Vol.49 No.8 Aug. 2008.

(8) 3.  スケーラビリティと安全安心・社会への成果普及を目指して  今まで述べてきたように,情報爆発に対処するための システム実行基盤としてのスケーラブルな「安全安心な グリッド基盤」を構成するための多くの要素技術を研究 開発し,InTrigger や実際の環境においてそのスケーラ ビリティや有効性を確認した.その根本に流れる原理は 「今後はデータおよびその保護の方が価値が高い」ので 「情報爆発に処する IT 基盤の莫大な資源の中で,ふん だんに計算資源等が割り当てられることにより,分散し た環境においても高度な安全安心 ・ スケーラビリティ ・ 高性能を得る」ことにある.これらは IT 基盤技術の進 展および情報爆発に対する社会ニーズに支えられている が,その傾向はますます強くなるであろう.  今後はさらに個々の研究を推進して,より総合的な. 情報爆発 は 情報システムをも「爆発」 させる 2)Nishimura, H., Maruyama, N. and Matsuoka, S. : Virtual Clusters on the Fly-Fast, Scalable, and Flexible Installation, Proc. 7th IEEE Int'l. Symp. Cluster Computing and the Grid (CCGrid 2007), pp.549-556 (May 2008). 3)Shirai, T., Saito, H. and Taura, K. : A Fast Topology Inference : a Building Block for Network-aware Parallel Processing, Proc. 16th Int'l Symp. High Performance Distributed Computing (HPDC 2007), pp.11-22 (June 2007). 4)Takahashi, K., Saito, H., Shibata, T. and Taura, K. : A Stable Broadcast Algorithm, Proc. 8th IEEE Int'l. Symp. Cluster Computing and the Grid (CCGrid 2008), pp.392-400. 5)Takefusa, A., Tatebe, O., Matsuoka, S. and Morita, Y. : Per for mance Analysis of Scheduling and Replication Algorithms on Grid Datafarm Architecture for High Energy Physics Applications, Proc. 12th IEEE Int'l. Symp. High Performance Distributed Computing (HPDC-12), pp.34-43 (2003). 6)Sato, H., Matsuoka, S., Endo, T. and Maruyama, N. : AccessPattern and Bandwidth Aware File Replication Algorithm, The 8th IEEE/ACM Int'l Conf. Grid Computing (Grid 2008), Tsukuba, Japan (Sep. 2008 (to appear)). (平成 20 年 6 月 30 日受付). 情報爆発に処する IT システムの全体的なアーキテク チャの同定,およびその中でのそれぞれの技術の位置づ けや相互関連を明白にしていく予定である.また,研 究開発した多くのミドルウェアを,Linux クラスタ型 のスパコンや Cloud 基盤と連携できるように拡張した. InTrigger 上に実際に使える基盤として利用可能とする ことで実証実験に活用し,さらにはオープンソースのソ フトウェアとして公開していくことによって,多くの社 会の人たちにも「情報爆発時代に使える有用なソフト ウェアおよび技術群」として成果を広めていきたい. 参考文献 1 ) Maruyama, N. and Matsuoka, S. : Model-Based Fault. Localization in Large-Scale Computing Systems, Proc. 22nd IEEE Int'l. Parallel and Distributed Processing Symp. (IPDPS'08) (Apr. 2008).. 松岡  聡(正会員):[email protected] 2001 年より東工大・学術国際情報センター教授・我が国のグリ ッド/クラスタ研究のパイオニアの 1 人として,NAREGI(研究グ リッド構築の国家プロジェクト)および TSUBAME(2 年間我が国 最速のスパコン)の研究開発に従事.2006 年学術振興会賞受賞・ 2009 年にアジアから初めて ACM/IEEE Supercomputing の論文委 員長に就任.. 情報処理 Vol.49 No.8 Aug. 2008. 911.

(9)

参照

関連したドキュメント

テキストマイニング は,大量の構 造化されていないテキスト情報を様々な観点から

当社は、お客様が本サイトを通じて取得された個人情報(個人情報とは、個人に関する情報

海外旅行事業につきましては、各国に発出していた感染症危険情報レベルの引き下げが行われ、日本における

「系統情報の公開」に関する留意事項

ウェブサイトは、常に新しくて魅力的な情報を発信する必要があります。今回制作した「maru 

Google マップ上で誰もがその情報を閲覧することが可能となる。Google マイマップは、Google マップの情報を基に作成されるため、Google

23)学校は国内の進路先に関する情報についての豊富な情報を収集・公開・提供している。The school is collecting and making available a wealth of information

SFP冷却停止の可能性との情報があるな か、この情報が最も重要な情報と考えて