招待論文
Softwarized されたネットワークシステムのディスアグリゲーションと
データ駆動型のネットワーク管理
塩本 公平
†a)Data-Driven Network Management for Dis-Aggregated Softwarized Network System
Kohei SHIOMOTO
†a)あらまし 本論文では,最近のコンピュータネットワークの研究における大きなトレンドであるデータセンタ ネットワーク,ネットワーク仮想化・ソフトウェア化,機械学習や人工知能のコンピュータネットワークへの応 用の研究を振り返りながら,2020年以降のコンピュータネットワークの発展の方向性を展望する.特に,データ センタネットワーク,ネットワークの仮想化・ソフトウェア化,ネットワークシステムをブラックボックスとし て捉えてその入出力のデータを測定し測定された多量のデータに基づきネットワークシステムをモデル化しマネ ジメントを行うアプローチであるデータ駆動型マネジメントについてこれまでの研究状況を振り返り今後の方向 性を展望する.
キーワード ネットワーク仮想化,ビッグデータ,機械学習,人工知能,コンピュータネットワーク
1.
ま え が きインターネットは,
1990
年代に商用化されて以来,世界規模の自律分散型経路制御,
DNS
による階層的な ドメイン名の分散管理,World Wide Web (WWW)
などによりコンピュータネットワークの世界的な基盤 となり,90
年代後半に常時接続,ADSL
やFTTH
に よるブロードバンドアクセスにより各家庭での高速な インターネットアクセスが可能となった.90
年代後 半から普及し始めた携帯電話を用いたインターネット アクセス,無線LAN
技術の普及,第三世代携帯電話 以降の移動体通信網により,モバイル通信は普及し,高速化が進んできた.このようなトラヒック増加に対 応するため
IP
網のバックボーンに光ネットワーク技 術を導入するための研究が2000
年代に活発になされ た[1]
〜[17]
.ムーアの法則は半導体の集積度が
18
ヶ月で2
倍に なると述べている.半導体の集積度向上による計算†東京都市大学,東京都
Tokyo City University, Tokyo, 158–8557 Japan a) E-mail: [email protected]
DOI:10.14923/transcomj.2018PHI0001
能力の発達によってコンピュータそのものの更なる発 達が続くといった相乗効果を生みながら,過去
50
年 あまりでコンピュータの処理能力は指数関数的に向上 してきた.コンピュータ関連の技術の発展により高性 能なサーバのハードウェアを安価に購入できるように なった.通信機器の製造においてもマーチャントシリ コンのチップを用いたホワイトボックススイッチが製 造されるようになり,高性能なスイッチのハードウェ アを安価に購入できるようになった.半導体の集積度 の向上速度が鈍化しても,並列化や光部品の導入な どにより,同じコストで入手可能なコンピュータの処 理能力は指数関数的な向上は今後も続くと期待され る.ムーアの法則に従いながらコンピュータの処理能 力は10
年でおおよそ100
倍の性能向上が図られてき ており,それによってもたらされるルータの高速化や 高性能化やネットワーク仮想化などによりネットワー クのアーキテクチャの抜本的な変化が生じ量的変化が 質的変化を起こすようになる.近年,安価になった高 性能ハードウェアの上でソフトウェアで機能を実現す るSoftware-Defined Netwroking (SDN)
やNetwork
Function Virtualization (NFV)
などの仮想化技術が 進展している.2007
年にiPhone
が発表・販売されて以来,2008
年からは
Android
端末のスマートフォンが販売開始された.スマートフォンにはカメラ,
GPS
や様々な センサが搭載され,それらの機能を意識したオンライ ンインターネットサービスが登場してきた.電子メー ル,Web
ブラウジング,情報検索,映像ストリーミン グ,ソーシャルメディア,オンラインストレージなど のサービスが普及し,トラヒックの増加につながって いる.データセンタネットワーク内での帯域需要は,広域インターネットの増加率を凌ぐ速度で増加して おり,
12
から15
ヶ月で2
倍に増加している[18], [19]
.Amazon
,Yahoo!
,Microsoft
などのオンラ インインターネットサービス事業者により様々なサー ビスが提供されるようになる一方で,これらの事業者 はハイパースケールデータセンタと呼ばれるデータセ ンタを世界中の拠点に構築するようになっていった.これらのデータセンタにはエンドユーザの様々な情報 が蓄積されるようになり,これらのデータを分析する ことで自社のサービス改善を行うようになっていった.
データの蓄積が進む中で機械学習や人工知能がこの
20
年余りで飛躍的に発達した.昨今
Internet of Things (IoT)
が喧伝されているよ うに,今後はあらゆるモノがインターネットにより接 続されて,情報を収集・蓄積し,機械学習や人工知能 を用いたビッグデータ分析技術を用いることで,あら ゆる産業,交通・自動運転,ヘルスケア,エネルギー,環境,行政,教育,防災が進化する時代が到来するこ とが期待される.本論文では,最近のコンピュータネッ トワークの研究における大きなトレンドであるデータ センタネットワーク,ネットワーク仮想化・ソフトウェ ア化,機械学習や人工知能のコンピュータネットワー クへの応用の研究を振り返りながら,
2020
年以降の コンピュータネットワークの発展の方向性を展望する.特に,これからのネットワークアーキテクチャの進化 を主導していくであろうデータセンタネットワーク,
ネットワークシステムをディスアグリゲートしクラウ ド型サービスを用いることで機敏に対応しコスト競争 力のある迅速なネットワークサービスを提供するネッ トワークの仮想化・ソフトウェア化,ネットワークシ ステムをブラックボックスとして捉えてその入出力の データを測定し測定された多量のデータに基づきネッ トワークシステムをモデル化しマネジメントを行うア プローチであるデータ駆動型マネジメントについて述 べる.本論文の構成は以下のとおりである.
2.
においてデータセンタネットワークに関する研究動向を振り 返る.
3.
においてネットワーク仮想化・ソフトウェア 化に関する研究動向を振り返る.4.
においてデータ駆 動型マネジメントと機械学習・人工知能のコンピュー タ・ネットワークへの応用に関する研究動向を振り返 る.5.
において本論文のまとめと今後の展望について 述べる.2.
データセンタネットワークオンラインインターネットサービス事業者は急増す るトラヒックに対応するためにハイパースケールデー タセンタと呼ばれるデータセンタを世界中の拠点に 構築している.これらのハイパースケールデータセン タ内のトラヒックの増加はインターネットのトラヒッ クの増加量を凌ぐ速度でトラヒックが増え続けてお り,これからのネットワークアーキテクチャの進化を 主導していくであろう.このように多量のトラヒック を運ぶデータセンタネットワークが今後のネットワー クアーキテクチャの変化に大きな影響を与えていくと 予見される.ここではデータセンタネットワークに関 するこれまでの研究について振り返る.
2. 1
データセンタネットワークのトポロジー:Fat Tree
オンラインインターネットサービス事業者は電子 メール,
Web
ブラウジング,情報検索,映像ストリー ミング,ソーシャルメディア,オンラインストレージ などのサービスの急激な普及に伴いデータセンタを 拡張していった.データセンタネットワーク内での帯 域需要は,広域インターネットの増加率を凌ぐ速度 で増加しており,12
から15
ヶ月で2
倍に増加してお り[18], [19]
,急増するトラヒック需要に迅速に対応し ながら低コストで拡張性のあるデータセンタネット ワークを構築する一方で,ハイパースケールデータセ ンタと呼ばれるデータセンタを世界中の拠点に構築す るようになっていった.データセンタネットワークの 初期の研究ではFat Tree
型等の規則的な構造をもつ トポロジーのものが活発に研究されてきた[18]
〜[26]
.DCell [21]
とBCube [22]
はサーバを相互接続する 再帰的なトポロジー構造をもつアーキテクチャであ り,異なるレベルのDcell
と複数のリンクにより接続 しながら,上位レベルのDCell
は多数の下位レベルのDCell
からなる完全結合グラフとして構成される.安価な汎用のスイッチを用いて低コストで帯域効率 の良いデータセンタネットワークを構築するために,
図1 データセンタネットワークのFat Tree型のトポ ロジー
Fig. 1 Fat Tree topology of data center networks.
図
1
にあるようなFat Tree
型のトポロジーのものが 提案された[20]
.Portland [24]
もFat Tree
型のトポ ロジーである.集中制御型のネットワークマネージャ がネットワーク全体の状態を把握し,ARP
解決,耐 故障性,マルチキャストをハンドリングし,スイッチ が軽量なプロトコルを用いてトポロジーにおける自分 の位置を発見する.各ホストに割り当てられる階層的 な擬似MAC
アドレスを用いて,レイヤ2
によるス ケーラブルなパケット転送とルーティングを実現して いる.VL2 [23]
もFat Tree
型のトポロジーである.Valiant Load Balancing (VLB)
により複数の経路の トラヒック負荷を分散させることで任意の交流トラ ヒックパターンに対処している.レイヤ2
と3
の間にShim
レイヤ(
レイヤ2.5)
を設けて,ホストとネット ワーク間の機能分離を行っている.Hedera [25]
は集 中型のマネージャがスイッチからフローに関する情報 を収集し,各フローが競合しないような経路を計算し,スイッチに経路を設定しトラヒックを迂回させること で,ハッシュ型の
ECMP
負荷分散よりも高い帯域使用 効率を上げることを示している.F10 (Fault-Tolerant Engineered Network) [26]
はFat Tree
型トポロジー の対称性に若干の歪を加えて効率的な局所的な迂回を 可能とすることで耐故障性を向上させている.これら の提案[20], [23], [24]
においては,Fat Tree
型のトポ ロジーが用いてポートカウントや帯域の拡張性を確保 している.ハイパースケールデータセンタにおいてはクラス タは
16
ラックで構成されており,各ラックは40
台の サーバが設置され,クラスタあたり640
台のサーバ を収容しているものが多い.ハイパースケールデー タセンタにおいては,複数のクラスタがビル内で相 互に接続され,複数のビルがキャンパス内で相互に接 続されているのが一般的である.Singh
ら[18], [19]
は5
世代にわたるデータセンタネットワークについて報告している.マルチステージの
Clos
ネットワークを構築するに当たり,汎用のハードウェアコンポーネントであるマーチャントシリコンのス イッチチップを用いてスイッチハードウェア装置を開 発しデータセンタネットワークを構築している.イン ターネットと異なりデータセンタは集中型の制御と管 理を行い複数の等価経路によるパケット転送を行う.
集中型のコントローラが信頼性の高い
Out-of-band
のC
プレーンを用いて動的なリンクステートを収集し再 配布し各スイッチがリンクステートを用いてフォワー ディングテーブルを計算する.データセンタは世界の 数十拠点で稼働し10
年間で100
倍の容量拡張を行い1Pb/s
以上の帯域を運んでいると報告されている.2. 2
データセンタネットワークにおけるトラヒッ ク特性データセンタネットワークのアーキテクチャやトポ ロジー設計を考える上でデータセンタネットワーク内 の交流トラヒックやトラヒック特性を把握することが 重要である.以下ではデータセンタネットワークにお けるトラヒック特性の研究についてサーベイする.
データセンタと言っても様々な形態のものがありト ラヒックやワークロードの特徴はデータセンタごとに 異なってくる.大学キャンパスや企業においては自組 織内の
IT
サービスの統合整理を進めるために数百台 から数千台のサーバからなるデータセンタをオンサイ トで構築している.一方で,ハイパースケールのオン ラインインターネットサービスプロバイダは数万台以 上ものサーバからなるデータセンタを世界中の拠点に 分散させて,電子メール,Web
サーバ,ストレージ,Web
検索,ゲーム,インスタントメッセージ等の多 様なクラウドサービスを提供したり,インデクシング や多量データセットの分析などのインハウスでの多量 のデータ処理も行っている.このように様々なワーク ロードがあり分散されたデータストアに対してMap
Reduce
型のデータ処理を行うワークロードもあれば,電子メールやインスタントメッセージなどの
Web
リ クエストに対する応答を返すワークロードもある.ハイパースケールデータセンタの計算機資源の単位 であるクラスタにおいては,検索インデックスの生成,
Web
検索,広告提供などの多数の相互に関連するアプ リケーションが走っており多量のデータを互いに共有 している.ネットワークへのアクセスを多用するデー タ処理のパイプラインは,増加しづつけるデータセッ ト上で動作し,個々のリクエストのクリティカルパス 上にある多くのデータへアクセスする必要がある.こ のようなアプリケーションにとっては帯域が潤沢にあるほうが有利であるため,クラスタは大きくなる傾向 にある.クラスタの規模が大きくなるほど,ジョブの スケジューリング効率が高くなり,計算機資源が枯渇 してジョブスケジューリングが失敗する状況が発生す る頻度を抑えることができる.大規模化するクラスタ 内にわたってストレージが分布するため,データの信 頼性を高めるために,ラックや電源に冗長性をもたせ るようになる.すなわち,データはクラスタ内に広範 囲に分散されトラヒックの局所性は小さくなりクラス タ内にわたり大きな帯域が必要となる.このように,
データの配置とジョブスケジューリングはほとんど局 所性を示さなくなる.
Kandula
ら[27]
は多量のデータセットのマイニング を行うために用いられているMicrosoft
のデータセン タネットワークのトラヒック特性を分析した.ソケット レベルのログを収集するためのソフトウェアを各サー バにインストールし,データセンタネットワークのト ラヒックを収集した.交流トラヒック行列に関して,多くのトラヒックの塊が同じラックのサーバ間でやり 取りされることで発生する
work-seek-bandwidth
型の トラヒックパターンと,ある特定のサーバがクラスタ 内の多数のサーバに対してデータのプッシュとプルを 行うことで発生するscatter-gather
型のトラヒックパ ターンの二つを見出した.後者のトラヒックパターンは
Map Reduce
型のワークロードによるものであり,データが多数の小さな塊に分割されて多数のサーバで 分散処理される
Map Reduce
のジョブで多数のサー バで処理された結果が集計されている様子が反映され ていると分析している.また,ほとんどのフローは短 小であり80%
のフローは10
秒以内で終了し,200
秒 以上継続するフローは0.1%
以下であり,長く継続す るフローはほとんどないことを見出した.トラヒック の変化は非常に急激に起こり過渡的なスパイクもあれ ばしばらく持続するスパイクもあり,激しいスパイク の中にはネットワーク全帯域の半分以上の帯域を占め ることがあり,通信パターンで全二重通信を行ってい るものはほとんどないことを見出した.更に交流トラ ヒック行列内の総トラヒック量が同じでもサーバ間の トラヒックについてはかなり変化していることを見出 した.Greenberg
ら[23]
はMicrosoft
のデータセンタネッ トワーク内の交流トラヒックの性質についてクラスタ リングを適用して分類を行った.一日分のトラヒック データである864
の交流トラヒック行列のデータに関してクラスタリングを適用した結果,
50
から60
の クラスタに分類できることを明らかにした.交流トラ ヒック行列は将来の予測に役立つような周期性も示さ ずに変化を続けていることを見出した.このような周 期性の欠如はデータセンタ内で走っているアプリケー ションの性能を向上するためにランダム性などが用い られていることに起因していると考察している.Benson
ら[28]
は三つの異なるタイプのデータセン タに関して,10
のデータセンタのトラヒックの性質を 分析した.データセンタのタイプとしては,Web
サービスや
Map Reduce
型ジョブを走らせているクラウドデータセンタ,ファイルストレージ,認証サービス,
業務アプリケーション,その他様々なサービスを走ら せている大学キャンパスや企業のデータセンタ等の異 なるタイプのデータセンタのトラヒックの性質を分析 した結果,以下を明らかにしている.
(
1
) アプリケーションの配置はラックにまたがり 均一であることはない.(
2
) 大半のフローはサイズが小さく10KB
以下で ある.(
3
) トラヒックはHeavy-Tail
分布をもつOn-Off
パターンである.(
4
) クラウドデータセンタでは多数のトラヒック は同じラック内にいるサーバにとどまっているのに対 し大学キャンパスや企業のデータセンタでは大半のト ラヒックラック外に出ていきデータセンタネットワー クを転送されて行く.(
5
) リンク使用率はコア階層以外の階層では低い.(
6
) 使用率が低いリンクにおいてもパケット損失 が発生しておりこれはスパイクによるものであると推 定される.(
7
) リンク使用率は日単位の変動や週単位の変動 を示し特にクラウドデータセンタの多くにおいてはコ アリンクでは一桁近く大きな変動となる.Roy
ら[29]
はMap
Reduce
型ジョブのトラヒックの特性については,文献
[23], [27], [28]
で報告されているものと同じように 振舞っている一方で,Map Reduce
型のジョブが 示すトラヒック特性とは大きく異なり,以下の三つの 測定結果を得ている.(
1
) トラヒックはラック局所的でなく均一に分散 しているわけでもない.(
2
) 多くのフローは長時間持続しているが多量の データを運んでいるわけではない.(
3
) パケットサイズは小さく非Map Reduce
型 ジョブの場合は中間値は200
バイト以下でありOn-Off
パターンを示していない.Ghobadi
ら[30]
は100
から2500
ラックからなる四 つの商用クラスタの20
万台以上のサーバからのトラ ヒックトレースを分析した.ワークロードとしては,Map Reduce
型ジョブ,検索インデックス生成ジョブ,データベースやストレージシステムなどのジョブな どの混在のものである.ラック間のトラヒックを分析 した結果,ほとんどのラックのペアではほとんど通 信が行われておらず
46–99%
のラックペアは全くトラ ヒックを交換しておらず0.04–0.3%
のラックペアがト ラヒックの80%
を占めていることを見出した.この観 測結果からClos
やFat Tree
のような均一な帯域容量 をもつデータセンタネットワークのトポロジーは過剰 なリンク設備のため帯域が余るか,逆にリンク設備が 不十分で帯域が不足するかのどちらかとなり,非効率 であると考察している.2. 3
データセンタネットワークの再構成可能なト ポロジーデータセンタネットワーク内のトラヒック特性に 関する最近の研究
[30]
によると,大規模データセン タでは幾つかのホットスポットが発生していること が報告されている.ホットスポットを緩和するため,光
[25], [30]
〜[37]
や無線[38], [39]
を利用して,TOR
スイッチの間に直接回線を設定し,トポロジーを再構 成する方法が提案されている.例えば,図2
のように 光スイッチをTier-1
で用いると,トラヒックの偏り が生じ,特定のTier-2
スイッチ間の交流トラヒック 量が大きい場合に,光スイッチを用いて二つのTier-2
スイッチ間を光パスで直接接続することでトラヒック の偏りに対応することが可能となる.このようなアー図2 光スイッチを用いたデータセンタネットワークのト ポロジー
Fig. 2 Topology of data center networks utilizing optical circuit switch.
キテクチャを実現する上でキーとなる高次元で低遅延 の光スイッチや受動カプラと高速チューナブルトラン シーバを用いた放送選択型の光スイッチの実用化を見 据えた提案もなされている
[37]
.Helios [32]
は電気によるパケットスイッチと光によ る回線スイッチを融合し,運用中のトラヒックパター ンの変化に基づき,トラヒックの中で光回線で運ぶの に適したものを見つけて,動的にネットワークトポロ ジーを変更するアーキテクチャである.フル実装した パケットスイッチによるネットワークと同じ性能を,大幅に安いコストで,ケーブリング,フットプリント,
設置作業量などの負担を大幅に減らし,低消費電力で 実現できることを示している.
c-Through [31]
も電気 によるパケットスイッチと光による回線スイッチを融 合したアーキテクチャであり,サーバを活用して,送 信側のサーバにおいてバッファを行い,光回線を使う のに見合う十分なだけのトラヒックを蓄積したら,光 回線を設定し転送を行う.Head of line (HoL)
ブロッ クや余計な遅延が生じないようにしてトラヒックを バッファする.Helios
がトラヒック推定やトラヒック 分離の機能をスイッチ側で行うのに対し,c-Through
はサーバ側がこれらを行い,データをバッファし光回 線が使えるようになったらバッファに蓄積したデータ を送出する.c-Through
とHelios
が1
ホップの大容量光回線で 課題解決を図ったのに対し,OSA [33], [40]
は,1
ホッ プの光回線を乗り継いで,フルメッシュの接続性を作 り,mice
フローやバースト性の高いフローをそれらの 複数の光パスを乗り継いで運ぶものである.1
ホップ型 のアーキテクチャでは対応が困難なFan-in
やFan-out
が高いホットスポットをもつようなワークロードに対 応する.また,トラヒック需要の変化に応じて,動的 に光回線の容量を細かい粒度で調整する.Traffic Matrix Scheduling [34]
はアプリケーション の情報を活用して短期間の需要を見積もり,回線の短 期間のスケジューリングを決定する.スケジューリン グにより決められたとおりに選択された端点間の組に 光回線を設定し光回線を高速に切り替えることでバッ ファリングや遅延を抑制する.ToR
スイッチにはこ のスケジューリングを知らせておき,宛先ごとに最も 多くの帯域が利用可能な時間を知っておくことで,ス ケジュールに合わせてパケットを送出することで,短 いフローと長いフローの両方を光回線スイッチにオフ ロードする.REACToR [35]
も電気によるパケットスイッチと 光による回線スイッチを融合したもので,C
プレーン がエンドホストの送信と光回線の割当を同期させるこ とで,エンドホストであるサーバから見るとTOR
ス イッチがパケットスイッチに見えるように工夫してい る.C
プレーンのプロトタイプを作成し,高速に再構 成できる光スイッチを用いることで,全体を電気によ るパケットスイッチで構成する場合に比べて圧倒的な 低コストでパケットスイッチと同等の性能を実現でき ることを示した.FireFly [36]
はフリースペースオプティクス(free space optics: FSO)
を用いたラック間の接続ネット ワークであり,FSO
を用いることで,RF
無線の干渉 の問題を回避している.以下の三つの点が大きな特徴 である.(1)
全てのリンクが再構成可能である.(2)
全 てのリンクが無線である.(3) TOR
スイッチを除く 全てのコアスイッチを不要とする.また,dynamic bisection bandwidth (DBW)
という概念を提唱し,ラ ンダム正則グラフ(random regular graph)
を用いる ことでDBW
を最適化することを提案し,最適に近い 性能を達成するためのトポロジー選択とトラヒックエ ンジニアリングの発見的アルゴリズムを提案している.ProjecToR [30]
もフリースペースオプティクスを 用いたラック間の接続ネットワークである.12
マイ クロ秒以内に何万通りにも光の方向を変化させるこ とができるDigital micro mirror device (DMD)
を 用いて,高いFan-out
と迅速性を可能とした.小さ なフローを複数ホップも許容しながら運ぶための専有 型(Dedicated)
トポロジーと大きなフローをシング ルホップで運ぶための機会型(Opportunistic)
トポロ ジーの二つのトポロジーを組み合わせてトラヒックを 運ぶ.専有型トポロジーの再構成は長時間スパンで行 い,機会型トポロジーの再構成は現在のデマンドに応 じて即座に実行される.光技術を用いたトポロジー再構成については
IP over
Optical
ネットワークの研究においても活発に研究されており
[1]
〜[17]
,その研究成果はデータセンタネッ トワークのトポロジー再構成の研究にも参考になろう.文献
[9]
〜[14]
は仮想トポロジー設計に関する初期の代 表的な研究であり光ネットワーク上で構成されるIP
ネットワークのトポロジーの設計法を提案している.光ネットワーク上での
IP
ネットワークのトポロジー設 計問題を混合整数線形問題として定式化して発見的な アルゴリズムを提案している.文献[2], [8], [15], [16]
はIP
ネットワークに加わる交流トラヒックが時間ととも に変化することに対応するため,光ネットワーク上で 構成されるIP
ネットワークのトポロジーを動的に再構 成する方法を提案している.文献[1]
〜[7]
はGMPLS
を用いたIP over Optical
のマルチレイヤネットワー クの制御に関するので特に文献[5], [6]
はPCE
を用い たマルチレイヤネットワーク制御に関するものであり,文献
[4], [7]
はマルチレイヤネットワークサービスに関 するものであり,近年のネットワークスライスに関す る先行研究と捉えることもできる.2. 4 Fat Tree
型トポロジーと異なる静的トポ ロジーデータセンタネットワーク内の交流トラヒックは データセンタの用途によって大きく異なる.
Clos
やFat Tree
のような均一な帯域容量をもつデータセンタネットワークのトポロジーは過剰なリンク設備のため 帯域が余るか,逆にリンク設備が不十分で帯域が不足 するかのどちらかとなり
[30]
,様々な交流トラヒック に対応するトポロジーについての検討が近年注目を集 めている.Jerryfish [41]
やXpander [42]
などはFat Tree
型のもの[20]
と異なり,ネットワークを階層化し ておらず,TOR
スイッチが直接接続されてデータセ ンタネットワークを構成している.Fat Tree
型やClos
型のトポロジーでは利用可能な スイッチのポートカウントによって全体のネットワー クの構成が決まってしまい,設計範囲が非常に粗くな り,容量を拡張する際に多くのネットワークエレメン トの置き換えと多量のケーブルのつなぎ変えが発生す るため,逐次的な容量拡張が極めて困難である.この 課題を解決するためにJellyfish [41]
が提案されてお り,次数制約のあるランダムグラフトポロジーをTOR
スイッチ間に適用することで,サーバの追加を数本の エッジのつなぎ変えにより逐次的な容量拡張が可能と なっている.また,異なるポートカウントとリンク速度 をもつスイッチからなる異種のネットワークに対応す ることができるので,高密度で高速リンクのスイッチ が利用できるようになったらそれを組み込むことが可 能となる.均一負荷の条件の基での同一スイッチを用 いた任意のトポロジーのネットワークスループットの 上限を求め,ランダムグラフがこの上限に近いスルー プットを達成することを示している.Slim Fly [43]
は,スイッチの次数が与えられた場合,ネットワーク の半径を小さくすることで,スイッチやケーブルな どのネットワーク資源を減少させることに着目して
図3 Expander Graphによるデータセンタネットワー クのトポロジー
Fig. 3 Expander Graph topology of data center networks.
いる.
最適値に近い性能を達成できる
Xpander [42]
は,ネットワークトポロジーとして
Expander Graph
を 採用することで多数の短い経路によってトラヒックを 効率的に運ぶアーキテクチャを提案している(
図3)
.Expander
ネットワークはネットワークの全てのカットは多数のリンクがまたがっており,ノード間のト ラヒックが少数のリンクの組においてボトルネック とならないようになっている.小半径ネットワーク
(low-diameter network)
であるSlim Fly [43]
やラン ダムグラフであるJerryfish [41]
もExpander
と共通 の機能的特徴があることが示されている.Kassing
ら[44]
は交流トラヒック行列の歪がスタ ティックなトポロジーとダイナミックなトポロジーに どのような影響を与えるかを分析し,交流トラヒック 行列に歪がある場合でも,これらのタイプのスタティッ クなトポロジーのほうがダイナミックなトポロジーよ りも性能上有利であることを明らかにした.Expander
型のネットワーク[41], [42]
は最悪の交流トラヒックパ ターンに対しても,どのサーバがアクティブであるか などの情報が分からなくても,十分な帯域を得ている ことを示した.2. 5
今後の方向性オンラインインターネットサービス事業者はサービ スの急激な普及に伴いデータセンタを拡張していった.
急増するトラヒック需要に迅速に対応しながら低コス トで拡張性のあるデータセンタネットワークを構築す るため初期の研究では
Fat Tree
型等の規則的な構造 をもつトポロジーのものが検討されてきたが,データ センタネットワーク内の交流トラヒックはデータセン タの用途によって大きく異なり,Clos
やFat Tree
の ような均一な帯域容量をもつデータセンタネットワー クのトポロジーは過剰なリンク設備のため帯域が余るか,逆にリンク設備が不十分で帯域が不足するかのど ちらかとなる
[30]
.データセンタネットワークのアー キテクチャやトポロジー設計を考える上でデータセン タネットワーク内の交流トラヒックやトラヒック特性 を把握することが重要である.データセンタで動作す るアプリケーションの中にはトラヒックの平均的な振 る舞いの把握だけでは不十分で,マイクロバースト などを捉えることも必要となってくることが想定され る.幸いにもデータセンタネットワークのトラヒック 計測はサーバでの詳細な計測が可能である.また,ス イッチもデータプレーンのプログラマブル化が進展す れば[45], [46]
,これまで以上に詳細なトラヒック計測 が可能となると想定される[47]
.このような精度の高 いトラヒック計測とネットワークの構築・運用のより 精度の高い連携の研究が活発化するであろう.3. Softwarization
ソフトウェア化(
Softwarization
)は,これまで垂 直統合型のシステムであったネットワーク機器をディ スアグリゲーションし,これらの課題を解決するもの として期待されている.ネットワーク機器がディスア グリゲーションされ,専用品であった装置を汎用サー バや汎用スイッチ上で動作するソフトウェアとして実 現されるようになる.拡張性の高い汎用のハードウェ アとソフトウェアコンポーネントを組み合わせて,エ ンドーエンドシステムを柔軟に構成できるようになる.ソフトウェア化はデータセンタへの適用が先行したが,
今後は通信事業者への適用も進むものと考えられる.
ソフトウェア化によりネットワークシステムをディス アグリゲートし容量弾力性のあるクラウド型サービ スを用いることで様々なニーズに機敏に対応しコスト 競争力のある迅速なネットワークサービスを提供する ことが可能となる.すなわち,従来はハードウェアア プライアンスで提供していたネットワーク機能(ファ イヤウォール,ロードバランサ,
NAT
など)を,汎 用サーバ上で動作するソフトウェアとして実現するこ とで,クラウドにある汎用サーバ上で要求性能やトラ ヒック負荷に応じた性能をもつネットワーク機能を提 供することが可能となる.これまでクラウド事業者が汎用製品を用いてインフ ラを構築することで享受してきた規模の経済性,サー ビスの迅速な展開,弾力性のある容量でサービスを提 供する機敏性がもたらされると期待される.ここで は
Softwarization
に関するこれまでの研究について,SDN
とNFV
のSoftwarization
,Declarative
なポリ シー記述,SDN
を用いたInter-DC
,キャリアエッジ クラウドに焦点を当てながら振り返る.3. 1 Softwarization
によるディスアグリゲーシ ョン従来のネットワーク機器は,垂直統合型のシステ ムであり,個々のネットワーク機器ベンダが独自に製 品のシステムアーキテクチャを決めて製造してきた.
ネットワーク機器ベンダが頻繁に機能追加を続ける ことで,数千もの機能や数千万行ものソフトウェア規 模となり,これらの機器は複雑化している
[48]
.ネッ トワーク機器はブラックボックスとなり,ネットワー クオペレータがネットワーク機器の故障が原因となっ て生じるネットワークサービスの障害診断や新しい サービス機能の追加が困難となっている.また,ネッ トワーク機器を構成するコンポーネントの製造・供 給が止まると,ネットワーク機器全体の開発・維持管 理が継続できなくなる恐れも生じる.ソフトウェア化(
Softwarization
)は,これまで垂直統合型のシステム であったネットワーク機器をディスアグリゲーション し,これらの課題を解決するものとして期待されてい る.Software-defined networking (SDN)
とnetwork function virtualization (NFV)
はディスアグリゲー ションの最初のステップとして,ネットワーク機器を ソフトウェアとハードウェアのコンポーネントに分離 する.SDN [49]
はスイッチやルータ等のネットワーク機器からコントロールプレーンを分離するものであり,
論理的には集中型のコントローラがネットワークを 制御し,ルーティング,負荷分散,アクセス制御,セ キュリティ,ネットワーク構成などを司る.
SDN
は,RCP [50]
,PCE [51]
等の先行技術を経て,4D
アー キテクチャ[52]
の提唱と初期の具体的なSDN
実装で あるSANE [53]
やEthane [54]
とそれらの実装を踏 まえたOpenflow
アーキテクチャ[55]
の提唱を経て,世界的に研究開発が活性化した.
NFV [56], [57]
はミドルボックスにおいて実現され ている様々なネットワーク機能をソフトウェア化し,それらのネットワーク機能を汎用サーバ上で動作させ るものである.サーバー仮想化技術の発展により,仮 想マシンやコンテナ技術等を用いて,ネットワーク機 能を実装する.ミドルボックスにおいてデータプレー ンとして実装されているネットワーク機能は複雑であ り(例えば,複数のプロトコルレイヤにまたがって処
図4 SDNによるディスアグリゲーション Fig. 4 SDN-driven disaggregation.
理,パケットの変更,セッションの終端・生成等),ソ フトウェアで実現されていた.これまでアプライアン ス装置として垂直統合型で実装されていたネットワー ク機能を汎用サーバー上で動作するソフトウェアとし て分離する.これにより,
NFV
は弾力性のある容量・性能,リソースの効率的な利用,耐故障性,故障回復 性等のメリットをもたらす.
SDN
はスイッチやルータ等のネットワーク機器から コントロールプレーンを分離するものであり,NFV
は ミドルボックスにおいて実現されている様々なネット ワーク機能をソフトウェア化し,それらのネットワー ク機能を汎用サーバ上で動作させるものである.SDN
とNFV
はディスアグリゲーションの最初のステップ として,ネットワーク機器をソフトウェアとハードウェ アのコンポーネントに分離するものであるが,図4
に 示すように,SDN
によってディスアグリゲーションさ れたコントロールプレーンが,更に細かい粒度の機能 構成要素にディスアグリゲーションされて,これらの 機能構成要素を組み合わせることで新しいコントロー ルプレーンを構成できるようになることが期待され る.垂直統合で開発されてきたルータやスイッチはさ まざまなニーズに合わせて多種多様なプロトコルを実 装してソフトウェア規模は数千万行もの規模となって いるが[48]
,全てのユーザが,垂直統合で開発された 製品の全ての機能を必ずしも必要としていない.SDN
によってコントロールプレーンが分離されるが,コン トロールプレーンを分離した上で,更に,ユーザが必 要とする機能のみを選択して実装できるようにする 必要がある.これまでコントロールプレーンを構成し てきたネットワークソフトウェアを再利用可能な構成 要素に分解し,それらを組み合わせてユーザが希望す る機能が実装することができれば,ソフトウェアの開 発規模を削減し,短期間で新しい機能を追加すること も可能になると考えられる.IoT
の進展に伴い,多種 多様なデバイスが接続されて,さまざまなニーズに対図5 NFVによるディスアグリゲーション Fig. 5 NFV-driven disaggregation.
応した機能をタイムリーにネットワークソフトウェア に機能追加する必要性が高まることが予見され,ソ フトウェアの開発規模の削減や短期間での機能追加の 必要性は高まるものと考えられる.
NFV
に関しても,図
5
に示すようにファイヤウォールやNAT
等のネッ トワーク機能が更にヘッダ操作,ペイロード操作,セッ ション終端等の機能構成要素にディスアグリゲーショ ンされて,これらの機能要素を組み合わせることで新 しいネットワーク機能を構成できるようになることが 期待される.ファイヤウォールやNAT
等のさまざま なネットワーク機能を組み合わせてサービスを実現す るが,これらのネットワーク機能間で重複する処理が 実現されていることがあり,ヘッダ操作,ペイロード 操作,セッション終端等の機能構成要素にディスアグ リゲーションして,新しいネットワーク機能を構成し たほうが,無駄な処理を行わなくて済むといった利点 もある[58]
〜[60]
.機能のモジュール化を取り入れた ソフトウェアルータClick [61]
を用いたNFV
の研究 が活発に行われている[62]
〜[70]
.3. 2 Declarative
なポリシー記述Software-Defined Networking (SDN)
の初期の取 り組みはスイッチ装置からC
プレーンを分離し,ス イッチのフォワーディングテーブルを直接書き換える ことに主眼が置かれていた[52], [71]
.SDN
ネットワー クにおいては,汎用のスイッチハードウェアを使って ネットワークのデータプレーンを構築し,その上で,革新的なネットワークのアプリケーションやサービス の創造が期待されているが,ネットワークオペレーティ ングシステム
(Network Operating System: NOS)
が 様々な種類のスイッチハードウェアを抽象化するプラッ トホームとして重要な役割を担う[72]
.NOS
はネット ワーク資源を管理すると同時にハイレベルな抽象化とAPI
を提供することで,スイッチの管理・監視・プロ グラミングを可能とし,C
プレーンをスイッチから分 離するだけでなく,様々なプロトコルやAPI
を介して得られる非常に広範囲の多量の有益なネットワーク データを用いて拡張されている
[73]
.多くのSDN
プ ログラミング言語やコントローラフレームワークが提 案されている[74]
.Declarative
にポリシーを記述するパラダイムが近 年注目を浴びている.これまでネットワーク機器の設 定においては,Imperative
な設定方法が取られてお り,ネットワーク機器がどのように動作すべきかという
“How”
を設定することで,ポリシーの設定を実現していた.このような方法では,ネットワーク機器へ の設定内容が,ポリシーの目的の直感的な理解に必ず しも近くないため,ポリシー設定の誤りの原因となる ことがあった.これに対して,
Declarative
なポリシー の記述はネットワーク機器が何を達成しなければいけ ないかという目標である“What”
を記述することでポ リシーを記述するものである.DEFO [75]
はDeclarative
なトラヒックエンジニア リング手法でありInterior Gateway Protocol (IGP)
によりIP
パケットの到達性を確保しつつ,セグメント ルーティング(Segment Routing: SR)
を用いて,経路 の最適化を行う.ポリシーをDeclarative
に記述するた めに,ドメイン固有言語(domain specific language:
DSL)
の一つであるScala
言語を採用しており,ハイ レベルなネットワークの目標をトラヒック需要に適用 される制約条件と目的関数で記述し,DSL
で記述さ れた抽象化されたハイレベルなネットワークの目標を ネットワークの構成に反映する.目的関数としては最 大負荷の最小化,最大遅延の最小化,最短経路からの 乖離度合い,通過ノードや非通過ノードの指定等が用 意されている.SOL [76]
は,最適化ソルバとSDN
コントローラの 低レベルな詳細は抽象化し,SDN
アプリケーション開 発者がアプリケーションの高レベルな目的や制約条件 を記述させる.ネットワークトポロジー,トラヒック パターン,最適化の目的が入力として与えられ,最適 化ソルバの制約条件に翻訳され転送ルールが導出され,SDN
スイッチのフォワーディングテーブルに設定す る.トラヒックエンジニアリング,サービスチェイニ ング,トポロジー変更,オフロード等の多くの最適化 のアプリケーションにおいては,path-based
の定式化 が可能であることに着目し,オフラインであらかじめ 計算されたパスの候補を組み合わせて,オンラインで 制約条件を満たし目的関数を最大化する適切なパスを 選択する.path-based
の定式化により一般化と効率性を両立し,
SOL
はトラヒックエンジニアリング,サー ビスチェイニング,トポロジー変更,オフロード等の 様々な目的をもつアプリケーションを簡潔に表現し,最適解に近い解を得ることが可能であるとしている.
企 業 ネット ワ ー ク へ の ア ク セ ス 制 御 を 実 現 す る
Ethane [77]
のSDN
コントローラであるNOX
のポリ シー記述言語としてネットワークワイドなフローごと のポリシーを記述するためのハイレベルなDeclarative
言語が提案されている[78]
.ネットワークへのアクセ ス制御を実現するためのポリシーをステートメントの 集合として記述し,各ステートメントは簡単なif-then
関係を表現し,フローの先頭パケットがネットワーク のポリシーに照らし合わせて,ネットワークへの流入 の可否判断を行う.Declarative
な方法はデータセンタネットワークの トポロジー設計でも提案されている.Condor [79]
はDeclarative
なオブジェクト指向型のデータセンタネッ トワークのトポロジー設計言語(topology description language: TDL)
である.大規模な複数経路をもつ データセンタネットワークの設計は大規模で複雑であ り,全ての目的に合致するようなデータセンタネット ワークの設計は困難である.コスト競争力のある,信 頼性の高い,保守性の容易なデータセンタネットワー クを設計する際に,数多くの基準のトレードオフを検 討しなければならず,逐次的に拡張されていくデータ センタネットワークを設計することは困難を極める作 業となる.Condor
は構造的なビルディングブロック(スイッチ,パッチパネル,ラック,
POD
等)や,そ れらの関係と制約条件を伴った接続可能性を規定し,TDL
からトポロジーモデルの候補を生成する.トポ ロジーを簡潔かつ簡単に変更できる記述で表現し,ト ポロジー設計を制約条件充足問題に変換し,迅速なト ポロジー合成アルゴリズムを適用することで,データ センタネットワークの容量拡張をサービス水準を維持 したまま効率的に行うことができる.数万台のネットワーク機器によって接続された数十 万台のサーバからなる
[80]
,オペレータの 高レベルな意図をモデル化したものから低レベルな ベンダ依存のコンフィグを生成し,展開し,監視して いる.3. 3 SDN
によるDC
間接続オンラインインターネットサービス事業者はパブ リックなインターネットとピアリングしユーザへ提供 するサービスのトラヒックを運ぶ一方で,ハイパース ケールデータセンタを世界に分散配置し,これらの データセンタ間を接続し,複数のサーバ間でやり取 りされる様々な種類の内部サービスのトラヒックを運 ぶ
Inter-DC WAN (Wide Area Network: WAN)
を 構築し,運用管理している.これらのハイパースケー ルデータセンタを構築し,運用管理しているインター ネットオンラインサービス事業者らは,汎用品の価格 競争力の高いスイッチハードウェアを用いてデータプ レーンを構築し,SDN
によるネットワーク制御を行っ ている[81]
〜[84]
.世界に分散しているデータセンタ間を接続する
Inter- DC WAN
トラヒックの大半(
例えば,85–95%)
をテ ラバイトやペタバイトクラスの大量のファイル転送が 占めている[81]
〜[84]
.例えば,サーチエンジンは世 界中に分散したデータセンタにある検索インデックス を同期し,あるデータセンタで新たに生成された検索 インデックスを他の全てのデータセンタにコピーする.また,金融機関は毎日の取引データのバックアップを 複数の世界の拠点で同期を取るために多量のファイル 転送を行う.あるいは,メディア企業は高精細映像コ ンテンツを複数の配信エリアにコピーする.
Inter-DC WAN
が運ぶトラヒック量はインターネットよりも高い 成長率で増え続けている[81]
.サービス事業者は事業 面で激しい競争にさらされており,持続可能な設備投 資(CAPEX: Capital Expenditure) Inter-DC WAN
を構築しなければならず,Inter-DC WAN
の構築に おいてはSDN
が期待されるようになった.これらの ハイパースケールデータセンタを構築し,運用管理し ているインターネットオンラインサービス事業者らは,汎用品の価格競争力の高いスイッチハードウェアを用 いてデータプレーンを構築し,
SDN
によるネットワー ク制御を行っている[81]
〜[84]
.B4 [81]
と 呼 ば れ るSoftware-Defined
WAN
は既存の分散型IP
ルーティング(BGP/ISIS)
と集中型のOpenflow
型のトラヒックエンジニアリン グを組み合わせて,アプリケーションの優先度に合 わせて帯域を割当て,動的にトラヒック需要パター ンをシフトさせ,従来の手法では30–40%
程度に抑 えられているリンク使用率を100%
に近くまで向上 させている.Microsoft
のSWAN: Software-defined
WAN [82]
と呼ばれるSoftware-Defined WAN
もB4
と同様にInter-WAN DC
の使用率を向上させること を目標としている.このため,各アプリケーションの 需要に合わせて,いつどれだけの帯域を運ぶかをSDN
により制御し,過渡状態でも輻輳が発生しないように パスの再構成を行う.小さなスクラッチ容量を各リン クに留保しておき,最小のステップ数で過渡的な輻輳 を起こさずにパスを再構成するアルゴリズムをSDN
により実現している.数千もの個別のアプリケーションが
Inter-DC WAN
上で走っており,これらは大別すると次の三つに分類 される.•
ユーザデータ(
例,電子メール,ドキュメント,音声
/
画像ファイル等)
の冗長化のため遠隔のデータセ ンタへのコピー•
分散して配置されたデータが必要となる計算の ために遠隔のデータセンタにあるストレージへのアク セス•
複数のデータセンタ間の同期のための多量の データの遠隔のデータセンタへのコピーこれらのアプリケーションのタイプは,この順番にデー タ量は大きくなり,遅延への要求は緩くなる.これら は
(1)
インタラクティブ,(2)
エラスティック,(3)
バッ クグランドの三つのサービスクラスに分類される.イ ンタラクティブサービスはユーザエクスペリエンスの クリティカルパス上にあり遅延や損失に非常に敏感で ある.エラスティックサービスはユーザエクスペリエ ンスのクリティカルパス上になく遅延や損失にはそれ ほど敏感ではないが,期限付きであったりしてタイム リーな配信を必要とする.バックグランドサービスは メンテナンスやプロビジョニングのためのトラヒック で帯域を消耗するが,遅延に関する要件はさほどない ものである.多量のファイル転送は転送期限があることが
Inter- DC
トラヒックの特徴の一つである.多くのアプリケー ションにとって転送期限を保証することは重要であり ファイル転送の遅延はサービス品質や収益に直結する ことがある.例えば,検索インデックスの転送が遅れ ることは,検索結果の品質を低下させることになる.転送期限のクラスとしてはハードな期限とソフトな期 限があり,ハードな転送期限を要求するファイル転送 ではその期限が守られなければ意味がなくなってしま う.一方,ソフトな転送期限を要求するファイル転送 では期限が守られない場合にはその転送の価値が下が
るものの転送を完了する必要がある.
SWAN [82]
とB4 [81]
はトラヒッククラスに対し て完全優先制御を行うものの転送期限の保証を行わな い.これに対してTempus [83]
は転送期限を意識した 帯域管理を行い,各ファイル転送要求に対して,期限 内に全てが転送できない場合でも最大量の転送が完了 するように制御する.オンラインでファイル転送のス ケジューリングを行い,長い時間続いているファイル 転送をパスに詰め込みつつも,将来の変化に備えて容 量に余裕をもたせて制御する.混合パッキング被覆線 形問題を解くことで,効用関数を最大にしながら,期 限内に完了する最小の転送数が最大となるようにスケ ジューリングする.Amoeba [84]
も転送期限を意識し たファイル転送のための帯域管理を行う.データ量と 転送期限を各テナントに申告させて,各テナントに真 の要求を申告させるようなプライシングメカニズムを 働かせながら,時空間の帯域割当アルゴリズムを用い る.新しい要求を埋め込むときには適応型スケジュー リング(Adaptive Scheduling: AS)
を起動し,新し い要求に対してより良い転送完了時間を提供するため に既存の要求のリスケジュールが発生した場合には,機会型スケジューリング
(Opportunisitc Scheduling:
OS)
を起動し,局所拡張(Local Stretching: LS)
と結 合リスケジューリング(Joint Rescheduling: JR)
を 行う.Owan [85]
は光回線を組み合わせた方法で,recon- figurable add-drop multipexer (ROADM)
とルータ でネットワークを構成し,ROAM
の設定を変更し,動 的にIP
レイヤのトポロジーを変更し,バルクデータ 転送のトラヒックスケジューリングを行う.トラヒッ ク需要の変化に適応して,光回線の設定,ルーティン グ,レート割当を行い,転送完了時間を最適化し,転 送期限内に転送を完了する.焼きなまし法(Simulated Annealing: SA)
を用いて,現在のトポロジーを起点 として最大のスループットが得られるトポロジーを求 める方法である.3. 4
キャリアネットワークにおける分散クラウドSDN
は当初はInter-DC WAN
やデータセンタネッ トワークといったクラウド事業者への適用が進んだが,今後は通信事業者への適用も進むものと考えられる.
通信事業者は加速し続けるトラヒック需要や顧客へ新 しい魅力あるサービスをタイムリーに提供するといっ た課題に直面しており,例えば,
at&t
は最近の8
年 間で1000
倍のデータトラヒック量の増加があり,全米
100
都市に光ファイバアクセスを展開している[86]
. しかしながら,at&t
では4700
の電話交換局があり,そのうち幾つかは最大
300
種類ものハードウェアが配 備されているように[87]
,通信事業者のネットワーク のエッジは様々な専用装置はほとんど一貫性や統一的 なアーキテクチャがなく,過去何十年にわたって配備 されてきた.クラウド事業者は数種類の汎用製品を用 いてインフラを構築することで規模の経済性や迅速に 展開し弾力性のある容量でサービスを提供する機敏性 を享受しており,通信事業者のネットワークのエッジ にこそ,クラウド事業者が享受している規模の経済性 や機敏性が必要とされている.通信事業者は交換局のインフラを有しており,交換 局のビル設備を用いて,ローカルなデータセンタを構 築し,これらのデータセンタ間を自身が所有するネッ トワークで接続することで,エンドーエンドのクラウ ドを構築し,ネットワークとクラウドを統合管理し,今 日のクラウド事業者が提供しているのと同様に容量弾 力性のある迅速なサービス指向型のオペレーションモ デルを採用することができる
[88]
.通信事業者は既に 所有する分散したPoP
を活用して,小規模のクラウド 環境を構築し,更には,顧客の拠点まで拡張すること ができる(
図6)
.CLOUD4NFV
はProof-of-concept
プラットホームであり,サービス機能をas-a-service
の形態で提供し,Service Function Chaining (SFC)
によりサービスを生成することを実証した[88]
.また,動的な
SDN
制御により,柔軟なクラウド管理手法と 連携させて,通信事業者にネットワークの状態やユー ザの変化する要件に自律的に適応するNFV
ソリュー ションを提供することを示したProof-of-concept
デモ も報告されている[89]
.CORD (Central Office Re-architected as Dat- acenter) [87]
は ,通 信 事 業 者 の 電 話 局 に お い て ,Software-Defined Networking (SDN)
やNetwork Function Virtualization (NFV)
に加えて,容量弾力 性のあるクラウド型サービスを用いることで,コスト図6 ハイパーデータセンタとエッジクラウド Fig. 6 Hyper data center and edge cloud.
競争力のある迅速なアクセスネットワークを構築する ための
Network Opearatoin System (NOS)
を含め たプラットホームである.SDN
によりC
プレーンとD
プレーンを分離し,マーチャントシリコンを使って 製造された安価なホワイトボックスのスイッチを使う.NFV
によりハードウェアのアプライアンス装置から データプレーンを分離し,汎用サーバ上で動作する仮 想マシン(VM)
に移植することで高価なハードウェア のアプライアンス装置から安価な汎用サーバへ移行し,機敏で容量弾力性のあるオーケストレーションを実現 する.
CORD
は装置をディスアグリゲーションするこ とで,専用品であった装置を汎用サーバや汎用スイッ チ上で動作するソフトウェアとして実現する.汎用の ハードウェアとソフトウェアコンポーネントを組み合 わせて,拡張性の高い,機敏なエンドーエンドシステ ムを構成できるような統一的な抽象化を定義している.CORD
はディスアグリゲートされたソフトウェアコ ンポーネントを組み合わせてサービスグラフを構成し エンドーエンドサービスを提供する.3. 5
今後の方向性ハイパースケールクラウド事業者のデータセンタ内 のトラヒックの増加率がインターネットのそれを凌ぐ ようになり,これからはデータセンタネットワークが コンピュータネットワークのアーキテクチャの方向性 を決めるようになると想定される.通信事業者におい ても従来の電話局の設備を利活用したデータセンタ が普及すると想定される.これらのデータセンタ間を 自身が所有するネットワークで接続することで,エン ドーエンドのクラウドを構築し,ネットワークとクラ ウドを統合管理し,今日のクラウド事業者が提供して いるのと同様に容量弾力性のある迅速なサービス指向 型のオペレーションモデルを採用していくであろう.
仮想化・ソフトウェア化はデータセンタへの適用が先行 したが,今後は通信事業者への適用も進むものと考え られる.仮想化により装置がディスアグリゲーション され,専用品であった装置を汎用サーバや汎用スイッ チ上で動作するソフトウェアとして実現されるように なり,拡張性の高い汎用のハードウェアとソフトウェ アコンポーネントを組み合わせて,機敏なエンドーエ ンドシステムを構成するようになると期待される.
4.
データ駆動型マネジメントシステムが複雑になるとシステムの性能指標が様々 なパラメータによって影響を受け,ランダムに変化す
るこれらのパラメータが相互に影響を及ぼし合い,何 らかの公式によりシステムの性能を評価することが困 難になることが多い.これらのパラメータと性能指標 の相関や依存関係の有無がデータとして測定できるよ うな場合に,測定した様々なデータからシステムの性 能指標を評価しマネジメントに活かすことが期待され る
[90]
.本論文ではこのような方法をデータ駆動型マ ネジメントと呼ぶ.SDN
やNFV
によるディスアグリゲーションにより,システムの構成要素数が増すことで,運用管理に複雑 さが増す要因ともなる.個々の構成要素のメカニズム を完全に把握して,ネットワークシステムをマネジメ ントすることは困難であり,システム全体をブラック ボックスとして捉えて,その入出力のデータを測定し,
測定された多量のデータに基づきネットワークシステ ムをモデル化し,マネジメントを行うアプローチが有 望であると考えられる.すなわち,ディスアグリゲー ションによりシステム構成要素数が増えたときの全体 マネジメント方法として,以下の方法がある.
方法
A
個々の要素のメカニズム(仕様)を完全に把 握して全体管理する方法(従来の延長)方法
B
仕様把握を諦め,入出力測定により全体をモ デル化し,全体管理する(データ駆動型マネジメント)これらの方法は排他的なものではなく,互いに補完し 合うものである.マネジメントの全てが方法
B
のデー タ駆動型に置き換わるものではなく,方法A
の仕様を 完全に把握する従来の延長ではカバーしきれない場合 に対応するために方法B
のデータ駆動型マネジメント が必要となる.システムが個々の構成要素にディスアグリゲーショ ンされる状況においても,長い時間をかけて,方法
A
の個々の構成要素の仕様やメカニズムを完全に把握し て全体管理する従来の延長のマネジメントも可能であ る.しかしながら,ディスアグリゲーションすること は,構成要素間のインタフェースを標準化し,構成要 素の単位での更改を可能とすることを意味している.そして,構成要素単位の更改は従来のシステム全体の 更改よりも頻繁に行われることが期待される.ディス アグリゲーションされた構成要素ごとに入れ替わりが 頻繁に起きる場合には,仕様を完全に把握する前に,
新しいものに入れ替わることもある.この場合には データ駆動型のマネジメントを用いることで状況を改 善することが期待できる.
また,一般的に,システムの振る舞いを仕様書で完
図7 データ駆動型ネットワークマネジメント Fig. 7 Data-driven network management.
全に規定することは困難であると考えられており,仕 様の解釈間違いによりシステムのバグが生じうる.イ ンターネットの標準仕様を策定している
IETF
ではラ フコンセンサスとランニングコードの精神の元で標 準化が行われており,これはインターネットというグ ローバルなコンピュータネットワークが稼働している 大きな要因の一つと考えられている.仕様書で規定し きれていない部分を実装で補完する方法で,これも従 来のマネジメントの延長であると考えられる.その結 果,実装が固定化・寡占化されていき,新しい構成要 素に更改したり,新しい機能を追加することが困難と なってきたことが問題視されたこともある[91]
.ディ スアグリゲーションにより,新しい構成要素に更改し たり,新しい機能を追加することが容易になるが,シ ステムの仕様の不安定性は増すことになり,システム の仕様を把握する従来のマネジメントの延長だけでは 対応できない部分をデータ駆動型のマネジメントが補 完するのが有効であると考えられる.データ駆動型マネジメントにおいては,機械学習や 深層学習を用いたデータマイニングが重要な役割を果 たし
[92]
,測定データからネットワークシステムのモ デル化を行う(
図7)
.ここでは,データ駆動型マネジ メントに関するこれまでの研究について述べる.まず,機械学習と深層学習の急激な発展の背景について振り 返り,それらがネットワークマネジメントにどのよう に応用されているかについて,状態の可視化と異常の 検出,故障原因の特定,ネットワーク運用ポリシー,
資源割り当てを取り上げて振り返る.
4. 1
機械学習と深層学習機械学習や深層学習はデータにアルゴリズムを適