2. ストレージ DR システムとその問題点
2.1 従来のストレージ DR システム
2.1.4 システム運用管理
ストレージDRシステムの運用管理について説明する。ストレージDRシステムの運 用管理とは、システム使用者によるストレージDRシステムの管理手順を指す。ストレ ージDRシステムの運用管理には、システム構築、システム運用、障害からのシステム 回復の3つの段階がある。
[1] システム構築
はじめに、システム構築について説明する。ここで、システム構築とは、スト レージDRシステムを開始し、システム復旧が可能な状態にすることを指す。そ のために、ストレージDRシステムでは、主ストレージから遠隔ストレージにリ モートレプリケーションを構築する。ここで、リモートレプリケーションを構築 するとは、レプリケーション元ストレージとレプリケーション先ストレージとの 間でリモートレプリケーションの処理を開始することを指す。上記は、システム 使用者が主ホスト上の管理プログラムにより操作する。
例えば、REMDYのCLI操作による同期リモートレプリケーション構築の場合 は、システム使用者が管理プログラムに「MAKE 同期リモートレプリケーショ ン」を指示することで実現する。その後、システム使用者はリモートレプリケー ションが「定常レプリケーション」に移行することを確認する。REMDYのCLI 操作の場合「QUERY」であり、その結果が「定常レプリケーション」であるこ とを確認する。これにより、災害などによるシステム障害時もシステム復旧がで きることを担保する。
[2] システム運用
システム構築完了後、システム運用を行う。システム運用では、レプリケーショ
- 37 -
ンの処理状態の確認と、レプリケーション制御等がある。これらは、企業におけ る DRシステムの運用方針により異なる。ただし、一般的にシステム運用中にレ プリケーション制御を実施しないことが多い。これは、システム構築完了時点で、
主、遠隔ストレージ間でデータ2重化が完了しており、システム復旧が可能なた めである。システム運用中にレプリケーション制御を実施するのは、例えば、遠 隔ストレージのレプリケーション先ボリュームのある時点のデータを、さらに別 のボリュームに複製、保持することで、システム復旧の確度を高める場合などが ある。一方、レプリケーションの処理状態確認は定常的に実施される。これは、
一般的に管理プログラムのレプリケーション処理状態の監視機能を利用する。こ の管理プログラムの機能を利用すると、例えば、レプリケーション処理状態が障 害であることを検出すると、システム使用者にメールなどで通知することが出来 る。
[3] システム復旧
主拠点被災時、システム復旧を遠隔拠点から行う。システム復旧は主拠点で実 施していた処理の引き継ぎが目的である。そのために、図 11 に示すような、遠 隔ストレージ、遠隔ホストで、主拠点からの引き継ぎ処理を実施する。以下、引 き継ぎ処理を説明する。
遠隔ストレージの処理:
遠隔ストレージで実施中のリモートレプリケーションの引き継ぎ処理を実施 する。リモートレプリケーションの引き継ぎ処理とは、レプリケーション先 のボリュームを遠隔ストレージからアクセス可能にする処理である。具体的 には、レプリケーションの処理状態をレプリケーション未実施にする場合や、
- 38 -
レプリケーションの向きを変更する処理を実施する。レプリケーションの向 きの変更とは、システム復旧前はレプリケーション先のボリュームをレプリ ケーション元にする処理を指す。ただし、レプリケーションの向きの変更は レプリケーション先のボリュームをアクセス可能な状態にすることが重要で あり、遠隔ストレージから主ストレージにデータ複製が実施されなくてもよ い。
遠隔ストレージ上のデータは、同期リモートレプリケーションの場合、被災 直前の主ストレージと同一データ(RPOがゼロ)であり、非同期リモートレ プリケーションの場合、一般的に被災直前のデータよりも過去時点のデータ
(RPOがゼロ超)である。
遠隔ホストの処理:
遠隔ホストは遠隔ストレージに格納されたデータを用いて復旧処理を実施す る。一般的に、フェールオーバ処理とよばれる。
フェールオーバ処理には、IPネットワークの主拠点から遠隔拠点への引き継 ぎ(DNSの書き換え等)処理や、遠隔ホストの復旧処理がある。遠隔ホスト の復旧処理はOS や AP が持つ障害復旧機能(例えば、データベース管理シ ステムの場合、クラッシュリカバリ機能)を利用する。フェールオーバ処理 が完了すると、遠隔ホストは遠隔ストレージのデータを用いて AP を開始す る。
- 39 -
主拠点
主AP
遠隔拠点
主ホスト 計算機
主ストレージ 遠隔ストレージ
管理Prg 管理計算機
管理Prg 管理計算機
待機AP 遠隔ホスト 計算機
制御装置 バッファ バッファ 制御装置
レプリ構成
リモートレプリケーション
一時 停止
レプリケーション の向きを逆転
・ネットワーク移行
・遠隔ホストのAP活性
副2Vol 正2Vol
主Vol A 副1Vol
災害
図 11 引き継ぎ処理
以後、システム運用における期間、状態を以下のように定義する。
上記、レプリケーションの構築が完了しシステム運用中の状態を
「システム運用中」
上記、システム復旧処理の諸手続を「引き継ぎ処理」
- 40 -