この章では、データレプリケーション機能を利用した運用において、何らかの障害が発生したときの障害検知 や、障害からの復旧などの手順について説明します。
3 3 3 . . . 1 1 1 障 障 障 害 害発 害 発 発 生 生 生 時 時 時 の の処 の 処 処 置 置 置
3 3 3 . .1 . 1 1 . .1 . 1 1 障 障 障 害 害 害 の の の 種 種 種 類 類 類
データレプリケーションには、以下のような障害があります。
(1) レプリケーション固有のHW障害 (2) iSMサーバ、クライアントの障害 (3) ControlCommandの異常終了 (4) プロダクト不正
3 3 3 . . . 1 1 1 . . . 2 2 2 レ レプ レ プ プ リ リ リ ケ ケー ケ ー ー シ シ シ ョ ョ ョ ン ン ン 固 固 固 有 有 有 の の の H H H W W W 障 障 障 害 害 害
HWによって実現されているデータレプリケーション機能には、通常のHW障害に加えて次のよ うな障害が発生します。これらはiSMのクライアント画面から確認できます。また、これらの障害 が発生した場合、ControlCommandのコマンドは異常終了することがあります。
(1) コピー障害
z
コピー障害の検出
運用ボリューム(以下、MV)と複製ボリューム(以下、RV)の間の接続障害によりMVとRV間の コピー動作が正常に行われない場合、障害が発生したタイミングや障害内容により以下の状態 に遷移することがあります。
・障害によるセパレート状態(障害分離)
・障害によるサスペンド状態(異常サスペンド)
上記の状態に遷移した場合、レプリケーション管理の画面によりコピー障害の状況を確認でき ます(図 3-1)。
図 3-1 コピー障害発生画面例
z
コピー障害修復後の操作
コピー障害の原因を除去したあと、コピー障害が発生したペアの状態を正常に戻すための操作 については、「iStorageソフトウェア データレプリケーション利用の手引 機能編」のコピ ー障害リストの表示に関する説明を参照してください。
(2) リンク障害
z
リンク障害の検出
ディスクアレイ間のケーブル異常もしくはレプリケーションディレクタ異常の場合に発生しま す。
レプリケーション中であれば、コピー障害の要因にもなります。
リンク障害の発生は、レプリケーション管理の画面で確認できます。
図 3-2 リンク障害発生画面例
z
リンク障害修復後の操作
リンク障害の原因を除去した後、本画面にてパスの状態が正常であることを確認してください。
本障害に起因してコピー障害が発生していた場合、「iStorageソフトウェア データレプリケ ーション利用の手引 機能編」のコピー障害リストの表示に関する説明を参照してください。
3 3 3 . . . 1 1 1 . . . 3 3 3 i iS i S S M M M サ サ サ ー ー ー バ バ バ 、 、 、 ク ク ク ラ ラ ラ イ イ イ ア ア ア ン ン ン ト ト ト の の の 障 障 障 害 害 害
(1) 通信障害
iSMサーバとiSMクライアント間の通信に失敗した場合、次のようなメッセージを出力してレプリ ケーション管理を終了します。
ご利用のプラットフォームに合わせて「iStorageソフトウェア iStorageManager利用の手引(UNIX 版)」、または「iStorageソフトウェア iStorageManager利用の手引(Windows版)」を参照し て、処理を行ってください。
図 3-3 通信障害メッセージ画面
3 3 3 . . . 1 1 1 . . . 4 4 4 C C C o o o n n n t t t r r r o o o l l l C C C o o o m m m m m m a a a n n n d d d の の の 異 異 異 常 常 常 終 終了 終 了 了
ControlCommandでは、障害発生時に標準出力/標準エラー出力/syslog/コマンドトレース/
運用トレースに障害の内容やメッセージを出力します。
標準出力/標準エラー出力/syslog/コマンドトレースには「iStorageManager メッセージハン ドブック」に記述してあるメッセージが出力されます。メッセージに従って適切な処置を行ってくだ さい。
コマンドトレースは、/opt/iSMrpl/etc/ 直下に"iSM_Log"で始まるファイル名で出力されます。テ キストエディタ等を使用して内容を確認してください。
運用トレースは、標準出力/標準エラー出力/syslog/コマンドトレースに出力されたメッセージ と、詳細な内部情報が記録されるファイルです。障害が発生し、弊社に対して調査を依頼される場合 には、運用トレースを採取していただく必要があります。障害発生時の情報採取については、本書の
「第II編 3.1.6 原因不明な障害発生時の情報採取」を参照してください。
3 3 3 . . . 1 1 1 . . . 5 5 5 プ プロ プ ロ ロ ダ ダ ダ ク クト ク ト ト 不 不 不 正 正 正
レプリケーションに関するプロダクト(本書の「第I編 4.4.4 プロダクトのライセンス登録」参 照)が購入されていない場合や、ディスクアレイの総物理容量と適合しない場合などは、レプリケー ション機能が正しく機能しません。
プロダクトが正しく購入されていない場合、レプリケーション管理画面(ツリー画面)上のアイ コンが変化し、プロダクトの不足、未購入を表します。
プロダクトの購入状況については、状態監視画面よりディスクアレイのプロパティを参照してく ださい。
3 3 3 . .1 . 1 1 . .6 . 6 6 原 原 原 因 因 因 不 不 不 明 明 明 な な な 障 障 障 害 害 害 発 発 発 生 生 生 時 時 時 の の の 情 情 情 報 報 報 採 採取 採 取 取
原因が明らかでない障害が発生し、弊社に対して調査を依頼される場合、障害解析に必要となる 情報を採取していただく必要があります。
z
レプリケーション管理の障害発生時
「iStorageソフトウェア iStorageManager利用の手引(UNIX版)」、または「iStorageソ フトウェア iStorageManager利用の手引(Windows版)」を参照し、情報採取を行ってくだ さい。
z ControlCommand
の障害発生時
以下の手順でコマンドを実行し、運用トレースなどの障害情報をまとめて採取してください。
なお、障害情報を格納するディスクには、目安として 4MB 程度以上の空き容量が必要になり ます。ただし、障害情報のファイルサイズはシステムの状態により異なり、古いsyslogファイ ルが残っている場合などは 4MB 以上になることがあるので、あらかじめ十分な空き容量を確 保しておくことを推奨します。
(1) rootでログインします。
(2) iSMvolgatherコマンドを実行します。
# iSMvolgather [ディレクトリ名]
※ ディレクトリ名は絶対パス名で指定してください。
ディレクトリ名を指定しない場合、/opt/iSMvol/ディレクトリの配下に、また、ディレクト リ名を指定した場合、指定ディレクトリ配下に、iSMvolgatherディレクトリを作成されま す。
(3) (2)のディレクトリ配下にiSMvolgather.tar.Zファイルが作成されていることを確認し、当
該ファイルを取得してください。
z
障害箇所が特定できない場合
「iStorage ソフトウェア NV シリーズ 保守マニュアル」の障害時情報採取に関する説明を
参照し、必要な情報を採取してください。