第4章 保守
4.4 メッセージ
4.4.5 業務サーバ ( コンピュートノード ) のフェイルオーバでエラーが発生した場合のメッセージ 【 HA 構成】
ここでは、業務サーバ(コンピュートノード)のフェイルオーバでエラーが発生した場合に出力されるエラーメッセージについて説明しま す。
FJSVpf4c:WARNING 41901: 業務サーバ(コンピュートノード)名 is down 意味
業務サーバ(コンピュートノード)に異常が発生しました。
対処
evacuated_list.logを確認し、移動したインスタンスを確認してください。
evacuated_list.logの詳細は、「ログの格納場所」を参照してください。
FJSVpf4c:ERROR:61904: Cannot be acquired 意味
業務サーバ(コンピュートノード)の情報を取得できませんでした。
対処
本メッセージと調査資料を採取し、当社技術員に連絡してください。
FJSVpf4c:ERROR:61905: nova evacuate returns エラー出力 意味
nova evacuateコマンドに失敗しました。
対処
本メッセージと調査資料を採取し、当社技術員に連絡してください。
FJSVpf4c:ERROR:61906: インスタンスuuid evacuate skipped because instance status does not fulfill the conditions (vm_state = インスタンスのvm_state task_state = インスタンスのtask_state)
意味
nova evacuateコマンドの実行条件を満たしていないインスタンスのため、移動できません。
対処
evacuated_list.logに従い、手動でインスタンスを移動してください。
evacuated_list.logの詳細は、「ログの格納場所」を参照してください。
インスタンスを手動で移動する方法
インスタンスを手動で移動する方法は、以下のとおりです。
1.
代表ノードにroot権限でログインします。2.
evacuated_list.logを確認して、異常が発生した業務サーバ(コンピュートノード)上のインスタンスの移動情報を確認します。"Failure"と記載されているすべてのインスタンスIDと、移行先のノード名を確認してください。
20160622-21:06:04 Success fb0f811d-e9cd-496e-933e-9a3f7229e0ce compute2 compute4 20160622-21:06:05 Success e341a3c3-730b-4736-974b-7e00c57b3f27 compute2 compute4 20160622-21:06:07 Failure 37c922fe-4902-47ae-829e-8817aff3911d compute2 compute4
3.
管理サーバ(コントローラーVM2)にroot権限でログインします。4.
手順2.で確認したインスタンスの状態を確認します。以下のコマンドを実行します。
コマンド実行結果の赤文字、かつ下線部がインスタンスの状態を示しています。
# . /root/openrc <RETURN>
# nova show インスタンスID | grep vm_state <RETURN>
| OS-EXT-STS:vm_state | resized |
5.
インスタンスの状態が"active"、または"shut off"以外の場合、以下のコマンドを実行します。# nova reset-state --active インスタンスID <RETURN>
6.
移行先ノードの状態を確認します。以下のコマンドを実行します。
コマンド実行結果の赤文字、かつ下線部が移行先ノードの状態を示しています。
# nova service-list | grep 移行先ノード名 <RETURN>
| 6 | nova-compute | compute4 | az1 | enabled | 移行先ノードの状態 | 2016-07-15T10:21:56.000000 | - |
移行先ノードの状態が"up"の場合 インスタンスを移行できます。
移行先ノードの状態が"up"以外の場合
a.
移行先の業務サーバ(コンピュートノード)にroot権限でログインします。b.
サービスの状態を確認します。以下のコマンドを実行します。
コマンド実行結果の赤文字、かつ下線部がサービスの状態を示しています。
# openstack-service status nova-compute <RETURN>
MainPID=32088 Id=openstack-nova-compute.service ActiveState=inactive
c.
サービスの状態が"active"以外の場合は、nova-computeサービスを起動します。# openstack-service start nova-compute <RETURN>
d.
再度、サービスの状態を確認します。以下のコマンドを実行します。
コマンドの実行結果の赤文字、かつ下線部がサービスの状態を示しています。
# openstack-service status nova-compute <RETURN>
MainPID=32088 Id=openstack-nova-compute.service ActiveState=active
サービスの状態が"active"以外の状態の場合、当社技術員まで連絡してください。
e.
管理サーバ(コントローラーVM2)にroot権限でログインします。f.
移行先ノードの状態が"up"になっていることを確認します。以下のコマンドを実行します。
コマンドの実行結果の赤文字、かつ下線部が移行先ノードの状態を示しています。
移行先ノードの状態が"up"の場合、インスタンスを移行できます。
# . /root/openrc <RETURN>
# nova service-list | grep 移行先ノード名 <RETURN>
| 6 | nova-compute | compute4 | az1 | enabled | up | 2016-07-15T10:21:56.000000 | - |
7.
移行元ノードの状態を確認します。以下のコマンドを実行します。
コマンド実行結果の赤文字、かつ下線部が移行元ノードの状態を示しています。
# nova service-list | grep 移行元ノード名 <RETURN>
| 6 | nova-compute | compute2 | az1 | enabled | 移行元ノードの状態 | 2016-07-15T10:21:56.000000 | 移行元ノードの状態が"down"の場合
インスタンスを移動します。以下のコマンドを実行します。
# nova evacuate インスタンスID 移行先ノード名 <RETURN>
移行元ノードの状態が"up"の場合
インスタンスを移動します。以下のコマンドを実行します。
# nova live-migration インスタンスID 移行先ノード名 <RETURN>
8.
インスタンスが移動したことを確認します。以下のコマンドを実行します。
インスタンスの状態が"active"であることを確認します。
コマンドの実行結果の赤文字、かつ下線部がインスタンスの状態を示しています。
# nova show インスタンスID | grep vm_state <RETURN>
| OS-EXT-STS:vm_state | active | インスタンスの状態が"error"の場合は、当社技術員に連絡してください。
FJSVpf4c:ERROR:61907: インスタンスuuid evacuate incompleted 意味
移動先稼動ノードでインスタンスの起動に失敗しました。
対処
本メッセージと調査資料を採取し、当社技術員に連絡してください。
FJSVpf4c:ERROR:61908: インスタンスuuid post-evacuate timed out 意味
移動先稼動ノードで一定時間インスタンスの起動が完了しませんでした。
対処
インスタンスの状態を確認してください。
インスタンスの状態が"active"、または"stopped"の場合 問題ありません。
上記以外の場合
本メッセージと調査資料を採取し、当社技術員に連絡してください。
FJSVpf4c:ERROR:61909: nova service-disable returns 返り値. detail=エラー出力 意味
nova のサービスを"disabled"にできませんでした。
対処
本メッセージと調査資料を採取し、当社技術員に連絡してください。
FJSVpf4c:ERROR:61910: nova service-enable returns 返り値. detail=エラー出力 意味
novaのサービスを"enabled"にできませんでした。
対処
本メッセージと調査資料を採取し、当社技術員に連絡してください。
FJSVpf4c:ERROR:61911: Failed to get an instance list of compute nodes 意味
インスタンスの情報を取得できませんでした。
対処
本メッセージと調査資料を採取し、当社技術員に連絡してください。
FJSVpf4c:ERROR:61912: One or more instances exist on spare node 意味
待機ノードでインスタンスが起動しています。
対処
以下の手順を参照して手動でインスタンスを移動してください。
1.
管理サーバ(コントローラーVM2)にroot権限でログインします。2.
待機ノードのホスト名を確認します。以下のコマンドを実行します。
コマンド実行結果の赤文字、かつ下線部が該当のホスト名を示しています。
# . /root/openrc <RETURN>
# nova service-list | grep "rcx_ha_spare" <RETURN>
| 6 | nova-compute | 待機ノードのホスト名 | az1 | disabled | up | 2016-07-21T06:57:39.000000
| rcx_ha_spare |
3.
待機ノード上のインスタンスのIDを確認します。以下のコマンドを実行します。
コマンド実行結果の赤文字、かつ下線部がインスタンスのIDを示しています。
# nova list --field "host" | grep 待機ノードのホスト名 <RETURN>
+---+---+
| ID | Host | +---+---+
| 8d69d0cf-4109-4fe5-81b7-3682d9648035 | 待機ノードのホスト名 | +---+---+
4.
インスタンスの状態を確認します。以下のコマンドを実行します。
コマンドの実行結果の赤文字、かつ下線部がインスタンスの状態を示しています。
# nova show インスタンスID | grep vm_state <RETURN>
| OS-EXT-STS:vm_state | active |
5.
インスタンスを移行します。手順4.で確認したインスタンスの状態が"active"の場合
a.
移行可能な稼動ノードを確認します。以下のコマンドを実行します。
コマンドの実行結果の赤文字、かつ下線部が移行可能な稼動ノードの状態を示しています。
稼動ノードの状態が"enabled"の場合に移行できます。
# nova service-list | grep compute <RETURN>
| 6 | nova-compute | compute1 | az1 | enabled | up | 2016-07-15T10:21:56.000000 | - |
| 7 | nova-compute | compute2 | az1 | enabled | up | 2016-07-15T10:21:57.000000 | - |
| 8 | nova-compute | compute3 | az1 | enabled | up | 2016-07-15T10:21:58.000000 | -
|
b.
インスタンスを移行します。以下のコマンドを実行します。
# nova live-migration インスタンスID 移行先稼動ノード名 <RETURN>
手順4.で確認したインスタンスの状態が"stopped"の場合
a.
インスタンスを移行します。以下のコマンドを実行します。
# nova migrate インスタンスID <RETURN>
# nova resize-confirm インスタンスID <RETURN>
6.
インスタンスが移行したことを確認します。以下のコマンドを実行します。
インスタンスの状態が移行前のインスタンスの状態と同一であることを確認してください。
コマンドの実行結果の赤文字、かつ下線部がインスタンスの状態を示しています。
# nova show インスタンスID | grep vm_state <RETURN>
| OS-EXT-STS:vm_state | active |
インスタンスの状態が以下のどちらか以外の場合、当社技術員に連絡してください。
-
"active"-
"shut off"FJSVpf4c:ERROR:61913: Failed to get compute nodes state 意味
業務サーバ(コンピュートノード)の情報が不明です。情報を取得できませんでした。
対処
本メッセージと調査資料を採取し、当社技術員に連絡してください。