LifeKeeper
る
Linux KVM
環境
HA
テ 構築 イ
2
©2012 SIOS Technology, Inc.
目次
1 本 ュ ン 目的 ... 3
2 仮想環境 おける テ 保護 ... 3
3 I/Oフ ン ン ... 4
4 Quorum / Witness Server方式 概要 ... 5
5 RHEV 概要 ... 7
6 構成方法 ... 8
6.1 構成 前提 ... 10
6.2 SCSI Reservation 無効化 ... 11
6.3 Virtual STONITH 設定 ... 11
6.4 Quorum / Witness Server Kit 設定 ... 13
6.5 障害発生時 動作 ... 15
7 お問い合わ ... 18
8 免責事項 ... 18
改版履歴
1
本
ュ ン
目的
本 ュ ン IBM Storwize V7000 ー 使用 Linux KVM 上 仮想 OS上 LifeKeeper for Linux HA 構築
扱う構成 日本IBM株式会社 ー株式会社(以下弊社) 協同 検証
実施 仮想環境 管理 RHEV 使用 い IBM Storwize
V7000 ー IO ン ン 機能 Quorum/Witness Server方式 採用
い LifeKeeper IBM Storwize V7000 共有 ー 利用 仮想
OS HA 構築 手法 い 各機能 解説 交え 説明
2
仮想環境 おける
テ
保護
仮想環境 い 保護 場合 仮想化 ー 提供 保護範囲 認識
うえ ー ー ョン 障害時 対応 考え 必要 あ
4
©2012 SIOS Technology, Inc.
3
I/O
フ ン ン
I/O ン ン 共有 ータ 対 入力 制限 設 特定 ー
可能 技術 総称
HA タ 複数 ー 物理的 同 ータ 参照 ー 同時
同 ータ 書 込 行 場合 ータ 不整合 生 ータ 破壊
ー 停止以上 重大 問題
う 状態 防 仕組 I/O ン ン あ LifeKeeper 以下 種類
KVM環境 I/O ン ン 適用 可否 以下 示
4
Quorum / Witness Server
方式 概要
本項 本検証 構成 適用 Quorum/Witness Server方式 い 説明
Quorum/Witness Server方式 ー 障害 検知 際 ー 先 多数決
決定 Quorum Check 第三者 ー 問い合わ 相手 ー 死活状態 再
確認 Witness Check機能 構成
機能 利用 LifeKeeper v7.3以降 追加 Quorum/Witness Server Kit
ー (steeleye-lkQWK) ン ー 必要 あ ー Recovery Kit 製品 同梱 い
Quorum Check
ー
い
Quorum Check ー 監視機能 TCP_remote方式 Majority 方式 2
ー 用意 い
TCP_remote方式
Quorum Host 指定 う 過半数 接続 う 自 ー 多数
6
©2012 SIOS Technology, Inc. Majority 方式
Witness Server 呼 役割 持 第三 ー タ 参加
多数決 実現
ー 選択 HA 構成 異 今回 検証
TCP_remote方式 検証 実施い
※TCP_remote方式 Majority 方式 詳細 い 下記 ュ ン 参照 い
Quorum/Witness
http://docs.us.sios.com/Linux/7.5/LK4L/TechDoc/Content/configuration/lifekeeper_io_fe ncing/quorum_witness.htm
STONITH
概要
STONITH "Shoot The Other Node In The Head" 略語 あ 他 ー 電源
強制的 遮断 動作 指 LifeKeeper い v7.3 STONITH ー
更 LifeKeeper v7.5 Virtual STONITH ー Virtual STONITH 仮想環境上 各 OS 対 電源 強制的 遮断 仕組 現
在 VMware vSphere 上 仮想 ン 標準的 ー KVM Kernel-based Virtual Machine 仮想環境 い 仕組 利用 電源操作
可能 機能 あ ー ー 切断障害発生時 ー い
ー 元 ー (仮想 ン) 電源 強制的 遮断 可能
上述 Quorum/Witness Server Kit 障害 ー 自発的 電源断 行い
ン 回避 ー ン 障害 ー 完全 応答
停止 場合 OS 自発的 電源断 期待 う 場合
い Virtual STONITH 利用 仮想 ー ー 物理 ー ー同様外部
強制的 電源 遮断 状態 機能 使用
ン 発生 可能性 排除
5
RHEV
概要
RHEV (Red Hat Enterprise Virtualization) 3.0 株式会社 提供
い Linux ー 組 込 ー ー KVM Kernel-based Virtual Machine ー 仮想化製品 本構成 RHEV-M(Red Hat Enterprise
Virtualization Manager ) 使用 各KVM OS 管理
RHEV 及 び RHEV-M 詳 細 い 下 記 URL 参 照 い
8
©2012 SIOS Technology, Inc.
6
構成方法
本構成 IBM Storwize V7000 ー 使用 Linux KVM 上 仮想 OS
上 LifeKeeper for Linux PostgreSQL ー HA 環境 構築い
本項 以下 う 2 ー 構成 Active/Standby タ 構築
KVM ー IBM System x3690 X5
KVM OS (KVM01,KVM02) Red Hat Enterprise Linux 6.2 (x86_64) KVM OS (LK01,LK02) Red Hat Enterprise Linux 6.2 (x86_64)
管理(RHEV) ー IBM System x3250 M4
管理(RHEV) OS (RHEV-M) Red Hat Enterprise Linux 6.2 (x86_64) RHEV Red Hat Enterprise Virtualization 3.0 LifeKeeper v7.5
共有 ー IBM Storwize V7000 Software V6.3.0 チ device-mapper multipath
各 ー IBM Storwize V7000 間 FC ー 以下 う 結線 い
チ 接続
各KVM OS IBM Storwize V7000 間 LAN ー 以下 う 結線
10
©2012 SIOS Technology, Inc.
環境 Quorum/Witness Server Kit びRHEV びKVM STONITH 設定 行い IBM Storwize V7000 共有 ー 用い タ 構成 稼動系
ー SIOS_Primary 待機系 ー 名 SIOS_Standby 以降説明 行い
上記 構成 Communication Path 使用 い ワー チ 1
い チ SPOF(単一障害点) い 実際 環境 Communication Path用 独立 経路 用意 い
6.1
構成 前提
各 ー (各仮想OS) Red Hat Enterprise Linux 6.2 ン ー い
各 ー (各仮想OS) LifeKeeper v7.5 びDMMP ARK ン ー い
各 ー (各仮想OS) Quorum/Witness Server Kit ン ー い
各 ー (各仮想OS) iSCSI接続 IBM Storwize V7000上 LU
可能 状態 あ
REHV-M 各 ー (各仮想OS) 登録 管理 可能
6.2
SCSI Reservation
無効化
各 ー LifeKeeper設定 /etc/default/LifeKeeper 以下 ータ 追記 SCSI Reservation ー 制御 無効
RESERVATIONS=none
変更 有効 LifeKeeper 再起動 い
# /opt/LifeKeeper/bin/lkstop # /opt/LifeKeeper/bin/lkstart
6.3
Virtual STONITH
設定
(1) OS RHEV-M 接続 証明書 取得
ン 実行例
# curl -O rhevm.cer http://[rhevm-server]:8080/ca.crt
※RHEV-M 証明書 取得方法 い 以下 参照 い
http://docs.redhat.com/docs/ja-JP/Red_Hat_Enterprise_Virtualization/ 3.0/html/REST_API_Guide/chap-REST_API_Guide-Authentication.html
(2) RHEV-M 接続 仮想 ン 一覧 構成 各仮想 ンID 取得
ン 実行例
#curl -X GET -H "Accept: application/xml" -u [USER:PASS] --cacert [CERT] https://[RHEVM Host]:8443/api/vms
※仮想 ン一覧表示 い 以下 参照 い
12
©2012 SIOS Technology, Inc.
(3) RHEV-M REST API 利用 ン 互い ー 電源断 行え
確認
ン 実行例
#curl -X POST –H "Accept:application/xml" –H¥
"Content-type:application/xml" -u [USER:PASS]ad—cacert[CERT]¥ -d "<action/>" https://[RHEVM Host]:8443/api/vms/[仮想 ンID]/stop
(4) stonith-install 実行 LifeKeeper 各 ー 対 STONITH 実
行 仕組 ン ー
# /opt/LifeKeeper/samples/STONITH/stonith-install
(5) stonith.conf 各 ー 電源断 実行 STONITH ン 記述 各
ー ー 処理 実施 前 記述 STONITH ン
実行 フ イ ー 元 ー 名 そ ー 対し 実行 るSTONITH
ン ー 区切 記述
今回 例 SIOS_Primary stonith.conf SIOS_Standby 電源断 実行
ン SIOS_Standby stonith.conf SIOS_Primary 電源断 実行
ン 記述
# vi /opt/LifeKeeper/config/stonith.conf
記述例
(SIOS_Primary stonith.conf)
SIOS_Standby curl -X POST -H "Accept: application/xml" -H
"Content-type:application/xml" -u admin@internal:password --cacert /root/rhevm.cer -d "<action/>"
https://rhevm.iscoc.ibm.com:8443/api/vms/a444ba12-5001-4081-b9d2-ab 175044ebf0/stop
(SIOS_Standby stonith.conf)
SIOS_Primary curl -X POST -H "Accept: application/xml" -H
"Content-type:application/xml" -u admin@internal:password --cacert /root/rhevm.cer -d "<action/>"
https://rhevm.iscoc.ibm.com:8443/api/vms/feb91595-6af7-4bd5-b8dc-7c3 8141cd956/stop
※電源断 替わ 再起動 う ン 記述 再起動後 ー ー 通信 復旧 い い場合 再起動 ー STONITH 発動 い ン ン
6.4
Quorum / Witness Server Kit
設定
KVM
OS
2
ー 構成を維持し
TCP_Remote
ー を
設定 る
以下 う ワー 構成 RHEV-M Quorum Host 指定
構成 ン ュニ ー ョン 使う経路 Quorum Host 経路
14
©2012 SIOS Technology, Inc.
ュ
ー ョン
作成
各 ー 間 ュニ ー ョン 作成 ュニ ー ョン 少
一 Quorum Host ワー 経路 重 う考慮
SIOS_Primary SIOS_Standby 間 172.16.70.0 172.16.71.0 ワー
利用 ュニ ー ョン 作成 (172.16.71.0 Quorum Host 共
通 経路 )
ータ 設定
/etc/default/LifeKeeper 編集 ータ 以下 う 設定 原則的
設定 全 ー 共通 い
# vi /etc/default/LifeKeeper
QUORUM_MODE=tcp_remote # Quorum Check ー
WITNESS_MODE=none # Witness Check 行わ い
QUORUM_HOSTS=rhev.com:80 # 問合 先 : ー
QUORUM_TIMEOUT_SECS=20 # 問合 タ
QUORUM_LOSS_ACTION=fastkill # 少数派 ー 電源断動作
ソー
作成
(1)
ファイ
テ
ソー
作成
A)
ファイ
テ
ン
稼働系 ー あ SIOS_Primary ー IBM Storwize V7000 共有 ータ領域 PostgreSQL ータ領域 使用 作成 任意
ン
# fdisk /dev/mapper/mpath1
B)
ファイ
テ
ソー
作成
LifeKeeper GUI管理画面 起動
# /opt/LifeKeeper/bin/lkGUIapp > /dev/null 2>&1 &
後 管理 手順 従 ン 領域 ソー
保護 管理 以下 ン 参照
Creating a File System Resource Hierarchy - SIOS Technology Corp Wiki
(2) PostgreSQL
ソー
作成
両 ー ソー 共有領域 PostgreSQL ータ領域
設定 PostgreSQL ソー 作成 下 い PostgreSQL ソー 作成
方法 詳細 下記 PostgreSQL 管理者 参照下 い
PostgreSQL Recovery Kit v7.4管理
http://jpdocs.us.sios.com/LK4L/Previous/content/resources/pdfs/lkpgsql 74_jp.pdf
※IPリソース 各リソースが必要 場合 必要 応 作成 下さい
6.5
障害発生時 動作
(1)
ー ビー 通信途絶時 動作
A) SIOS_Primary
ッ ワー 機能 異常停止し 場合
ー ー 通信 途絶 チュ ー ョン い 考え
SIOS_Primary ー 障害 発生 ワー 機能 問題 生 場合 想定
SIOS_Primary Quorum Host あ RHEV-M 接続 試行
ワー 機能 障害 発生 通信 行え 自 ー 少数派 あ 判断 自発的 電源断 行い
SIOS_Standby 172.16.71.0 ワー 経由 Quorum Host あ RHEV-M 接続 可能 自 ー 多数派 あ 判断 ー
起動 行い
16
©2012 SIOS Technology, Inc.
B)
ュ
ー ョン
ッ ワー
障害発生し 場合
172.16.70.0 172.16.71.0 ワー 障害 発生 ー ー 通信
途絶 ー
SIOS_Primary SIOS_Standby Quorum Host あ RHEV-M
接続 行え 両 ー 少数派 ソー 稼働 い
SIOS_Primary 自 発 的 電 源 断 行 い ソ ー 稼 働 い い SIOS_Standby ソー 起動 行い
SIOS_Primary 電源断 SIOS_Standby ソー 起動し い
(2) Virtual STONITH
る電源断 必要
る チュ ー ョン
A) SIOS_Primary 完全 応答停止状態 場合
SIOS_Primary OS 完全 応答停止 ー 場合 Quorum Check SIOS_Primary 自発的 電源断 期待
SIOS_Standby Quorum Check 結果多数派 ー 処理 開始
ー 処理 開始前 Virtual STONITH 発動 SIOS_Primary
電源 強制的 遮断 ン 発生
ソー ー 実施
SIOS_Primary 電源断 SIOS_Standby ソー 起動
B) ー ビー 断 も関わ 両 ー Quorum Host 通信 る場合
今回 構成 う 事象 発生 ー ー 通信 途絶時 両 ー
Quorum Host 通信可能 状態 あ 両 ー 多数派 ソー 起
動処理 開始 い
う 場合 先 ー ー 途絶 検知 ー 処理 開始 ー Virtual STONITH 発動 相手 ー 電源 遮断
ン 回避
SIOS_Primary ソー 起動し 場合 SIOS_Standby 電源断
(3)
ソー 障害発生時 動作
A)SIOS_Primary PostgreSQL ソー 障害発生時 場合
SIOS_Primary PostgreSQL ソー 処理 失敗 場合 PostgreSQL
ソー SIOS_Standby ー ー 開始
SIOS_Primary PostgreSQL ソー 停止 SIOS_Standby PostgreSQL ソー 起動
18
©2012 SIOS Technology, Inc.
7
お問い合わ
本
ュ ン
記載内容
い
問い合わ 先
LifeKeeper
製品 導入を検討中 お客様
LifeKeeper
製品を 購入済
お客様
8
免責事項
本書 記載 情報 予告 変更 削除 場合 あ 最新 確認
い
本書 記載 情報 全 慎重 作成 記載 い 本書
妥当性や正確性 い い 種類 保証 あ
本書 含 誤 起因 本書 利用者 生 損害 い
ー株式会社 一切 責任 負う あ
第三者 本書 記載事項 変更 削除 ー ー 及び本書等 対 不正
他第三者 行為 本書 利用者 生 一切 損害 い
ー株式会社 一切 責任 負う あ
弊社 ー ー営業部 お問い合わ く い
TEL:03-6860-5111 (受付時間 9:00~17:00 土日祝祭日 び弊社休業日 除
お問い合わ ー フ ー
https://www.sios.com/products/bcp/lkdk/contact/
弊社LifeKeeper製品サ ー 窓口 お問い合わ く い
購入後 お問い合わ
障害 原因 ー ー 問い合 届 延着
場合 あ あ 了承 い 問い合 不着及び延着 関
ー株式会社 一切 責任 負う あ
著作権
本書 記載 い ン ン 情報・資料・画像等種類 問わ 関 知的財産権
ー株式会社 帰属 全部 一部 問わ ー
株式会社 許可 本書 複製 転用 転載 引用 公衆 送信 販売 翻案 他 二次利
用 い 禁止 ン ン 改変 削除 い 一切認
本書 製品名 他社 保有 商標 登録商標 使用 い
ー株式会社
〒105-0001 東京都港区虎 門4-1-28 虎 門タワー
電話:03-6860-5105 FAX:03-6860-5133