DB2 クラスター 機能検証報告書
【 2 . TSA & UDB 連携構成編】
お断り
本資料の作成において、記載した内容に関しては正式な IBM のテストを受けていません。 こちらの情報を参考とした作業に実施に関しては、使用者の責任において行われるべきものであり、 それらの評価に関しては使用者の判断に依存しています。 本資料で報告されたパフォーマンスデータ等に関しては、ある特定の状態において正確である情 報であり、他環境にて同様の結果が得られる保証はありません。 当ドキュメントは参考資料として利用し、運用を計画、実施される場合には必ず製品のマニュアル をご覧になってください。また、本番使用に際しましては充分な動作テストを行っていただくようお願 いいたします。 資料の内容には正確を期するよう注意しておりますが、この資料の内容は2004年12月現在の 情報であり、製品の新しいリリース、PTFなどによって動作、仕様が変わる可能性があるので ご注意下さい目次
検証概要と検証結果サマリー
検証対象システム
検証対象クラスター デザイン概要 (1)
シナリオ1.TSA + DB2 連携クラスター
• OS としては Active-Active 構成を取る。DB2のプロセスは、 Active Node のみで起動する Active-Stanby 構成となる。
• インスタンスは共用ディスク上に作成する
• インスタンスへの R/W マウントは、1時点で1ノードのみが行う。この排他制御は TSA が行う。
– Tie-Breaker と呼ばれるノード間共有ディスクへ 占有 reserveできたノードのみがディスクへアクセス可能
• 外部からの透過的アクセスの為、 TSA が提供する高可用性IPアドレス (HA IP Address) を用いる。
– HA IP Address は 常に Active Node 側の IP address とのエイリアスが定義される。
• TSA は以下を監視し、障害を感知した場合は障害に応じて自ノードあるいは待機ノードでの自動回
復を試みる。
– サービス側ネットワークインターフェースの稼動状態
– 共用ディスクのマウント状態
検証対象クラスター デザイン概要 (2)
TSA + DB2 連携クラスター 概念図
Active
Stand-by
r/w mount
db2 instance
HA IP address IP address IP addressaliased
db2
processes
Active
Stand-by
r/w mount
db2 instance
HA IP address IP address IP addressaliased
db2
processes
・ 通常時
・ 障害発生時
検証結果サマリー
本検証結果をサマライズすると以下のようになる。(詳細については「検証項目と検証結果詳細」 項を参照のこと)
¾
Linux on zSeries (Under z/VM) 環境における TSA の導入、構成に関して問
題は発見されなかった。
¾
DB2 UDB V8.2 に同梱される TSA 用サンプルポリシーを利用し、 DB2 UDB ク
ラスター が適正に構築可能であることを確認した。
¾
上記構成の元、ディスク障害を除く各種障害に対して適正に自動検知、自動修復
を行うことを確認した。これらの構成に関して問題は発見されなかった。
¾
サンプルポリシーにより提供されるスクリプトを利用した場合、
ディスク障害に対し
て検知不可能であることが発見された。
各環境に併せてディスク障害を検知する
仕組みを別途導入する必要がある。
• 理由については別項の参考資料を参照のこと検証対象システム (1)
Linux on zSeries 稼働環境構成
¾ IBM eServer z900 (2064-116)
¾ z/VM V4R4 (Service level 0301) 64bit mode
Linux 構成
¾ SUSE Linux Enterprise Server 8.0 ServicePack 3 (31bit)
• kernel 2.4.21-83 • gcc version 3.2.2
ディスク構成
¾ 3390-3 型 DASD (ESS) • FICON 接続
ネットワーク構成
¾ OSA-Express • 両ノード間で 同一 OSA ポートをシェア ¾ Guest LAN検証対象システム (2)
データベースソフトウェア
¾ DB2 Universal Database Enterprise Server Edition V8.2
クラスターソフトウェア
検証対象システム (3)
検証システム構成図 (ネットワーク )
Guest LAN 10.0.0.0/24
192.168.0.2192.168.0.0/24
network診断用 192.168.0.254z/VM
hsi0 eth0 192.168.0.1 VM USER NAME : LXUSER1 hostname : zlinux1 hostname : zlinux1 VM USER NAME : LXUSER2 hostname : zlinux2 hostname : zlinux2 10.0.0.1 hsi0 eth0 10.0.0.2Cluster
各 Linux は、 Guest LAN, OSA 双方とのインターフェイスを持つ
OSA
OSA
192.168.0.3
検証対象システム (4)
検証システム構成図 (リソース )
その他LPAR z/VM V4.4 検証テスト用 LPARCP
LXUSER2 paging spacestorage
virtual storageCPU
・ z900 General CPU (非IFL)
・ 検証用 LPAR にて 1CP 占有所有 ・ 各仮想計算機にて 論理1CPずつ定義
Memory
・ 検証用 LPAR にて 2048MByte アサイン ・ Central Storage (CS) として 1408 MByte ・ Extended Storage (ES) として 640 MByte ・ 各仮想計算機に 768MByte 定義 virtual CP
zlinux2
dedicated 768M 1408M 1408M 640M 600M virtual CP LXUSER1 virtual storagezlinux1
768M検証対象システム (5)
検証システム構成図 (ストレージ構成とデータベース構成)
¾ {ストレージ配置}
• インスタンスを配置する共用データ領域は 3390 型 DASD 5つから構成される LV 12GB とする • TieBreaker として クラスタに FullPack Minidisk を1つアサインする
• ファイルシステムとして 全パーティションに ext3 を採用 ¾ {データベース内容} • OLTP ベンチマーク・ツール を用いて 10GByte のテーブルスペースを作成 http://www-6.ibm.com/jp/domino01/mkt/dminfo.nsf/doc/001A9ABB • 変更を行ったパラメータは以下のようになる DBHEAP = 1200 LOGBUFSZ = 16 BUFFPAGE = 25000
検証対象システム (6)
検証システム構成図 (ストレージ構成とデータベース構成)
/ / etcetc root root tmp tmp mnt mnt opt opt ・・・ db2 db2 / / etc etc root root tmp tmp mnt mnt opt opt ・・・ db2 db2 home_db2home_db2 home_db2home_db2
db2inst1 db2inst1 db2fenc db2fenc
Active
Stand-by
mount
dasda2 dasda2 dasdb1 dasdb1 /dev/vg0/lv0 zlinux1 zlinux1 can't mountinstance over shared dasd
zlinux2 zlinux2 var var db2 db2 var var db2
LV (12G)
検証対象システム (7)
検証システム構成 (TSA ポリシー定義)
¾ DB2 UDB V8.2 に同梱されるサンプルポリシーを利用 • /opt/IBM/db2/V8.1/ha/salinux/ に配置される ¾ 以下の資源が作成される • db2 プロセス管理用資源 • 共用ディスク管理用資源 • サービスIPアドレス管理用資源 • 詳細については、「別項 参考1 : TSA & DB2 連携クラスターの動き 」 を参照のこと検証項目
shutdown -h now Linux ノード S/W 障害 Linux 停止 5 z/VM から #CPU ALL STOP Linux ノード リソース不足 カーネルパニック Linux ハングアップ 6 z/VM から DASD のデタッチ マウント資源 H/W 障害 ディスクのマウント障害 3 インターフェース ダウン IP資源 H/W 障害 OSA 障害 4 z/VM 仮想計算機 からのログオフ Linux ノード z/VM 障害 リソース不足 z/VM 仮想計算機停止 7 db2sysc の停止 DB2アプリケーション資源 DB2プロセスダウン DB2プロセス障害 2 TSA の 切り替えコマンド発行 (rgreq -o move) Linux ノード N/A 計画切り替え 1 検証方法 影響を受ける資源 想定される原因 資源と障害内容 番号検証結果
○ (テイクオーバー発生) shutdown -h now Linux 停止 5 z/VM 仮想計算機 z/VM から #CPU ALL STOPインターフェース ダウン z/VM から DASD のデタッチ db2sysc の停止 TSA の 切り替えコマンド発行 検証方法 ○ (テイクオーバー発生) Linux ハングアップ 6 × (障害を検知できない) ディスクのマウント障害 3 ○ (テイクオーバー発生) OSA 障害 4 ○ z/VM ○ (自ノード復帰) DB2プロセス障害 2 ○ (テイクオーバー発生) 計画切り替え 1 リカバリー結果 資源と障害内容 番号