MIRACLE LINUXで構築する高信頼性
MIRACLE LINUXで構築する高信頼性
データベース ソリューション
―「Oracle Real Application Clusters & CLUSTERPRO」のご紹介―
2007年 5月25日
2007年 5月25日
ミラクル・リナックス株式会社
カスタマ サ ビス部 鈴木庸陛
カスタマーサービス部 鈴木庸陛
Agenda
¾ MIRACLE CLUSTERPROの概要
¾ MIRACLE CLUSTERPROの概要
¾ Real Application Clusters と CLUSTERPRO
¾ MIRACLE CLUSTERPRO SSSソリ
シ ン
¾ MIRACLE CLUSTERPRO SSSソリューション
概要
MIRACLE CLUSTERPROの概要
MIRACLE CLUSTERPRO
¾ CLUSTERPRO for Linux Ver3.1(x86-64)
¾NECのLinux HAクラスタ・ソフト
¾ MIRACLE LINUX V3.0/V4.0 (x86-64)
¾Oracle DBとの親和性の高いLinux OS
MIRACLE CLUSTERPRO - Asianux Inside
ク
ラ
パ
ッ
ラ
ス
タ
ッ
ケー
ジ
製
「CLUSTERPRO for Linux Ver3.1」
2CPU・ライセンス
NEC
製
品
「MIRACLE LINUX V4.0/V3.0 (x86-64)」
2ノード・ライセンス 4 Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reservedCLUSTERPRO概要
現用系ノードと待機系ノード間のデータ共有の方法の
違いによって3タイプ
比較項目
比較項目 CLUSTERPRO SE CLUSTERPRO LE CLUSTERPRO SSS デ タ共有方 デ タ共有方 スト高 共有デ スク必須 スト安 共有デ スク不要 コスト安 共有ディス
違いによって3タイプ
データ共有方 データ共有方 法 法 コスト高:共有ディスク必須 コスト安:共有ディスク不要 コスト安:共有ディス ク不要、サーバ1台 IO IOパフォーマパフォーマ ンス ンス SCSI, FiberChannelによる共 有デ ク のアクセ ディスクミラーリングのオー バ ド ローカルディスクへ のアクセ ンス ンス 有ディスクへのアクセス バーヘッド のアクセス 推奨データ量 推奨データ量 制限なし ∼100GBまでを推奨 制限なし ノード数 ノード数 2∼32台:中∼大規模クラスタ 2台:中∼小規模クラスタ 1台:小規模 ノ ド数 ノ ド数 2∼32台:中∼大規模クラスタ 2台:中∼小規模クラスタ 1台:小規模 構成概念図 構成概念図 5 Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reservedMIRACLE CLUSTERPROのメリット
OracleDBと親和性の高いMIRACLE CLUSTERPROシステ
ムを日本国内でしっかりサポート
HA
HAシステムサポートを国内ですべて完結
システムサポートを国内ですべて完結
ムを日本国内でしっかりサポ ト
OS
OS∼クラスタ∼
∼クラスタ∼Oracle
Oracleをオンストップサポート
をオンストップサポート
国産ソフト故にNEC、MLが日本国内で柔軟・迅速にサポート可能
OS
OS
クラスタ
クラスタ
Oracle
Oracleをオンストップサポ
をオンストップサポ
ト
ト
OS, CLUSTERPRO, Oracleに関する問題の切り分けを弊社が対応
O
l
O
l 向けに
向けに ン ンスした グ収集機能
ン ンスした グ収集機能
Oracle
Oracle向けにエンハンスしたログ収集機能
向けにエンハンスしたログ収集機能
CLUSTERPROログ収集機能でOracleログからOSログまで収集可能
LinuxHA
LinuxHAソフトで実績
ソフトで実績No.1
No.1
Oracle/Miracle/CLUSTERPROワンストップサポート
¾
OSとOracle、クラスタのサポートをワンストップで提供し、
障害を切り分け クリティカルな障害に迅速に対応可能
障害を切り分け、クリティカルな障害に迅速に対応可能
フィ ドバック 問合せ Kernel パッチ提供 障害発生 解決 定例会議開発チーム
開発チーム
フィードバック [障害 検証 テスト] 障害切分 ッチ提供Oracle
Oracle
China
China
Development Center
Development Center
定例会議 [障害、検証、テスト] NEC 障害切分 K l部分まで調査 Oracle Linux CLUSTERPROエスカレーション
Development Center
Development Center
技術支援Oracle
Oracle
Corporation
Corporation
定例会議 Kernel部分まで調査 エスカレーション 9プロの技術者集団 Linux, Oracle, クラスタソフト、セキュリティ 9バックエンドサポート Unbreakable Linux 協力(ML常駐)Oracle Japan
Oracle Japan
7 Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved9バックエンドサポ ト
迅速な対応、ダンプ解析、修正パッチ提供
ORACLE
Real Application Clusters と
Real Application Clusters と
CLUSTERPROとRACの機能概要
<Real Application Cluster>
専
ク
タ
グ
¾
Oracle DB専用のクラスタリング
¾
障害発生時に、他ノードで稼動中のDB(インスタンス*)に切
り替え DBの停止時間を最小限に抑える
り替え、DBの停止時間を最小限に抑える
¾
全ノードでDB(インスタンス)を稼動させ、負荷分散によるス
ループットの向上が可能
ッ
能
<CLUSTERPRO:HAクラスタ>
¾
システムに含まれる様々なアプリケーションのクラスタリング
¾
障害発生時に、待機系ノードにフェイルオーバーし、システ
ムの停止時間を最小限に抑える
ムの停止時間を最小限に抑える
¾
OS障害監視の機能が充実しており、ブラウザから監視可能
9 Copyright © 2000-2005 MIRACLE LINUX CORPORATION All rights reservedOracle DBに限定したクラスタ・ソフトの機能比較
Active Active 待機系フェイルオーバー現用系 DBOracle10g RACDB 10gDB CLUSTERPRO SE ¾ 高可用性とハイパフォーマンスを兼ね備える ¾ 片ノードが待機系となるため リソースの利用効 共有ディスク(SAN) 共有ディスク(DAS) ¾ 高可用性とハイパフォ マンスを兼ね備える ¾ 約10秒前後で高速なフェイルオーバーが可能 ¾ 拡張性に優れ、スケールアウトにより処理能力を 拡張する ¾ 片ノードが待機系となるため、リソースの利用効 率が悪い ¾ ファイルオーバー時に、待機ノードでDBを起動す る時間を要する ¾ HAクラスタに比べ、複雑、高価 ⇒ DBサーバのダウンタイムを最小限抑え、将 来的な拡張性を考慮するお客様 ¾ 拡張性は、基本的にスケールアップに限られる ¾ Oracle RAC に比べ、シンプル、安価 ⇒ 初期コストを抑え、DBサーバの可用性向 上を検討されるお客様 上を検討されるお客様Oracle RAC 構成案
Oracle RAC 構成案①
柔軟拡張性版Oracle RAC
参考構成定価:約¥4000万
•HP ProLaint DL380G5 •MSA1000マルチパス •Oracle EE / RAC (4CPU)¾
ターゲット
¾
2CPU x 2node以上のスペックが必要
Oracle10g
EE
RAC
Oracle EE / RAC (4CPU)
¾
将来的な拡張が予想される
¾
OCFS, rawデバイス / EEオプションを使用したい
Oracle10g
EE
RAC
Oracle RAC 構成案②
廉価版Oracle RAC
参考構成定価:約¥1500万
•HP ProLaint DL380G5 •MSA1000マルチパス¾
ターゲット
¾
2CPU x 2nodeのスペックで要件を満たす
廉価版Oracle RAC
Oracle10g
SE
RAC
約¥1500万
•Oracle SE (4CPU)¾
2CPU x 2nodeのスペックで要件を満たす
¾
将来的な拡張が予想されない
¾
ASMを使用したシステムの運用管理が可能
Oracle10g
SE
RAC
11 Copyright © 2000-2005 MIRACLE LINUX CORPORATION All rights reservedMIRACLE CLUSTERPRO構成案
CLUSTERPRO構成案①
OracleDB HAクラスタ
参考構成定価:約¥700万
•HP ProLaint DL380G5 •MSA500G2•Oracle SE One (2CPU)
¾
ターゲット
¾
DB処理能力の向上が要件ではない
ク
タ要件と
性
向上が目的
Oracle10g
Oracle SE One (2CPU)
¾
クラスタ要件として可用性の向上が目的
¾
ダウンタイムが数分間発生することが許される
CLUSTERPRO SECLUSTERPRO構成案②
廉価版OracleDB HAクラスタ
参考構成定価:約¥600万
•HP ProLaint DL380G5•Oracle SE One (2CPU)¾
ターゲット
¾
検索系中心のシステムの場合
廉価版OracleDB HAクラスタ
CLUSTERPRO LE Oracle10g検索系中
場合
(更新処理が最大10%前後の劣化)
¾
2ノードのHAクラスタ構成かつ、内蔵ディス
クのDBボリュームで足りる
ローカル ディスク ローカル ディスク データミラー 12 Copyright © 2000-2005 MIRACLE LINUX CORPORATION All rights reservedミラクル・リナックス導入支援実績(例)
某リサーチ会社 ML3.0 CLUSTERPRO SE 3.1-2 Oracle 9i R2
PowerEdge 2850 PowerVault 220S 某eコマ ス ML4 0(64) CLUSTERPRO SE 3 1 8 HP DL380G4 MSA1000
某eコマース ML4.0(64) CLUSTERPRO SE 3.1-8 Oracle 10g R2(64) HP DL380G4 MSA1000 (FC2重化) 某鉄道会社 ML4.0(64) CLUSTERPRO SE 3.1-8 Oracle 10g R2(64) HP DL380G4 MSA500G2 Oracle 10g R2(64) 某製造工場 ML4.0 CLUSTERPRO SE 3.1-10 Oracle 10g R2
PowerEdge 2850 Dell EMC CX600 某携帯電話コンテ ML4 0 CLUSTERPRO SE 3 1 4 HP DL380G4 MSA500 某携帯電話コンテ ンツサービス ML4.0 CLUSTERPRO SE 3.1-4 Oracle 10g R1 HP DL380G4 MSA500 ディアゴスティーニ 様 ML3.0(64) Oracle 10g R1 SE RAC(64) HP DL380G4 ( ) MSA1000 様 (mem:16GB)
某eコマース ML3.0(64) Oracle 10g R1 SE RAC(64) HP DL380G4 (mem:4GB) MSA1000 某保険会社 ML4.0(64) Oracle 10g R2 EE RAC(64) HP DL580G2 (mem:14GB) MSA1000 (FC2重化) 某製造工場 ML4 0(64) Oracle 10g R2 EE RAC(64) SunFire X2100 Dell EMC CX700
13 Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved
某製造工場 ML4.0(64) Oracle 10g R2 EE RAC(64) SunFire X2100 Dell EMC CX700
監視機能:
CLUSTERPRO / Oracle10g RAC
アプリケーション・レイヤー
アプリケーション・レイヤー
Oracleインスタンス インスタンス監視 自己監視 TNSリスナーCRS
Oracleインスタンス リスナー監視 自己監視 インスタンス監視 リスナー監視 自己監視CSS
CLUSTERPRO
+DB監視オプション 自己監視OS
OSレイヤー
レイヤー
ハートビート OS監視 ネットワーク監視 ハートビート OS監視 ネットワーク監視HW
HWレイヤー
レイヤー
NIC NIC HBAHBA NICNIC
ロ カルデ スク監視 router router ローカルディスク監視 共有ディスク監視 共有ディスク監視
監視機能:
CLUSTERPRO / Oracle10g RAC
アプリケーション・レイヤー
アプリケーション・レイヤー
インスタンスのプロセス死活:1秒 プ 活 秒CRS
Oracleインスタンス インスタンスのストール:約15分 プロセスの死活:1秒 プロセスの死活:1秒 TNSリスナーCSS
プロセスの死活:1秒 (サーバ再起動) リスナーのプロセス死活:∼10分 リスナーのストール:約15分OS
OSレイヤー
レイヤー
ハートビート I/Oエラー:45秒 OSストール: hangcheck-timer GWへのPing:1分 ハートビート:1秒 OSの一部ストール:?HW
HWレイヤー
レイヤー
NIC NIC HBAHBA NICNIC
I/Oエラー:45秒 I/Oストール:約15分 hangcheck timer router router 15 Copyright 2000-2005 MIRACLE LINUX CORPORATION All rights reserved
監視機能:
CLUSTERPRO / Oracle10g RAC
アプリケーション・レイヤー
アプリケーション・レイヤー
インスタンスCLUSTERPRO
TNSリスナー +DB監視オプション Oracleインスタンス プロセスの死活:即時CLUSTERPRO
+DB監視オプションリスナーのストール、プロセス死活: 約2分 インスタンスのストール、プロセス死活:約2分OS
OSレイヤー
レイヤー
OSストール: S ftd /IPMINIC Link Up/Down:数十秒
ネットワーク機器へ
HW
HWレイヤー
レイヤー
Softdog/IPMI NIC NICローカルディスクの HBAHBA NICNIC
のPing:数十秒 router router I/Oストール、I/Oエラー:約2分 共有ディスクのI/Oストール、I/Oエラー:約2分 16 Copyright 2000-2005 MIRACLE LINUX CORPORATION All rights reserved
MIRACLE CLUSTERPRO SSS
MIRACLE CLUSTERPRO SSS
ソリューション
CLUSTERPRO SSSによる可用性向上
シングルサーバのシステムダウンの約70%は
業務
開
能
クラスタ市場
新規導入の3%CLUSTERPRO SSSで業務再開可能
FT市場
新規既存を含めた全体の 新規導入の2% Linux、Windows障害件数230件のうち救済可能件数162件 (NEC PPサポート調べ) 10% 障害件数 救済可能件数 救済率 HW障害 76 43 58% ( ポ 調 ) 新規導入市場 SW障害 98 86 86% 人為ミス 56 33 58% 合計 230 162 70% ハードウェア 伝送障害 災害 その他 参考:システムダウン要因 合計 230 162 70% クラスタでないと救えない障害 の割合は残り30% (*)HW障害、SW障害、人為ミスの割合はGartnerの割合とほぼ一致。) ソフトウェア 人為的ミス 伝送障害 (Gartner/Dataquest, Dec1999, Causes of Unplanned Downtime) Causes of Unplanned Downtime)CLUSTERPRO SSSによる可用性向上
可 用S/W
単体サーバや
単体サーバやFT
FTサーバの可用性を向上
サーバの可用性を向上
<単体サーバのウィークポイント>
・
DISKへのアクセスが数分間戻ってこない 用 性︵ ダ ウ ン IA FT クラスタ フェイルオーバー 再起動 ダウ・
DISKへのアクセスが数分間戻ってこない。・
OSがストールする。・
AP(Oracleなど)へのアクセスが数分間戻ってこない。・
AP(Oracleなど)が異常終了。 DB DB DB ン タイ ム ︶ フェイルオーバー のダウンタイム発 生 再起動のダウ ンタイム発生 DBSSS
CLUSTERPRO
SSS
DB DB・ディスク監視
・OS監視
SingleServerSafe SingleServerSafe DB・OS監視
・AP(OracleDBなど)の監視
・サービス監視
ダ 19 Copyright © 2000-2005 MIRACLE LINUX CORPORATION All rights reserved可用性(ダウンタイム)
H/W
*SSS:CLUSTERPRO SingleServerSafeCLUSTERPRO SSS概要
¾ シングルサーバにおいてHWやSWの監視を行い、障害発生時には、システム
復旧を行うことにより可用性を向上
¾ 監視機能(実際に監視対象へアクセスすることにより、エラーログが記録さ
れてない場合でも障害検出が可能)
9 HW監視(NIC監視 ディスク監視)
9 HW監視(NIC監視、ディスク監視)
9 SW監視(OS監視、サービス/プロセス監視、ユーザアプリケーション監視)
¾ 復旧機能
9 サーバの再起動、SWの再起動
SSSが OSのスト ルを検出 SSSがOSを再起動 SSSが APの異常を検出 SSSがAPを再起動 する とにより復旧 OSのストールを検出 することにより復旧 APの異常を検出 することにより復旧SSS
SSS
SSS
SSS
DB DB 20 Copyright © 2000-2005 MIRACLE LINUX CORPORATION All rights reservedCLUSTERPRO SSS適用システム例①
エッジサーバからAll in Oneサーバまで簡単、安価に
サ ビスの可用性を向上
¾ 障害検知時にサービス自動復帰
サービスの可用性を向上
¾ GUIツールよる状況確認と障害発生時のメール通報
¾ 例えばAll in One のWebDBサービス監視を実施
<主な監視項目>
9 アプリケ ション
WebDBサービス監視
Apache
9 アプリケーション
9 OS
9 ディスクデバイス
Tomcat
Apache
PostgreSQL
CLUSTERPRO SSS
9 NIC
9 IPアドレス
21 Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reservedCLUSTERPRO SSS
CLUSTERPRO SSS適用システム例②
CLUSTERPRO SSSによるWeb/APサービスの監視
¾ AP監視オプションを使用し、単なるPort監視ではなく、実サー
視
使
、
視
、実
ビスと同様の処理を実施し、AP監視を実施
¾ 障害検知時にはAPの再起動、またはサーバの停止/再起動
を実施する とで対応
を実施することで対応
Load Balancer
CLUSTERPRO SSSWeb / AP
CLUSTERPRO SSSWeb / AP
CLUSTERPRO SSSWeb / AP
再起動CLUSTERPRO SSS適用システム例③
MIRACLE CLUSTERPRO X(2007/7出荷予定)より
統合管理が可能
複数のクラスタの
複数のクラスタの
L3スイッチ統合管理が可能
複数のクラスタの
参照・管理が可能
複数のクラスタの
参照・管理が可能
Load BalancerWebLogic WebLogic WebLogic
CLUSTERPO SSS CLUSTERPO SSS CLUSTERPO SSS
CLUSTERPRO SE
Oracle
23 Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved
CLUSTERPRO SSS 構成事例
アシスト・WebFOCUS アシスト・NOREN WingARC・RDE
Tomcat Webfocus Tomcat RDE Tomcat NOREN Oracle10g CLUSTERPRO SSS PostgreSQL CLUSTERPRO SSS Oracle10g CLUSTERPRO SSS 某自治体業務パッケージ② LB 某自治体業務パッケージ① LB LB WL WL WL WL WL WL WL WL LB ML40 ML40 ML40 ML40
Websphere Websphere Websphere WebsphereSSS SSS SSS SSS WL WL WL WL WL WL WL WL
Oracle 10g RAC
SSS SSS SSS SSS SSS SSS SSS SSS ML40 ML40 ML40 ML40 Oracle10g SSS SSS SSS SSS 24 Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reservedOracle 10g RAC
CLUSTERPRO SE