• 検索結果がありません。

資料2 重要インフラ分野のシステム障害への対策:IPA 独立行政法人 情報処理推進機構

N/A
N/A
Protected

Academic year: 2018

シェア "資料2 重要インフラ分野のシステム障害への対策:IPA 独立行政法人 情報処理推進機構"

Copied!
39
0
0

読み込み中.... (全文を見る)

全文

(1)

2013-2015 IPA, All Rights Reserved

Information-technology Promotion Agency, Japan

Software Reliability Enhancement Center (SEC)

障害事例の分析に基づく教訓

IT

サー

概要

独立行政法人情報処理推進機構

IPA

技術本部

ソフト

ア高信頼化センター

SEC

(2)

バナン ネ ン 領域 教訓 黄色 年度 追加した

教訓一覧

IT

サー

(1/2)

No. 教訓ID 教訓概要

1 G

開発 情 部門 け 仕事 各事業部門 自 こ 捉え 態

勢 く こ 大

2 G 発注者 要件定義 任 持 構築 わ べ

3 G 運用部門 上流工程 企画 要件定義 開発部門 連携 進 べ

4 G 運用者 少 気 事象 放置 共有 こ 追求 べ

5 G サ ビ 拡大期 業 処理量 い 特 入念 予測 実施 べ

6 G 作業 逸脱 個人 問題 く 組織 問題!

7 G ク 事業者 利用者 連携 統制 対応体制 整備 べ

8 G 共同利用 非常時対応 含 利用者間 情報共有 こ

(3)

3

G1

開発 情

部門 け 仕事

各事業部門 自分 こ

捉え

態勢

く こ

大切

8割 上流 要件定義局面 ー ン・

問題 生 い こ 判明

→ 開発 ネ 役割 責任を明確化 ー ン

質を高 態勢 ー ン・ ー ー制度

ー ン・ ー ー制度:責任 役割分担 東京海上日動火災株式会社 例

デ 開発 情 部門

任 仕事

自分 考え 商品や施策を具体

化 行う自分自身 仕

事 あ いう ー ー

考え方を持

デ事業部門 要件 詳細 固

情 部門 対話を繰

返 責任を持 要件定義

最終責任を負わ

デ事業部門 要件定義

出来 う 受入

を実施 責任を負わ

(4)

G2

:発注者 要件定義 責任 持

構築

わ べ

ベンダヸ任

要件定義前

見積 契約

変更

発注者 責任 持

主体的 実施

ベンダヸ 委任契約 発注

要件定義書 変更

様変更書 作成

契約 見直

発注者 責任 持

主体的 実施

ベンダヸ 委任契約 発注

改革前

要件定義

システム 設計・開発

改革後

受入れ テスト

ベンダヸ任

ベンダ担当 発注側担当

開発・運用をIT ン 外部委託 ー 開発案件 増加 伴い任 業務

徐々 拡大 要件定義や受入 等 発注者 役割を果 切 い い

1) 要件定義書 中身 受入 い 責任 発注者

2) 開発 標準を見直 上流 要件定義を押 え 上流工程完璧主義

改 革 前 改 革 後

企 画

ㄥ プロジ クト企画書作成ㄦ

要 件 定義

RFP 作成

※ R FP 詳細化

要 件 定義書 作成 ※

要 件 定義書 詳細化

網 羅 性チ ック

シ ス テムヷ ソフト

要 件 定義

シ ス テムヷ ソフト

方 式 設計

シ ス テムヷ ソフト

実 装 テスト

シ ス テムヷ ソフト

実 装 テスト

企 画

ㄥ プロジ クト企画書作成ㄦ

要件定義書 記述

詳細化を図 記載内

容 網羅性 を徹

発注者自 要件定義

設計書 反映 こ

を確認 要件定義書

設計書 を

受 入

ー を上流工程 作成

要 件 定義ㄥㄯㄦ

要 件 確認書 作成

要 件 定義ㄥㄮㄦ

RFP 作成

要 件 定義書 作成

シ ス テムヷソフト

方 式 設計 シ ス テムヷ ソフト

要 件 定義

入 テスト 入 テスト

要件漏 等 上流工程 起因

品質上 問題 著 減少

 透明性 増 組

織同士 継続的 信頼関係 向上

(5)

5

教訓の概要

G3

:運用部門 上流工程 企画・要件定義

開発部門 連携

問題 運用 現場 ー 操作 や入力 ー 多発

原因 運用要件 検討 あ い 軽視 →運用者 要件定義作業 参加 い いこ

や 参加 い 運用要件 十分 取 込 こ 起因

対策 企画・要件定義作業 い 運用者 視点 要件を確認 下表

こ を参考 対象 合わ 役割分担表 表現

開始前 関係者 ー 合意 適用

ㄯㄭㄮㄱ 度 追 教訓

参考ㄷ 運用者 企画ヷ要件定義工程 確認 項目 例

No 工 程

類 項目 全体 確認 項目 運用者 確認 項目

1

企 画

起案

■経営戦略 見据え シ ステム構築及びシステム 構築 目的ヷ目標 明確 化

経営戦略 現化 情報ㄥシステムㄦ戦略 現化 システム化 目的ヷ方針

納期ㄥスケジュヸルㄦ システム利用期間 ラ フサ クル概要計画

要件 把握

納期ㄥスケジュヸルㄦ 確認

システム ラ フサ クルㄥ更新間隔ㄦ確認 経営戦略 理解

情報ㄥシステムㄦ戦略 理解

2 現状 析

■システムㄥ業務ㄦ 現状 析 問題点ヷ課題 抽 出 析

運用状況 問題点ヷ課題 最新 システム動向 術動向 析

構築ノ ハ 提供 現状課題 提供

最新 術動向ヷトレンド等 情報 析提供 運用状況 報告

2-2 企画立案 ■新システム 企画立案

全社目標 体系化 施策 定義 情報システム要件 システム化 企画立案

運用改善 見 新システム要件 提案

3 投資対効果

■システム構築 投資対効果 明確化

投資対効果 コスト計画 立案

運用要件者側 必要 費用 見積作成

(6)

教訓の概要

G4

:運用者

事象 放置

共有

追求 べ

問題 運用者及び保守者 夜間作業中 異常を誤認 ン ン ー 開始 遅

数時間停止

原因 運用担当者 察知 異常を 保守担当者 異常 誤認.運用部門責任者 十

分 確認 報告 問題 判断 CIO 報告を怠 .

運用担当者 確 異常状況 気 い い 運用 通 作業 気

を運用部門 責任者等 伝え .

対策 運用担当者 現場 異常を察

知 状況判断

運用部門 社員 情報を連絡

協議 態勢を作 こ を

運用 明記.

障害対応体制面 改善・強化:

・事象 障害 断定 い場合

障害 可能性 あ 場合 早期 上

位役職者 報告 ー 追加作成

・状況判断 運用部門社員 24時間

常駐

確認手順及び項目 明確 定義 教育・訓練

ㄯㄭㄮㄱ 度 追 教訓

運用子会社 保 ン

運用部門

CIO

害連絡

調査対応 結果報告 報告

害診断ツヸル

診断レポヸト 内容

電話 電子メヸル 保守ベンダ 報告

診断レポヸト 誤認

ㄩ 替え 成 い 回答 業務 影響 い

判断 ㄩ 害対応 完了

(7)

7

教訓の概要

G5

:サービ

拡大期

業務 処理量

い 特 入念 予測 実施 べ

問題 共同利用 稼働開始 年後 利用増大傾向 中 負荷集中 ン

原因 共同利用各社 処理件数予測 不十分 あ ン 任 DB ー 内

ソ ー ・ 発現

対策 ・利用各社

運営協議会

設置 ・

ン を

含 共同利

用各社 責任

明確化

・ ン 契

約 運営協議 会 決

項目を明記

ㄯㄭㄮㄱ 度 追 教訓

ン ン P 受付処理 バ AP起動

バ 型 ン ン P D 抽出(SQL)

計算 一覧表編集 一覧表出力 一覧表

ン 画面

P バ D バ

D 検索 検索条件 従 い 該当

をD ン ン 探索

抽出 デヸタ

Table SQL

ン ン P

D 参照 更新

(通常

ン ン業務

(バ 型

ン ン業務

D 参照 更新

Table SQL

ン 画面

長時間SQL処理 ⇒タ ム ト多発

流 量 制 御

(8)

教訓の概要

G6

:作業

ー 逸脱

個人 問題

く 組織 問題!

問題 運用作業者 ー 全 ー ー を削除

原因 不慣 運用作業者 新人 独断 運用規定外 手段 管理 ー を介

い ー 直接 誤操作 ー 逸脱

繁忙 環境下 迅速 処理 求 状況 各 ン 互い 作業 追わ

連携 ,不慣 作業者 多忙 熟練者 聞 こ ,自分 業

務を遅 原因 い い いう ー , ー 逸脱

対策 組織的 総合対策:

・作業を受 場合

を考慮 受

諾 判断基準作成

・複数名体制 作業

実施等 ー を逸

脱 い作業規定

作成

・普段 ー 内

ー ン

ㄯㄭㄮㄱ 度 追 教訓

運用 ー 内

(9)

9

教訓の概要

G7

:ク

事業者 利用者 連携

統制

対応体制 整備 べ

問題 ー 移行 通信機器 障害 発生 単 負荷分

散装置 障害 関わ 丸 日間業務 停止

原因 運用時 管理体制 決 い

対策 体制 整備: ・障害対応体制

報告,連絡,相

談 明確化

・契約

ー 定

義 責任分界点 明確化

・ 事業者

関連 ー ー 業者間

障害対応体制 確立 適確 連 携体制

ㄯㄭㄮㄱ 度 追 教訓

世田谷区画

他区画 他区画

利 用 者 向 け 端 A社 外 部 セ ン B社

負荷 散装置(C社製品 仮想化 バ群 仮想化

A社 区画

D社 区画 他区画

L2SW

A社 業務 論理 バ

情報DB

情報DB

情報DB

障害時バ ク A社

稼働系

待機系

D社 業務 論理 バ

A社 今回 害 発生 サヸビス ユヸザ

B社 クラ ドサヸビス 提供 ベンダ

C社 B社 採用 負荷 散装置 ベンダ

D社 サヸビス 共同利用ユヸザ 今回

害 影響

(10)

技術領域 教訓 黄色 年度 追加した

教訓一覧

IT

サー

(2/2)

No. 教訓ID 教訓概要

10 T

サ ビ 優先 い 疑わ 構成要素 積極的

離 ソ 考え方

11 T 蟻 目 け く 全体 瞰 鳥 目 総合的 対策 行うべ

12 T 現場 く知 現場 知識 集約 現場 動 ュ う べ

13 T 全体 影響 変化点 明確 そ 管理 策定

14 T サ ビ 視点 変更管理 仕組み作 品質管理 任 明確化 !

15 T 環境 本番環境 差異 体系的 整理 障害 ク対策 練

16 T ックアッ 替え 失敗 場合 考慮 べ

17 T 仮想サ ソ 管理 性能監視 運用要件 要 あ

18 T 検証 万全?そ 障害 起こ 回避策 準備 くこ

19 T ッ ュ構成 範 可用性 確保 障害 波及 ク ン 案 決定

20 T サイ ン 障害 検知 適 サ ビ 監視 重要

21 T 新製品 旧製品 同一仕様 言わ 必 差異 確認!

22 T 利用者 観点 立 業 オ 則 ビュ 重要

23 T Web 更新時 応答速度 変化等 性能面 ック 忘

24 T 緊急時こそ 一 性 確保 う注意 べ

25 T 構成機器 正 ッ 情報 収集 頻繁 行い 緊急性 応 計画的 対応 べ

26 T 長時間連 運転 不 定動作発生 回避 定期的 再起動 有効!

27 T

新 サ 老朽化 既存 連携 場合 両者 仕様整合性 十 確

(11)

11

T1

:サービ

継続 優先

疑わ

構成要素 積極的

切 離

ー ソ

ナ 考え方

待機

ノードB

ㄮㄦ自身 ヘルスチ ック 場合

異常 通知

停 コマンド 離

現用 ノードA

待機

ノードB ㄯㄦ 系 ヘルスチ ック 場合

ヘルスチ ック

停 コマンド 離

現用

ノードA

待機 ノードB

㄰ㄦ自動停 い場合 手動 停 離

現用 ノードA

業務内容 基 い 毎 ーを作

成 上 ー ソ 考え方を適用

ー 機器 故障 ソ 処理

異常等 あ 場合 部位を積

極的 停止 こ 切 離

場合 系全体を放棄 い 考

え方 処理・対応

一方 う 状況下 一部 部位や系を

切 離 全体

ー 継続 う ー ソ

考え方 基 い 設計・運用

いう 機器やソ 動作

継続を優先 う 予期 障害 場

合 ー 影響 え 大

う場合 あ ー 継続を優先

積極的 関連 部分を 切 離 方 良い場合 多い あ

(12)

T2

:蟻 目 け

全体 俯瞰

鳥 目 総合的 対策 行うべ !

制御系 下位 あ 制御装置 稼働系 故障 発生

自動的 待機系 切 替わ こ 切 替わ

上位 監視端末 指示 系切替えを実施 失敗

障害 下位 起 場合 障害を

起こ 下位 対策を考え

あ 蟻 目 下位 対

策 全体 視

点 鳥 目 上位 対策を活用

こ 安定稼働

(13)

13

T3

:現場

く知

現場 知識 集約

現場 動

ュ ー

べ !

A列車 折返し出

駅を出 した

わ 制御

信号 出 け

A列車

B列車 進路を構成

B列車

特定 ー 制御信号 正 出力 列車 停止

原因 有識者 ン社員を含 以下 機能確認を行 洗い出

い い機能 存在 機能要件漏

原因 列車 動 動作 を総合的 環境 組込

ソ を持 制御 列車 動作 全 行え

環境 い い

A列車 制御信号

出 け い た B

列車へ 制御信号

出 った

原因 い 一度設計

機器 動 列車 運転

ーンを知識 ー ー 蓄

積 こ 追加登録 い

原因 い 制御系

ー ン・ 開

発を行う 現実 制御装置

を分 や 可視化

骨子を見極

化 ン

(14)

T4

全体 影響

変化点 明確

そ 管理 ー

策定

現在時刻

予測ダ ヤ

抑 入力

修 箇所

修 生

予測 表示

く った

実績ダ ヤ

修 箇所

限値を超過

現在時刻

表示項目数 上限値を超え 全画面表示 消え, ー 混乱

↳ 構築当初 決 い 上限値 い 外部仕様変更 伴う見直 を未実施

原因 本質 全体 影響 変化点 こ 場合 予測時間 列車運転本数 不明確

原因 予測時間を4H⇒24H 変更 際

う 要件変更 あ わ

修正箇所数 上限値 増加

全体 機能要件変更を未実施

原因 列車 本数 年々増加 本来

運転本数 増加 都度 上限値を超

え 際 挙動を見直 必要 あ

わ 未実施

対策 制御系 変化点 管理 ー を明確

ー を守 仕組 を構築

・ 監視・制御 対象 仕様 変化点を網羅

・変化点管理 ー を守 仕組 を構築

・変化点管理 使用 管理指標を関係部門 共有

変化点 見落 を防止

(15)

15

障害

T5

:サービ

視点

変更管理

仕組み作

品質管理責任

明確化 !

サ ヸ ビス 視点 変更管理 品 質 管理責任

デヸタ整合性 プログラム整合性 テスト 様整合性 情シス部門 テスト 様作 成ヷ実施→業務部門 参

業務部門 情シス部門 テスト 様作成ヷ実施

顧客 データベース

使用料 調整単価

請求予定

本 店 ホスト/サーバ 事 業 所サーバ

請求予定

営業HT

請求書作成

配 信 P

T 送 信 P

T ・ P ホ

ス ト P

営業HT

要件定義 設計ヷ開発 入 テスト

本店 / ー 請求 ー を端末 転送 請求書を印刷 い

端末 営業員 持 歩 HT ン ・ ー を新規 導入 こ

出力 請求書 金額 誤 顧客 渡 い 個別謝罪・

請求書 再発行 追わ .

新 要件追加

使用方法 変更 あ 今

正常 稼働 い

突如障害 追加

未使用・未確認 使

わ ,不具合 顕在化

変更 あ 時 全体

仕様 整合性を保 変更

管理を確実 実施

全体 整合性を確認

人を決 品質管理責任を明

確 開発 ー 毎 検証

を実施

(16)

T6

環境 本番環境 差異 体系的 整理

障害

ク対策 練

本番環境

環境 番環境

機 能 要 件

AP

異 項目

非 機 能 要 件

HW

異 項目

OS

異 項目

異 項目

量 質

異 項目

性能

異 項目

NW

異 項目

環境差異 析

環境 番環境 環境差異を洗い出

項目 ク対策/ ン ン

ン ン

1

2

3

4

環境 検証

出来 い項目を

抜 出

環境 検証

環境

検証 い

ク対策/ ン

ン ン ンを

作成 者 検討

環境 検証 い

環境 検証 い

環境 検証 い

環境 検証 い

環境 検証 い

環境 検証 い

環境 検証

環境 検証

環境 検証

環境 検証

環境 検証

環境 検証

大 いリスク 経営トップ 判断

㄰者 検討結果 経営トッ プ 製品ベンダ等 ステヸクホルダ 共

テスト環境

環境 本番環境 相違 あ 環境 う い ソ ー

あ 本番環境 障害 発生

環境 本番

環境 差異分析

環境 確認 い項目 機

能 対 関係者

分析

分析結果を

基 ン ン

ン ー ン

を作成 本番環境

を ー

共有

大 い 経

営 判断

(17)

17

T7

: ックアッ 切替え 失敗

場合 考慮 べ

冗長構成を取 い 関わ 切替え 失敗 障害

ー 多い 下図 示 失敗原因 あ 配慮

開発・運用を行うこ 過去 発生 障害 類似 障害 発生を防 こ

稼働系 待機系/

分散稼働

現用

予備

電源装置 (現用) 電源装置

(予備)

ネッ

ワー (5)手動切替え失敗

操作 (9) 保守作業切替え失敗 (7) 待機系稼働系 同一原因障害

(11)電源装置 自動切替え 失敗

ネッ

ワー ータ

ータ

(10) ネ ワー

自動切替え 失敗 ハヸド

プリケヸション

OS等

ハヸド

プリケヸション

OS等

(8) 切替え後動作不安定 ー 不正

(4)切替え失敗

切替えソ 不具合

(1 稼動系 障害未検知

(2)待機系 障害 構成不備

(3)待機系 障害 ー ン不備

(6)切替え後動作不安定 性能不足

(18)

教訓の概要

T8

:仮想サー

ソー 管理 性能監視 運用 要 あ

問題 ー ー 数時間停止

原因 直接原因 ,運用担当者 ー 割 当 .根本原因 ,仮想 ー 環境

運用要件 未整理. ソー 管理,性能監視 不十分 復旧時 対応方法

十分 把握 .

対策 ・物理 ー を稼働

ー 移行 際

ソー 管理 性能

監視 策定

・仮想化 ー

ー 増大 見積

徹底 ・障害対応

等 整備 ,要員 教育・訓練

ㄯㄭㄮㄱ 度 追 教訓

<経緯 >

3

5

X

突然 論理ホ

#1 ソ 空 無く 状態 生 仮 想 バ 停 状態

不要 仮 想 バを 削除

<経緯 > <経緯 >

さ 不要 バ 削除 ナ ョ

世代数を削減 し 空 を確保

常 向 う 一時的 空

確保 た 大量 ナ

ョ 生し たた た ソ を圧迫

フ 空

共有

論理ホ #1

共有

共有

論理ホ #1 論理ホ #1

フ バ

2

4

6

<経緯 >

3

5

2

4

6

3

2

4 バ

5

6

X

論理ホ #2

削除した バを論 理ホ #2

(19)

19

教訓の概要

T9

:検証 万全?そ

障害 起こ

回避策 準備

くこ

問題 2設備間 通信障害発生時 片方 設備上 不具合 発現 動作を停

止 こ を検知 同設備上 振分制御 他 切 替え う

う い 処理待 ー ー ー 同設備 ー

原因 当該通信障害 ー 稀有 を検証 , 検収時点

調達側 供給側 当該 ー 存在を認識 い .

対策 ・ 前 ー ー ー い う, を拡大

・ ー 復旧 作業手順を整備

#1

#2

バ #1

バ #2

振 制御

&

バ 設備 2 設備 1

セ 不

具合

検出 通信障害 生

TCP 一方

途絶

セ #2へ 替え

生し 設備1 さ た

ㄯㄭㄮㄱ 度 追 教訓

・対象

重要性 応

検証 費や こ 時間 労力 制約

常 不具

合 潜在 い

前提 立

業務 継続 性を確保 こ

(20)

教訓の概要

T10

: ッ ュ構成 範囲

可用性 確保

障害 波及

勘案

決定

問題 各 ー 4 NAS 接続 構成 い あ 1

台 NAS 故障 起因 全 ー ン

原因 NAS制御 ー 不

具合 故障 NAS

切 離 失敗 こ 局所

的 障害 構

成 全体 波及 根

本 構成

い 検討不足

対策 構成を見直 1

ー 2 NAS

を接続 ー ン 化

図 赤色 接続 併

ン ン 振分

論理 変更 可用性

担保 迂回時 性能劣

化防止用 BCP設備を増強

設備 2

#1

#2

#3 バ #4 ‥‥‥

設備 1

NAS #21 NAS #22 NAS #12 NAS #11 NAS #31 NAS #32 NAS #41 NAS #42

NAS #32 離し

NAS #31へ 替え

完了

NAS #32 障

害 生 全 バ NAS

#31 ン ン 状態

認識さ た

そ 時間 経

過し 全 バ

ンした

(21)

21

教訓の概要

T11

:サイ ン 障害 検知

適切 サービ 監視 重要

問題 Web ー ン 障害 明示的 障害 検出 い い わ

性能 劣化 発生 外部 指摘 あ 発見 利用者 長時間

わ 応答作度低下 影響を受

原因 直接 負荷分散装置 ー 不具合 原因 発見 遅

ー 監視 条件設定 最適 ー 監視 一定

回数連続 廃棄 場合 ー を発 う設定 い 今回 閾

値を超え 至 ー 監視 通知

対策 負荷分散装置 ー

を更新 ー

監視 条件を変更

ー 監視等 基本的 取組

を実践 上 早

期発見 対処を望 場合

早期障害検知・分析 技

術・製品 SNS上 ぶや 監

視 ン ン 分析 ー 分析 等 用い

う い

ビ 監視

‥‥‥

負荷 散

装置 ク

バ バ バ

バ バ

負荷 散装置

い セ ョン

数 バ

ク 破棄 再

送 生 応答速

度 低 した

ビ 監視

通知

く 性能

低 した状態

いた

(22)

教訓の概要

T12

:新製品

旧製品 同一仕様 言わ

必 差異 確認!

問題 2重化 制御系 い 部品交換 保守作業時 全体 動

作 停止 短時間 復旧 ー 利用者 終日影響を受

原因 装置 数年前 ,当初構築時 HDD SSD 交換 い

部品交換作業 A系を切 離 時 B系OS 両系 装置

要求 発 SSD 要求処理時間 HDD 長

,OS 監視 い 発生 後 処理 う

対策 ・仕様上 互換性を過信

差異分析を必 実施

・ ン ー 双方

相手 役割分担を支

援 合う ー 側

ー 分析を行う

ㄯㄭㄮㄱ 度 追 教訓

SSD 交換時 HDD 完全 互換性 あ

誤認 検証・

(23)

23

教訓の概要

T13

:利用者 観点 立

業務

オ 即

ビュー

重要

問題 ン 申込 ー い こ を 追加 Web経由 申込

を可能 ー い 特定 時間帯 限 Web ー

申込 全 不備 登録 顧客 連絡 判明

原因 ン/Web経由 2系統 ー 申込 を処理 い 各系

統 処理間 ー 連携 誤 あ 根本原因 全体設計 個別

設計 正 引継 こ 業務 即 確認 行わ

設計後 ー 発見 対応 行わ こ

対策 処理 を正

修正

要件定義・設

計段階 ー

ー等 関

係者相互 確認 利用 者 観点 立

業務

即 検証を行う

業務系- ビ J

Web- ビ J窓口

適格確認情報

+ ビ 申込

情報作成

適格確認 済

適格確

認済?

適格確認情報 連携 さ いた Web 適格確認済 あっ 全件NG

(窓口 )

(Web 連携)

18:45~19:00 間

適格確認情報 業務 系 連携さ い

ビ 申込情

報 連携

Yes

No

No

Yes

適格 確認済?

ビ 録

適格確認情報 +

ビ 申込情

報作成

当初 設計

Web 作成さ た情

報 業務系 適格 確認済 クを行わ

18:45~19:00 間 問題 く処理

(24)

教訓の概要

T14

Web

ペー 更新時

応答速度 変化 性能面 チ ック 忘

問題 Web 上 あ ー ー を 応答 長時間を要

目的 ー 接続 い ー 多発

原因 業務部門 ー ン ン を更新 結果 1顧客当 ン ー

4倍 応答速度 影響を確認 い ー

業務部門 ン ー 応答性能 関連を意識 関 IT部

門 技術的 確認 ー 化 い

対策 業務部門 Web ー ン ン を更新 際 IT部門 技術的 観点 確認

を行うこ を手順書 明記 IT部門 必要 判断 場合 業務部門

対 ー 中止を指示 う ー を改

業務系

Web

‥‥‥ ‥‥‥

ビ J窓口 ビ J

をク クし

ビ J 接 い

Web ン

ン を更新

ㄯㄭㄮㄱ 度 追 教訓

次 直接的対策 実施: - 当該 ー

を高速ネ ワー

ー 経由 変更

- ン ン 変更量 自動

機能を導入 最新

(25)

25

教訓の概要

T15

:緊急時こそ

ータ 一貫性 確保

う注意 べ

問題 毎月末 顧客 判定 処理を あ 作成 い 顧客 ー

ーを用い 行う運用 い あ 時 緊急 要請

を修正 対応 こ あ 後 ン ン処理 い 誤

顧客 適用

原因 緊急対応後 顧客 判定用 ー 再作成を行わ

ー 不整合 発生 い 関わ 判

定処理を行

対策 緊急時対応 影 響範囲を見極

対応結果 平 常時

運用 流 確

実 繰 込

う 特 意

識 う周知

作業 ー ・手 順書を明確化

顧客

( ン ン) 判定

ク修

修 不備

判明

顧客

( ン ン)

判定 適用

顧客

(バ 入力用)

顧客

( ン ン)

(修 後)

作成

更新 判

定 ク

を修

作成済 バ

入力利用

を修 再作成し

った

更新処理を行った

た 誤った顧客

適用さ

緊急作業 し

顧客 不備

を修

(26)

教訓の概要

T16

構成機器 修正 ッチ情報 収集 頻繁 行い

緊急性 応

計画的 対応 べ

問題 通信機器 負荷分散装置 障害 発生 丸 日間業務 停止

原因 構築・保守 ン 外部 ー 調達 負荷分散装置 ー

既知 不具合 直接 原因 あ 修正 1 月前 公表 い

ン 修正情報 収集間隔 月 回程度 非常 粗 設定

い 適用 間 合わ ー ー 技術情報 時々

公表 い こ を認識 い

対策 ・技術情報 確認

を3 月 1回

週間 回 変更

・ ー ー ン

適用基準 協議

ㄯㄭㄮㄱ 度 追 教訓

ヸナヸ

構築ヷ保守 ベンダ

機器 メヸ 術情報

収集サ クル 修 パッチ

(27)

27

教訓の概要

T17

:長時間連続運転

不安定動作発生 回避

定期的 再起動 有効!

問題 稼働開始以来8 月以上連続運転 通信機器 障害 発生 丸

日間業務 停止

原因 直接 原因 あ 資源を時間 経過 消費 続 い

う負荷分散装置 ー 不具合 装置を定期的 再起動を い 顕

在化

対策 再起動

を検討 毎月 定

期保守日 状況を見 再

起動 こ を決定

ネ ワー 機器

い 定期的 再起動

こ 長時間連

続運転 不具合 顕

在化 回避 こ

経験的 知 い

ㄯㄭㄮㄱ 度 追 教訓

連 運転ㄥㄵ ㄦ

サヸビス開始

(28)

教訓の概要

T18

:新

老朽化

既存

連携

場合

両者 仕様整合性 十分確認 べ

問題 特別 事象を契機 ン ン 大量 入力 集中 連携 処理

ー ー ー 後 対応 誤 10日間程度 ン ン ー 停止等

原因 携帯電話 対応 新 い 既存 を接続 際 全体整合を十

分 携帯電話 ー 的 ー 要求 無制限 受

付 後続 連携 夜間 処理能力 制限値を

超え 異常終了 結果 膨大 作業 発生 処理失念や誤処理 多

数 副次的障害 発生

対策 ・既存 要件定

義内容を再度

連携

間 整合性を確認 こ を ー 化

反映

・ 異常終了

途中 再開始可 能 仕組 導入

(29)

29

技術領域教訓の運用プロセ

へのマッ

教 訓 ㅆㅁ

ㅇㅆS Q20000-1ㄷ2012 ㄥ●主 問題個所 関連 問題個所ㄦ

ㄲㄫ新規 サヸビス 変更 設計 及び移行

ㄳㄫサヸビス提供プロセス ㄴㄫ関係プロセス ㄵㄫ解決プロセス ㄶㄫ統合的制御プロセス サヸビス

レベル管 理

サヸビス ヷ可 用性管理

サヸビス 報告

容 ヷ能 力管理

情報セ キュリテ

管理

事業関係 管理

供給者管 理

ンシデ ント管理

問題管理 構成管 理

変更管 理

リリヸス 管理

T1 ●

T2 ●

T3 ●

T4 ●

T5 ●

T6 ●

T7 ●

T8 ●

T9 ●

T10 ●

T11 ●

T12 ●

T13 ●

T14 ●

T15 ●

T16 ●

T17 ●

(30)

終わ

害事例

教訓

(31)

31 <出 >

開発 運用 連携深 間159件 害 数件 , IT Pro Active, 2013/05/09.

http://itpro.nikkeibp.co.jp/article/Active/20130404/468783/

参考

事例

運用メンバの開発プロ

参画によ

効果

運用方法

改善

2001

害件数

159

件→

34

/

減少

運用設計

不備

トラブル

いㄫ

トラブル例ㄷサヸバヸ

CPU

やメモリヸリソヸス

枯渇

ㄩプロセス

稼働開始当初

リソヸス

余裕

ㄩデヸタ

増え

見越

設計

ㄩ稼働

リソヸス

不足ㄫ

開発プロセス

運用設計

ㄩ運用要件

設計

運用

部門

プロセス

変更ㄫ

2003

害件数

34

件→

6

/

減少

当初

不評

開発部門

害対応

時間

ㄩ次第

ㄩ運用設計

理解ㄫ

2010

ㄩクラ

契機

ㄩプロジ

クト

チヸム編成

変えㄩ

運用部門

メンバ

発プロジ

クト

参画

ㄩランニングコスト

見据えㄩ非機能面

設計

担当ㄫ

(32)

<出 >

ヷ防災チ ックそ 54: ICS 問わ 山手線 支柱倒壊トラブル, リスク対策.com, 2013/04/17.

ヷ時論公論ㄷ 山手線支柱倒壊 防 , NHK, 2015/4/24.

参考

事例

山手線

支柱倒壊トラブル

類似性

(1/2)

危機対応

統一化

ルヸル

ICS

Incident Command System

観点

2015

4

12

JR

山手線

架線支柱

倒壊トラブル

考え

ㄩトラブル

直接原因ㄷ支柱

倒壊

術的

いㄫㄦ

倒壊

機会

何度

ㄩい

注目点ㄮㄷ倒壊

2

日前

工事担当者

把握

ㄩそ

情報

伝わ

報告

13

(

)

対策

いい

判断ㄦ

注目点ㄯㄷ前日夜

運転士

気付い

報告

ㄩ電車

運行担当部署

伝わ

ㄩ連絡

時間

ㄩ翌日

始発前

点検

行わ

注目点㄰ㄷメンテナンス担当者

3

当日

始発電車

調

後ㄩ現場

ㄩ電車

状況

確認

ㄩ直

報告

現場

ㄩ間

支柱

倒壊

ICS

原則>

ヷ危機対応

直結

情報

洗い出

情報マネジメント

ヷ洗い出

情報

危機対応

目的

必要

部門ㄥ担当者ㄦ間

(33)

33 <出 >

ヷ防災チ ックそ 54: ICS 問わ 山手線 支柱倒壊トラブル, リスク対策.com, 2013/04/17.

ヷ時論公論ㄷ 山手線支柱倒壊 防 , NHK, 2015/4/24.

参考

事例

山手線

支柱倒壊トラブル

類似性

(2/2)

<検証

事項>

ヷ工事担当者

支柱

傾い

いう情報

危機

認識

ヷそ

情報

運行

担当者間

過程

情報共

ㄩそ

明確

情報マネジメント

ㄩ理屈

現場

大丈

程度

等ㄩ

根拠

常性バ

危険情報

い見逃

トラブル

危機

特性

ㄩ現場

理解

要性

(34)

A

B

A

B

構築当初

サブシステム

サブシステム

実 通 い論理

/起動 い処理

不 合 不 合

新規追 サブシステム 動作

通 得 論理/起動 得 処理

新規サー

追加のため

害発生

参考

(35)

35

構築当初

サブシステム

後 追 サブシステム

新規追 サブシステム 動作

当初想定 前提/条件 異 状況

新規サー 追加のため

害発生

参考

新規サー

追加によ

潜在不具合が顕在化

(2/2)

A

B

A

B

想定 前提/条件

意 通 動作

想定 い い

前提/条件 ㄩ

意 い動作

(36)

<出 >

氏ㄥ株式会社ジャステックㄦ 調査検討資料

参考

(37)

37

<出 >

氏ㄥ株式会社ジャステックㄦ 調査検討資料

参考

(38)

<出 >

氏ㄥ株式会社ジャステックㄦ 調査検討資料

参考

(39)

39

顧客 及び他

利害関係者

要求事項

ビ ネ ン S M S

経営者 責任 他 関係者 運用

セ バナン

SMSを確立

文書 運用管理

資源 運用管理

新 規 ビ 又 ビ 変 更

設 計 及 び 移 行

顧客 及び他

利害関係者

ビ 提供 セ

ビ 管理

ビ 報告

統合的制御 セ

構成管理

変更管理

及び展開管理

容量 能力管理

ビ 及び

可用性管理

解決 セ

ン ン 及び

ビ 要求管理

問題管理

関係 セ

事業関係管理

供給者管理

情報セ 管理

ビ 予算業務

及び会計業務

(JIS Q 20000-1:2012 より引用)

運用プロセ

参照

関連したドキュメント

独立行政法人福祉医療機構助成事業の「学生による家庭育児支援・地域ネットワークモデ ル事業」として、

であり、最終的にどのような被害に繋がるか(どのようなウイルスに追加で感染させられる

(2021年度) 2022年度 2023年度

クライアント証明書登録用パスワードを入手の上、 NITE (独立行政法人製品評価技術基盤 機構)のホームページから「

タンクへ 処理水.. 原子力災害対策本部 政府・東京電力 中長期対策会議 運営会議

廃棄物の再生利用の促進︑処理施設の整備等の総合的施策を推進することにより︑廃棄物としての要最終処分械の減少等を図るととも

「マネジメントモデル」の各分野における達成すべき目標と重要成功要因の策定を、CFAM(Corporate Functional Area

平成 28 年度は、上記目的の達成に向けて、27 年度に取り組んでいない分野や特に重点を置