• 検索結果がありません。

Contents 1. ITプロジェクトのロスコストとSE 作業高品質化 2. SE 事故分析の課題と解決方法 3. SE 事故分析手法 4. 事例適用と評価 5. まとめ 1

N/A
N/A
Protected

Academic year: 2021

シェア "Contents 1. ITプロジェクトのロスコストとSE 作業高品質化 2. SE 事故分析の課題と解決方法 3. SE 事故分析手法 4. 事例適用と評価 5. まとめ 1"

Copied!
35
0
0

読み込み中.... (全文を見る)

全文

(1)

ソフトウェア品質シンポジウム2018 SQiP2018

株式会社 日立製作所 研究開発グループ

システムイノベーションセンタ セキュリティ研究部

2018/9/14

海老澤竜

ヒューマンエラーによる失敗・事故の分析手法の提案

D2-2

(2)

1. ITプロジェクトのロスコストとSE作業高品質化

2. SE事故分析の課題と解決方法

3. SE事故分析手法

Contents

4. 事例適用と評価

5. まとめ

(3)
(4)

1-1 ロスコストとSE作業

「ITプロジェクトのロスコスト」の解釈

ITプロジェクトが当初計画から乖離したことにより発生した費用

本発表ではSI(システムインテグレーション)事業を念頭に,

SE作業に関連して発生した事故への対応をロスコストと捉える

SE作業を高品質化

することで事故を削減しロスコストを抑えるこ

とができる

SE作業高品質化の考え方

全く新しい要因によって事故が発生しているとは考えづらく,

過去事故の情報を活用して将来の事故を防ぐことが有効

事故の正しい原因分析に基づく再発防止策の立案や,事故から

得た教訓を知識として共有・活用することが重要

SE作業: 事前に手順を決めて計画的に実施するSEの作業

(e.g.運用中システムの保守作業など)

(5)

1-2 SE作業高品質化のプロセス

SE事故の「分析」・「知識化」・「活用」の3つのプロセスにより

SE作業を高品質化する

サマリ,

教訓

事故事例・

防止策情報

SE事故・失敗

現場グループ/当事者

SE事故情報活用

支援組織・システム

活用サイト

(フィードバック先)

・・・

ヒューマンエラー分析

フレームワーク等をもとにした

SE事故分析手法

事象B 事故事象 事象A 時間A 時間B 関係者1 関係者2 時間C 事故1直接原因 ・ ・ ・ 1

事故・失敗の本質を追究

事例情報知識化

情報統合・知識活用

事例を活用しやすく

整理,活用・展開促進

知識化

他情報と統合・分析等

により作業品質向上

活用

新規PJ

類似事故防止

教育プログラム

事例を教育に活用

(レビュー時)

アラート・

予防策

(障害初期)

対策提案

分析

本発表では,特にSE事故の「分析」を実現する

SE事故分析手法を提案し,その適用・評価結果を報告する

(6)
(7)

2-1 課題と解決方法

(1)環境要因重視へ

(2)主要因の絞り込み (3)分析支援ツール化

対策が人に集中

分析作業負荷が高い

検討方法が不定

教育

注意喚起

周知徹底

反省

従来のSE作業事故対策方法における3つの課題と解決方法

(8)

2-2 特徴(1):環境要因を重視したヒューマンエラー分析

ヒューマンエラー対応戦略:人を取り巻く環境を変えることを重視

技能

注意力

記憶力 学習能力

性格

認知能力

ストレス ・・・

作業対象 作業方法

作業環境 勤務体系

作業基準 管理体制

ワークロード ・・・

他分野(医療、原子力など)で実績のある

ヒューマンエラー分析手法で採用されている考え方

医療分野で実績のある「Medical-SAFER」を

SE事故分析手法のベースとする

環境

環境の要因

人の要因

分析・対策

分析・対策

重視

(9)

2-3 特徴(2):主要因絞込みによる分析の集中

システマチックなヒューマンエラー分析手法(原因分析→対策立案)

採用されるべき対策は事故寄与度の高い要因(主要因子)に対する対策

「主要因子特定」により項目数発散を抑制,主要因子への対策に集中

事実の

把握・確認

要因分析

対策発想

対策案の

評価

要因1

事故構成事象

事象間関係

要因2

対策案1-1

対策案1-2

実施する

対策A

・・・

対策案2-1

対策案2-2

実施する

対策B

要因3

・・・

・・・

対策案3-1

対策案3-2

実施する

対策C

・・・

主要因子

特定

主要

因子1

主要

因子2

主要

因子3

(10)

• 分析立案資料の雛形として活用

• 手順を理解したらすぐに分析に取り掛かれる

2-4 特徴(3):分析立案支援ツール

5つの手順に対応する5枚のワークシート,マニュアル

時系列

事象関連図

背後要因

関連図

要因評価表

対策案

評価表

対策発想

マトリックス

事実の

把握・確認

要因分析

対策発想

対策案の

評価

主要因子

特定

分析立案ワークシート利用マニュアル

ステップ1

ステップ2

ステップ3

ステップ4

ステップ5

速い

• マニュアルに従いシートを埋めるだけで分析立案可能

• 事故当事者の現場SEが簡単に実行可能

簡単

• 組織内で形式を統一化

• 分析立案の標準作業化,情報蓄積・共有の容易化

統一的

(11)
(12)

3-0 5つのステップ

ステップ

目的

ステップ1:

事実の把握・確認

事故前後の事象,事象間の関係を

整理し,事故につながった事象や

事故対応状況を把握

ステップ2:

要因分析

事故につながった事象の背後に存在

する要因を広く推定・探索

ステップ3:

主要因子特定

優先的に対策を立てるべき事故主要

因子を特定し,対策立案を集中

ステップ4:

対策発想

事故の主要因子に対応する対策案を

広く発想する

ステップ5:

対策案の評価

発想した対策案を評価し,優先的に

実施する対策を決定

分析立案の流れ

直接原因,

問題事象

根本要因

主要因子

対策案

優先実施

対策

事故状況,

条件,環境

(13)

ステップ

目的

ステップ1:

事実の把握・確認

事故前後の事象,事象間の関係を

整理し,事故につながった事象や

事故対応状況を把握

ステップ2:

要因分析

事故につながった事象の背後に存在

する要因を広く推定・探索

ステップ3:

主要因子特定

優先的に対策を立てるべき事故主要

因子を特定し,対策立案を集中

ステップ4:

対策発想

事故の主要因子に対応する対策案を

広く発想する

ステップ5:

対策案の評価

発想した対策案を評価し,優先的に

実施する対策を決定

3-1 ステップ1:事実の把握・確認

直接原因,

問題事象

根本要因

主要因子

対策案

優先実施

対策

事故状況,

条件,環境

(14)

3-1 ステップ1:事実の把握・確認

作業内容:

4つの作業(1-1)~(1-4)により,

ワークシート1:時系列事象関連

図を作成する

目的:事故事象と直接原因,事故発生前後の事象を整理

ワークシート1:時系列事象関連図

•(1-1):関係者の特定

•(1-2):事故の特定

•(1-3):事象の整理

•(1-4):問題事象の特定

事象B

事故事象

事象A

時間A

時間B

関係者1

関係者2

時間C

事故1直接原因

1

記載内容

STEP1

事実の 把握・確認 要因分析 対策発想 対策案の 評価 主要因子 特定

2

1

(15)

ステップ

目的

ステップ1:

事実の把握・確認

事故前後の事象,事象間の関係を

整理し,事故につながった事象や

事故対応状況を把握

ステップ2:

要因分析

事故につながった事象の背後に存在

する要因を広く推定・探索

ステップ3:

主要因子特定

優先的に対策を立てるべき事故主要

因子を特定し,対策立案を集中

ステップ4:

対策発想

事故の主要因子に対応する対策案を

広く発想する

ステップ5:

対策案の評価

発想した対策案を評価し,優先的に

実施する対策を決定

3-2 ステップ2:要因分析

直接原因,

問題事象

根本要因

主要因子

対策案

優先実施

対策

事故状況,

条件,環境

(16)

3-2 ステップ2:要因分析

記載内容

目的:事故直接原因の背後に存在する要因を広く抽出

•(2-1):要因チェインの作成

•(2-2):要因ツリーの作成

•(2-3):根本要因の抽象化

探索要因

事故

直接原因

事象由来

要因

要因

チェイン

・・・

要因

ツリー

作業内容:

3つの作業(2-1)~(2-3)に

より,ワークシート2:背後要因

関連図を作成する

利用

STEP2

抽象化

根本要因

事実の 把握・確認 要因分析 対策発想 対策案の 評価 主要因子 特定

ワークシート2:背後要因関連図

(17)

3-2 作業(2-2):要因ツリーの作成

XX処理時にYYバッチ が起動していなかった から

AND

分岐

ZZ処理時の最大容量 見積もりが間違ってい たから

OR

分岐

ログを定期的に削除 していなかったから YYバッチの定期 起動時にディスク 容量不足のため 起動に失敗し, XX処理時までに YYバッチ不起動を 検知できなかった から 【1】オンラインサービス で必要なディスク空き容 量を確保できなかった ログ収集バッチ稼動時 の最大ディスク使用容量 の見積もりが間違ってい たから ログを定期的に削除して いなかったから

リリース前

リリース後

【MECE】

(時間)

【反復定義】

なぜ,空き容量が

確保できなかったのか?

分岐の種類

探索方法

AND分岐:

•分岐先が依存関係を持ち得る

•例:前提・帰結の関係

•分岐先が合わさり分岐元を生む

OR分岐:

•分岐先が各々独立

•分岐先が単独で分岐元を生む

反復定義:

•いわゆる「なぜなぜ分析」

•要因から質問を繰り返し定義,

その答えとして背後要因を探索

MECE:(重複なく・漏れなく)

•特定の概念を軸として検討

•例:時間(前後),空間(内外),

作業者自身と環境(m-SHELL

(※)

事実の 把握・確認 要因分析 対策発想 対策案の 評価 主要因子 特定

(18)

ステップ

目的

ステップ1:

事実の把握・確認

事故前後の事象,事象間の関係を

整理し,事故につながった事象や

事故対応状況を把握

ステップ2:

要因分析

事故につながった事象の背後に存在

する要因を広く推定・探索

ステップ3:

主要因子特定

優先的に対策を立てるべき事故主要

因子を特定し,対策立案を集中

ステップ4:

対策発想

事故の主要因子に対応する対策案を

広く発想する

ステップ5:

対策案の評価

発想した対策案を評価し,優先的に

実施する対策を決定

3-3 ステップ3:主要因子特定

直接原因,

問題事象

根本要因

主要因子

対策案

優先実施

対策

事故状況,

条件,環境

(19)

3-3 ステップ3:主要因子特定

ワークシート2:背後要因関連図

ワークシート3:要因評価表

記載内容

目的:優先的に対策する主要因子を特定,対策立案を集中

•(3-1):要因ツリーごとの事故重大度設定

•(3-2):背後要因の寄与度設定

•(3-3):根本要因の事故寄与度算出

•(3-4):主要因子の特定

作業内容:

4つの作業(3-1)~(3-4)に

より,ワークシート3:要因評価表

を作成する

STEP3

60

40

30

70

80

20

50

50

根本要因

事故寄与度 主要因子

○○だから

18%

△△なかったから

21%

□□だから

7%

ワーク

シート2

ワーク

シート3

事実の 把握・確認 要因分析 対策発想 対策案の 評価 主要因子 特定

(20)

ステップ

目的

ステップ1:

事実の把握・確認

事故前後の事象,事象間の関係を

整理し,事故につながった事象や

事故対応状況を把握

ステップ2:

要因分析

事故につながった事象の背後に存在

する要因を広く推定・探索

ステップ3:

主要因子特定

優先的に対策を立てるべき事故主要

因子を特定し,対策立案を集中

ステップ4:

対策発想

事故の主要因子に対応する対策案を

広く発想する

ステップ5:

対策案の評価

発想した対策案を評価し,優先的に

実施する対策を決定

3-4 ステップ4:対策発想

直接原因,

問題事象

根本要因

主要因子

対策案

優先実施

対策

事故状況,

条件,環境

(21)

3-4 ステップ4:対策発想

記載内容

目的:事故の主要因子に対応する対策案を広く発想する

•(4-1):対策案の発想

作業内容:

ワークシート4:対策発想

マトリクスを作成する

STEP4

××× ○○○ △ △ △ ◎◎◎◎ 事実の 把握・確認 要因分析 対策発想 対策案の 評価 主要因子 特定

ワークシート4:対策発想マトリクス

m S H E L-L

L

m.e.

△△ ◎◎ @@

m.p.

◇◇ □□ ♪♪

m.det.

○○ ★★ ☆☆

m.dam.

▽▽ ※※

対策案を

配置

主要因子を列挙

「何に」

(22)

3-4 作業(4-1):対策案の発想

「何に」(分析対象):m-SHEL

「どのような」(対策戦略):4STEP/M

事実の 把握・確認 要因分析 対策発想 対策案の 評価 主要因子 特定

m

管理

S

提示情報

H

作業対象

E

環境

L-L

周囲人物

L

本人

契約,規則,

業務手順,

作業設計

手順書,

マニュアル,

チェックリスト

機器,

情報システム,

プログラム

空間(広狭,明暗,

寒暖),時間(長さ,

時間帯)

上司,

同僚,

顧客

技術,

意識,

知識

例:

min. encounter

(機会最小)

エラーを伴う作業削減

min. probability

(確率最小)

エラー確率低減

multi. detection

(多重検出)

多重のエラー検出策

min. damage

(被害最小)

エラーに備える

やめる(なくす)

できないようにする

わかりやすくする

やりやすくする

知覚,予測,安全判断

させる,能力持たせる

自分で気づかせる

エラー検出する

被害に備える

本人への対策

(23)

ステップ

目的

ステップ1:

事実の把握・確認

事故前後の事象,事象間の関係を

整理し,事故につながった事象や

事故対応状況を把握

ステップ2:

要因分析

事故につながった事象の背後に存在

する要因を広く推定・探索

ステップ3:

主要因子特定

優先的に対策を立てるべき事故主要

因子を特定し,対策立案を集中

ステップ4:

対策発想

事故の主要因子に対応する対策案を

広く発想する

ステップ5:

対策案の評価

発想した対策案を評価し,優先的に

実施する対策を決定

3-5 ステップ5:対策案の評価

直接原因,

問題事象

根本要因

主要因子

対策案

優先実施

対策

事故状況,

条件,環境

(24)

3-5 ステップ5:対策案の評価

目的:発想した対策案を評価し,優先的に実施する対策を決定する

•(5-1):評価基準の設定

•(5-2):対策案の評価

•(5-3):優先実施策の決定

作業内容:

3つの作業(5-1)~(5-3)に

より,ワークシート5:対策案評価

表を作成する

STEP5

事実の 把握・確認 要因分析 対策発想 対策案の 評価 主要因子 特定

記載内容

ワークシート5:対策案評価表

対策案 評価基準

備考 総合

評価

基準a 基準b 基準c

40

25

35

対策A

3

5

2

3.6

対策B

4

2

5

4.2

優先実施

対策

選定理由 担 当 者 ・

部署

期限

対策B

…だから

××

2016/12

対策D

…だから

**

2017/3

(25)
(26)

4-1 事例への適用

• 部署:

公共分野顧客のインフラ構築,アプリ開発を担当するSE部署

• 事例:

稼動前リハーサルでの発生事象やヒヤリハット事象(10数件)

実際にツールを利用して分析立案を実施したSE(9名)に対し,

ヒアリングを実施

• 事象の当事者メインで作成し,その後グループでレビュー

• 管理者がヒアリングしながら作成し,その後グループでレビュー

適用対象

適用方法

評価

(27)

4-2 適用の評価1

• 課題: に対応する

特に、対策発想マトリクスの導入が効果的であるということ

• マトリクスの対策対象軸の6項目のうち、人の要素は2項目(L お

よびL-L)だけで、残りの4項目はルール・仕組み等の人を取り巻く

環境に対応しているため

考察

対策発想マトリクスの2軸が良い発想支援になる。

対策が人に集中

(1)環境要因重視へ

実際、発想された再発防止策案は、

• 環境的要因を対象とする傾向が強まっている

• 人を対象とする対策が減る傾向がある

(28)

4-3 適用の評価2

• 事故の規模等に応じて分析に割けるリソースは大小さまざま。

比較的小さな失敗・事故に対して実施するには、提案手法の負荷

が大きすぎる。

• 課題: に対応する

について、効果があると実感されていることも推察される。

考察

• 小規模な事故に対して分析の全工程を

実施すると、工数が大きすぎる。

• 根本原因の絞り込みは、事故分析リソースの

かけ方として合理的である。

分析作業負荷が高い

(2)主要因の絞り込み

(29)

4-4 適用の評価3

• 課題: に対応する が、

個人・部署間のばらつき防止だけではなく、可視化とそれによる

議論の広がり促進としてもプラスに評価された

• 現場への試験的な導入を経て手法の有用性が示されれば、

他現場展開や標準化が加速し、

という課題は

解決されると考えられる

考察

• どのように頭を使えばよいのかがガイドされて

いるので分析が進めやすい。

• 要因探索が分岐によって広域化・可視化され

る。

• 全体として、可視化された分析過程により

議論が広がる。

検討方法が不定

(3)分析支援ツール化

検討方法が不定

(30)

4-5 その他評価

導入状況

現場導入が少しずつ始まり効果が出始めている

一つの事業部門で、月次の全体会議における事故分析・

報告で本手法を採用

個別採用部署で、適用開始以降の約3年間のトラブル事象を、

0件(従来頻度では10件程)に押さている

• 分析実施後の満足度が従来よりも高まった。

• 失敗の分析は後ろ向きになりがちだが、

本手法では前向きに取り組めた。

副次的効果:チームで議論しながら分析に取り組むことができ、

モチベーションの面でメリットがある

考察

(31)
(32)

5-1 まとめ

従来の事故分析の3課題に対応する、

SE事故分析手法を提案

提案

適用・評価

今後の課題・展開

対策が人に集中

分析作業負荷が高い

検討方法が不定

課題に対して、一定程度の解決ができた

←対策発想マトリクス

←分析支援ツール化

←主要因の絞り込み

• 簡易版分析手順(分析の核心部分のみ実施)を整備

 分析工数と分析詳細度の異なる選択肢を準備することでリソースに

応じて手順を選択できるようになる。

• 他分野への適用検討

(33)

5-2 その後

• 分析のステップ数を3つに減らした簡易版手順を作

成、社内展開

• 通常版と簡易版の使い分け指針について整理、

社内展開

技術的な改良

• IPA:「先進的な設計・検証技術の適用事例報告書

2017年度版」にて公開 (2018/2)

• 他社システム部門主催勉強会にて

講演・ワークショップを実施(2018/5)

社外活動

(34)

株式会社 日立製作所 研究開発グループ

システムイノベーションセンタ セキュリティ研究部

ヒューマンエラーによる失敗・事故の分析手法の提案

2018/9/14

海老澤竜

END

(35)

参照

関連したドキュメント

・隣接プラントからの低圧  電源融通 ・非常用ディーゼル発電機  (直流電源の復旧後)

なお、 PRA では LOCA 時の注水機能喪失シーケンスを、破断口の大きさに 応じて AE( 大破断 LOCA) 、 S1E( 中破断 LOCA) 及び S2E( 小破断 LOCA)

評価する具体的な事故シーケンスは,事故後長期において炉心が露出す

地震 L1 について、状態 A+α と状態 E の評価結果を比較すると、全 CDF は状態 A+α の 1.2×10 -5 /炉年から状態 E では 8.2×10 -6 /炉年まで低下し

可搬型設備は、地震、津波その他の 自然現象、設計基準事故対処設備及び

建屋・構築物等の大規模な損傷の発生により直接的に炉心損傷に至る事故 シーケンスも扱っている。但し、津波 PRA のイベントツリーから抽出され

添付資料 1.0.6 重大事故等対応に係る手順書の構成と概要について 添付資料 1.0.7 有効性評価における重大事故対応時の手順について 添付資料

可搬型設備は,地震,津波その他の 自然現象,設計基準事故対処設備及び