• 検索結果がありません。

人にやせ薬( A )と偽薬( P )を飲んでもらう

ドキュメント内 Microsoft PowerPoint - R-graph_data-mining.ppt (ページ 33-40)

Versicolor

男女 10 人にやせ薬( A )と偽薬( P )を飲んでもらう

„ 飲みはじめの体重を測り, 1 ヶ月飲み続けた後,再度測定

„ 体重の変化量( kg )を目的変数として回帰木を作成

Group=A

Sex=

Baseline>=57.5 Group=P

Sex=

Baseline< 57.5

-2.5n=2 -0.66667

n=3 0

n=2 2.3333 n=3

(各カテゴリの平均値と例数が表示される)

CART 以外の分析・分類・予測手法

„

回帰分析(共分散分析・ロジスティック回帰)

お気楽に,ざっくりと分析する場合・・・

„

ニューラル・ネットワーク

非線形的なデータ構造にも対応,分類ルール不明

„

サポートベクターマシン

CART

のような直線的な分類だけではなく,曲線的な分類が出来る

「判別」が目的なので,説明変数が目的変数に対してどのような 影響を与えているかは不明

„

集団学習(バギング,ランダムフォレストなど)

‰

バギング:多数の

CART

を生成して多数決(分類の場合)

or

平均(回帰の場合)

‰

ランダムフォレスト:与えられたデータからいくつかの変数を ランダム抽出し(ブートストラップサンプル)

CART

を作成

⇒ 多数回くり返して多数決(分類の場合)

or

平均(回帰の場合)

„

アソシエーション・ルール(相関分析):ビールと紙おむつ

35

本日のメニュー

„ R の概要

„ R でデータを読み込む方法

„ グラフとデータマイニング

„ データマイニングとは? ←

‰

データマイニングとは

‰

医薬品医療機器総合機構の例

‰

シグナルとシグナル検出

„ R Commander の紹介

„ 質疑応答など

データマイニングとは?

„ データマイニングをそのまま日本語に訳すと

「データから宝石(鉱物)を掘り当てる」となる

⇒ データという鉱山から「統計的な手法」などを施すことで

「宝石」を見つけるのが目的

„ 「宝石」とは , データが巨大であるがゆえに古典的な 統計手法を施すだけでは発見できなかったような

「有益なルール」「意外なパターン」「意思決定に 繋がる情報」のことをさす

⇒ 例えば CART の場合は「分類ルール」が「宝石」となる

„ 間違っているかもしれないが,個人的には「グラフ化」や

「層別解析」も立派なデータマイニングだと思う

37

日本経済新聞朝刊 15

2008111 日付)

医薬品医療機器総合機構って?

„ 日本の厚生労働省が管轄している独立行政法人

„ 医薬品・医療機器の「審査関連業務」や「安全対策業務」

などを行っている

„ 「新薬の候補」が出来た時に「薬として認めて下さい」と 申請するところ

http://www.pmda.go.jp/

39

参考文献(医薬品医療機器総合機構 HP より)

1.

平成

18

年度データマイニング手法の導入に関する検討概要について

http://www.info.pmda.go.jp/kyoten_iyaku/file/dm-gaiyou18.pdf

2.

データマイニング手法の導入に関する検討結果報告書(平成

19

3

月)

http://www.info.pmda.go.jp/kyoten_iyaku/file/dm-report18.pdf 3.

平成

17

年度データマイニング手法の導入に関する検討概要について

http://www.info.pmda.go.jp/kyoten_iyaku/file/dm-donyu1807.pdf

4.

データマイニング手法の検討を行うための支援業務報告書(平成

18

3

月)

http://www.info.pmda.go.jp/kyoten_iyaku/file/data060728.pdf 5.

データマイニング手法の導入に関する検討内容について

http://www.info.pmda.go.jp/kyoten_iyaku/file/dm-donyu.pdf

6.

データマイニング手法の検討を行うための支援業務報告書(平成

17

3

月)

http://www.info.pmda.go.jp/kyoten_iyaku/file/data050720.pdf

データマイニングとは? (三菱総研)

決定木,ニューラルネット,

相関分析を使用している,ある いは市販ソフトを利用している

【手法】

データマイニング手法(ツール)を 使っている

データをツール(ソフト)に 入れると知識が抽出される

【自動的】

半自動的な分析により知識(ルール)

が抽出されている

人手では見切れないような データを分析している

【データ量】

大量のデータを分析している

結果として業務効率,成果が 向上している

【定義】

未知かつ有用な知識を発見できている

内容 判別基準

„ 参考文献 6 では,ある手法が「データマイニング」であ

ドキュメント内 Microsoft PowerPoint - R-graph_data-mining.ppt (ページ 33-40)

関連したドキュメント