• 検索結果がありません。

統計的因果推論と因果探索

N/A
N/A
Protected

Academic year: 2021

シェア "統計的因果推論と因果探索"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

統計的因果推論と因果探索

Statistical Causal Inference and Causal Discovery

狩野 裕

1∗

宮村 理

1

Yutaka Kano

1

and Masashi Miyamura

1

1

大阪大学 大学院基礎工学研究科 数理科学領域

1

Division of Mathematical Science, Graduate School of Engineering Science

Osaka University

Abstract: Statistical methodology and its difficulty for causal inference are first reviewed in experimental, quasi-experimental or observational studies. The review includes path analysis, graphical modeling, Rubin’s counterfactual models and propensity scores. It is then studied how those statistical methods can relate with causal discovery in data mining in computational science.

因果推論は科学の基本的な道具であるから,21 世紀 になって出現した新しい話題というわけではない.しか し,因果推論は,現在,計算機科学ならびに統計科学に おいてホットな話題として認識されている.計算機科学 での観点は,言うまでもなく,大量データに基づく知識 発見としての因果関係の同定であり,計算機の発展に 帰依するものである.一方,統計科学でのポイントは, Donald Rubin らによる反事実モデル (counterfactual model) と欠測値問題 (missing data problem) の融合, 傾向スコア (propensity score) の役割の明確化,そして, Pearl1一派によるグラフィカルモデリング (graphical modeling) であろう. 筆者の個人的観察では,これらの両者間の情報交換 は十分でなく,計算機科学の分野では統計科学の最新 の成果を取り入れた議論は少なく,同様に,統計科学で の因果推論についての最近の発展は古典的な統計学の 路線上にあり,大規模データを有意義に活用した研究 成果に乏しいように思われる.それゆえ,本研究会の ようにデータマイニングと統計数理の専門家が一堂に 会して議論することはきわめて貴重な機会であり,有 益な findings が期待される. 本講演では,筆者が統計科学者であることから,ま ず,統計科学的な立場から,因果推論について議論した い.因果に関する統計的な結果を得るための古典的な 方法から近年の発展までを概観し,統計科学が統計的 因果推論について何を問題にしているのか,近年の発 ∗連絡先:大阪大学大学院基礎工学研究科数理科学領域       〒 560-8531 豊中市待兼山町 1-3        E-mail: [email protected]

1Judea Pearl は UCLA の計算機科学科に所属し人工知能 (AI)

の専門家である.しかし,彼の因果推論の議論は広い意味で統計科 学の枠組み内(もしくは十分近い近傍内)にあると考えている.一 つの理由は,彼の議論は高度に発展した計算機が存在しなくても展 開可能なことである. 展の基礎は何かを整理したい.その中で,計算機科学 の分野で有益であろう果実を指摘できれば幸いである. まず,因果推論の議論を二分する.すなわち,(i) 因 果の方向の決定,と (ii) 因果の方向を既知として,因 果の有無の確認とその大きさの正確な評価,である.一 般的には因果推論というと (i) を想起されることが多い と思われるが,実は,統計科学では (i) は非常に困難な 問題と認識されており,実際,統計科学において因果 は (ii) を指すことが多いのである.例えば,薬効の評 価では,薬の服用が原因変数でありその治癒効果が結 果変数であるから,(ii) の問題になる. 統計科学ではデータの採取の方法によって観察研究 と無作為割付け (random assignment) を伴う実験研究 とを区別する.因果について何かしら言及する経験的 研究においては実験研究が王道であって観察研究は次 点と考えられている.逆の見方をすれば,観察研究に 基づく因果推論の方法論的研究が面白いということに なる.観察研究による因果推論の具体的な問題点とし て,未観測交絡変数,サンプルセレクション,測定誤 差が認識されている. 本発表では,まず,統計科学において提案されてき たいくつかの因果推論の方法論を紹介し,それらによ る分析が,上述の3つの問題によってどのような影響 を受けるかを明示する.そして,統計科学がこれらの 問題をどのように克服しようとしているかを考察する. 最後に,計算機科学を活用したデータマイニングと因 果関係の同定について統計科学の立場からコメンテイ トしたい.

参考文献

[1] 宮川雅巳(2004).統計的因果推論.朝倉書店.

参照

関連したドキュメント

を塗っている。大粒の顔料の成分を SEM-EDS で調 査した結果、水銀 (Hg) と硫黄 (S) を検出したこと からみて水銀朱 (HgS)

これは基礎論的研究に端を発しつつ、計算機科学寄りの論理学の中で発展してきたもので ある。広義の構成主義者は、哲学思想や基礎論的な立場に縛られず、それどころかいわゆ

(2)特定死因を除去した場合の平均余命の延び

共通点が多い 2 。そのようなことを考えあわせ ると、リードの因果論は結局、・ヒュームの因果

いしかわ医療的 ケア 児支援 センターで たいせつにしていること.

ぼすことになった︒ これらいわゆる新自由主義理論は︑

これからはしっかりかもうと 思います。かむことは、そこ まで大事じゃないと思って いたけど、毒消し効果があ

都調査において、稲わら等のバイオ燃焼については、検出された元素数が少なか