図1:見かけ上の相関
www.safecom.org.au/sievx-kevin.htm
関連は必ずしも因果を意味しない
アイスクリームの売り上げと水死事故 の数の間に強い相関があっても,両者に 因果関係が認められないのは,この見か け上の相関を引き起こした熱波が隠れ た真の原因(交絡因子)であるからである.見かけ上の相関は,血圧 と給料,小学生の足の大きさと成績など,いたるところに観察される.
図2:脂肪の摂取量と癌の発生率:回帰分析の誤用
S.K. Carroll (1975). Cance Research 35, p.3379 r
ところが,見かけ上の相関かどうか,
明らかでない場合が多いことが問題 である.脂肪の摂取量 と乳癌・結腸 癌発生率
x
y
との間に強い相関が観察 されたことを根拠に,
xを
yの原因と
し,回帰分析
β εpolitedissent.com/archives/category/medicine/
回帰分析から因果推論へ
―統計的因果推論への誘い
α + +
= x
y
を行い,
因果の効果を
βで推定したくなるが,専門家には交絡因子の存在を確 信しているようである.このように,回帰分析を因果分析の手段とし て誤用されることが目に余る.問題が更に深刻なのは,仮に, が の原因であっても,
x y β
を因果効果として採用するのは不適切である.
因果律とは何であろうか
― 古代から量子力学まで
http://www.causeeffect.org/
図3:神が全ての原因であった古代
図4:ヒュームの決定論的因果論
http://www.chicoobservatory.com/
図5:神はサイコロを振り給わず
http://chaos.swarthmore.edu/
古代人にとっての,人間を含む世の中の 成り立ちは,全て神によって決定される ものなので,運命に従えばよく,因果律 に悩まされる必要はなかった.
一方,太陽系の安定性を証明したラプラ ス(1749-1827) は
,宇宙の現在は全て 過去の結果であり,また将来を完全に決 定する原因となる, とヒュームの決定 論的因果論を繰り返していた.
アインシュタインは、ラプラシアン因果 決定論を継承し,最後まで量子力学に異 議を唱え,「神はサイコロを振り給わず」
の名言を残した.しかし,不完全因果論
とりわけ統計的因果推論が実験・観察研
究において役に立っているようである.
運動意識 運動量 ダイエット効果
食事量 0.15
-0.44 0.30 0.31
統計的因果推論とは
―
哲学?数学?統計学?
図6:人口的な宇宙
http://en.wikipedia.org/wiki/Jigsaw_puzzle
さて,互いに説明可能性をもつモノ (変 数,概念)の集まりを宇宙とよぼう.2 つのパズルピースに対して,これらが隣 り合ってれば,説明可能と定義すると,
箱の中のパズルピースの集合は1つの 人工的な宇宙である.
図7:図6の人口的宇宙の理想的整列
http://www.fell2earth.com/content.php?cid=2799
どんな複雑な宇宙に対しても,
Zornの補 題により,美しく整然たる宇宙に整列可 能である.しかし,整列するアルゴリズ ムは不明である.ヒュームの決定論的因 果論から脱却し,統計的因果論へと方向 転換すれば,解決の道は開いてくれる.
図8:統計的に推定された宇宙
http://www.puzzlehouse.com/phobutterfly.htm
統計学の出番である.実験・観察データ からの不完全情報に基づいて, モノの 因果順序を統計的に推定し,因果的にあ るべき宇宙を統計的に推測していく.こ れが統計的因果推論である.
統計的因果順序:Ⅰ
―小さな宇宙
U ={
x, y, z} の話
図9:独立因果モデル
本質を見抜くために,ここでは3つのモ ノ か ら な る 単 純 な 宇 宙
U ={
x, y, z}
において,因果順序について考えよう.
まず
x,
y, の間に如何なる因果関係 も存在しない, 互いに独立な状況があろ う.この状況をばらばらに置かれている 3つの点で表し,次の式で特徴付ける.
z
¾ x ⊥ y, x ⊥ z, y ⊥ z
¾ x ⊥ y ∨ z, y ⊥ x ∨ z, z ⊥ x ∨ y
図10:因果連鎖モデル
因果連鎖モデル :次に,
xが
yの原因,
yが
zの原因(
x ; y,
y ; zと書こう)
という状況が考えられる.このとき,因 果の直感的意味から,次の3つの事項を 要請するのが自然であろう.
¾ x
も
zの原因:
x ; z¾ x
の下で,
yと
zは独立:
y ⊥ z x¾ y
の下で,
xと
zは独立:
x ⊥ z y
統計的因果順序:Ⅱ
―小さな宇宙
U ={
x, y, z} の話
図11:共通原因モデル
共通原因モデル :
xが
yと の共通原因
(
z y
x ;
, )となるときもあろう.
因果律の本来の意味から,共通原因 を 与えれば,結果同士
z x ;
x y
と は独立の筈な
ので,次が成立することを要請する.
z
¾ x
の下で、
yと
zは独立:
y ⊥ z x図12:複数原因モデル
複 数 原 因 モ デ ル : が の 原 因
( ),
x z
z
x ; y
も
zの原因(
y ; z)の
ときに当たる.これは,2つの独立な原 因
xと
yによって,結果である を支配
していることを意味する.したがって,
一方の原因を与えれば、結果は他方の原 因と独立となる状況なので,次の成立を 要請する.
z
¾ x
の下で,
yと
zは独立:
y ⊥ z x¾ y
の下で,
xと
zは独立:
x ⊥ z y図13:モノの交わり
y
と の情報の統合を考える必要があ り,これを と書き,
z
z
y ∨ y
と の交わ
りと呼ぼう.
z z z y y z
y ∨ ; , ∨ ;
の成
立を要求することは当然であろう.
図14:3点集合の冪集合のHasse Diagram
図15:束(Lattice)の例
交わりから発生する自然な順序(集合の 包含関係)をすべての交わりに対して適 用すると,ブール代数が生まれ,対応す るグラフ(図 14)はハッセ図として知 られている(
φは空集合を表している) .
プール代数は統計的因果順序を構築す るための出発点となるが,理論的展開に おいて,ブール代数を一般化した束論
(
Lattice Theory)を背景にした方が都合 が良い.束論とは,交わりなどを一般化 したプール代数と考えればよい.
http://en.wikipedia.org/wiki/Hasse_diagram
非統計的順序:束論
―プール代数から束へ
Hasse Diagram
http://en.wikipedia.org/wiki/Lattice_(order)
Cain Algebra: I
― 因果推論のための新しい統計数学の試み
図16:底をもつ束
底をもつ束:因果推論の根底には順序,非対 称性,そして確率の概念が働いている.順序 を考える出発点として,まず底
ϕをもつ束
{
x, y, z,"}
L =
を考える.底
ϕは順序の一番 低いモノなので,全てのモノの結果として解 釈される.ブール代数の場合,底
ϕは空集合
である.底の存在は因果の議論が常に意味をもつための条件である.
図17:束の直積:原始コインの形成
原始コイン(
atom coin): 次に非対称性を 論じるために,直積
L⊗L ={
Πxy x, y∈L}
を導入する.要素である
Πxyを原始コイン と呼び,我々の思考における基本単位となる.原始コイン は,非 対称性を強調して,通常 と書いたものと理解してよい.
x
Πy
(
x, y)
図18:コイン(原始コインの連結)
n n
x y x
y x
y Π Π
Π
=
Π 2 "
2 1
1
さて,有限個の原始コインを,やきとり のように繋いだもの, ,を コインと呼ぼう.束 が有限であっても,
コインは無限にあることに注意する.
n n
x y x
y x
yΠ Π
Π
=
Π 2"
2 1 1
L
Cain Algebra: II
― 確率モデルに代わる新しい概念:
Cainoid図19:Cainoid(C1-C5が満たされる束)
Cainoid
:さて,陽には出てこないが,
いよいよ 確率の概念が登場する.束
{
x, , ,"}
L = y z
の各点を確率変数(ベ
クトル)と対応させ,コインの間に 図19で示される性質が満たされる「掛け算」を規定する.ただし,
などの略記を用いている.
図20:ベイズの定理とその証明 ベイズの定理:
ベイズの定理の証明:
公理
C1-C5は,確率密度関数から導かれ
る最も基本的性質のアナローグである.
例えば, を確率密度関数
f (x), を その逆数
1/ f (y)と対応付ければ,
C5は
) ( / ) , ( )
(x y
f = f x y f y
条 件 付 密 度 関 数 の定義に対応している.これらの公理か ら,統計的因果推論を進める上での基本 的性質を誘導し,理論的展開を行なっていく.例えば,色々な場面で 重要な役割を果たすベイズの定理を,図20のように証明できる.
図21:数学的順序の埋め込み
Cain
では,元の束の順序 を1つのコ
イン恒等式 として表現でれる.
Cain Algebra: III
― 条件付独立性と見かけ上の相関
図22:条件付独立性
統計的アプローチによる因果推論の最大の 成果の1つに,条件付独立性の検証で,見 かけ上の相関の検出ができることである.
(例えば熱波)を与えたとき,
x y
(例え
ばアイスクリームの売り上げ)と
z(例え
ば水死事故の数)の相関が見かけ上の相関であることは,条件付独立 性 の成立を検証すればよい.
図23:コイン恒等式と条件付独立性 Cain algebra
では条件付独立性 を コイン恒等式 で表現し,コイ ンの演算法則に従って,因果推論に必要な様々な概念・結果がここか ら導かれる.例えば,
Cain algebraにおいて,広い意味での情報的
irrelevance