• 検索結果がありません。

回帰分析から因果推論へ

N/A
N/A
Protected

Academic year: 2021

シェア "回帰分析から因果推論へ"

Copied!
9
0
0

読み込み中.... (全文を見る)

全文

(1)

1:見かけ上の相関

     

www.safecom.org.au/sievx-kevin.htm

関連は必ずしも因果を意味しない 

アイスクリームの売り上げと水死事故 の数の間に強い相関があっても,両者に 因果関係が認められないのは,この見か け上の相関を引き起こした熱波が隠れ  た真の原因(交絡因子)であるからである.見かけ上の相関は,血圧 と給料,小学生の足の大きさと成績など,いたるところに観察される.

図2:脂肪の摂取量と癌の発生率:回帰分析の誤用

S.K. Carroll (1975). Cance Research 35, p.3379 r

   

ところが,見かけ上の相関かどうか,

明らかでない場合が多いことが問題 である.脂肪の摂取量 と乳癌・結腸 癌発生率

x

y

との間に強い相関が観察 されたことを根拠に,

x

y

の原因と

し,回帰分析

β ε

politedissent.com/archives/category/medicine/

回帰分析から因果推論へ 

―統計的因果推論への誘い 

α + +

= x

y

を行い,

因果の効果を

β

で推定したくなるが,専門家には交絡因子の存在を確 信しているようである.このように,回帰分析を因果分析の手段とし て誤用されることが目に余る.問題が更に深刻なのは,仮に, が の原因であっても,

x y β

を因果効果として採用するのは不適切である.

(2)

因果律とは何であろうか 

―  古代から量子力学まで

http://www.causeeffect.org/

図3:神が全ての原因であった古代

図4:ヒュームの決定論的因果論 

http://www.chicoobservatory.com/

図5:神はサイコロを振り給わず

http://chaos.swarthmore.edu/

古代人にとっての,人間を含む世の中の 成り立ちは,全て神によって決定される ものなので,運命に従えばよく,因果律 に悩まされる必要はなかった. 

             

一方,太陽系の安定性を証明したラプラ ス(1749-1827) は

宇宙の現在は全て 過去の結果であり,また将来を完全に決 定する原因となる, とヒュームの決定 論的因果論を繰り返していた.

         

アインシュタインは、ラプラシアン因果 決定論を継承し,最後まで量子力学に異 議を唱え,「神はサイコロを振り給わず」

の名言を残した.しかし,不完全因果論

とりわけ統計的因果推論が実験・観察研

究において役に立っているようである.

(3)

運動意識  運動量 ダイエット効果

食事量 0.15

-0.44 0.30 0.31

統計的因果推論とは 

哲学?数学?統計学?

図6:人口的な宇宙

http://en.wikipedia.org/wiki/Jigsaw_puzzle

さて,互いに説明可能性をもつモノ (変 数,概念)の集まりを宇宙とよぼう.2 つのパズルピースに対して,これらが隣 り合ってれば,説明可能と定義すると,

箱の中のパズルピースの集合は1つの 人工的な宇宙である. 

図7:図6の人口的宇宙の理想的整列 

http://www.fell2earth.com/content.php?cid=2799

どんな複雑な宇宙に対しても,

Zorn

の補 題により,美しく整然たる宇宙に整列可 能である.しかし,整列するアルゴリズ ムは不明である.ヒュームの決定論的因 果論から脱却し,統計的因果論へと方向 転換すれば,解決の道は開いてくれる.

図8:統計的に推定された宇宙

http://www.puzzlehouse.com/phobutterfly.htm

統計学の出番である.実験・観察データ からの不完全情報に基づいて, モノの 因果順序を統計的に推定し,因果的にあ るべき宇宙を統計的に推測していく.こ れが統計的因果推論である.

(4)

   

統計的因果順序:Ⅰ 

―小さな宇宙

U =

{

x, y, z

} の話

図9:独立因果モデル

本質を見抜くために,ここでは3つのモ ノ か ら な る 単 純 な 宇 宙  

U =

{

x, y, z

}

において,因果順序について考えよう.

まず

x

,

y

, の間に如何なる因果関係 も存在しない, 互いに独立な状況があろ う.この状況をばらばらに置かれている 3つの点で表し,次の式で特徴付ける.

z

¾ x y, x z, y z

 

¾ x y z, y x z, z x y

 

図10:因果連鎖モデル 

因果連鎖モデル :次に,

x

y

の原因,

y

z

の原因(

x ; y

,

y ; z

と書こう)

という状況が考えられる.このとき,因 果の直感的意味から,次の3つの事項を 要請するのが自然であろう. 

¾ x

z

の原因:

x ; z

 

¾ x

の下で, 

y

z

は独立:

y z x

 

¾ y

の下で,

x

z

は独立:

x z y

 

(5)

 

統計的因果順序:Ⅱ 

―小さな宇宙

U =

{

x, y, z

} の話

図11:共通原因モデル

共通原因モデル :

x

y

の共通原因

z y

x ;

, )となるときもあろう.

因果律の本来の意味から,共通原因 を 与えれば,結果同士

z x ;

x y

は独立の筈な

ので,次が成立することを要請する. 

z

¾ x

の下で、

y

z

は独立:

y z x

 

図12:複数原因モデル

複 数 原 因 モ デ ル : が の 原 因

( ),

x z

z

x ; y

z

の原因(

y ; z

)の

ときに当たる.これは,2つの独立な原 因

x

y

によって,結果である を支配

していることを意味する.したがって,

一方の原因を与えれば、結果は他方の原 因と独立となる状況なので,次の成立を 要請する. 

z

¾ x

の下で, 

y

z

は独立:

y z x

 

¾ y

の下で,

x

z

は独立:

x z y

 

(6)

図13:モノの交わり

y

の情報の統合を考える必要があ り,これを と書き,

z

z

y y

の交わ

りと呼ぼう.

z z z y y z

y ; , ;

の成

立を要求することは当然であろう. 

図14:3点集合の冪集合のHasse Diagram

図15:束(Lattice)の例

交わりから発生する自然な順序(集合の 包含関係)をすべての交わりに対して適 用すると,ブール代数が生まれ,対応す るグラフ(図 14)はハッセ図として知 られている(

φ

は空集合を表している) .  

プール代数は統計的因果順序を構築す るための出発点となるが,理論的展開に おいて,ブール代数を一般化した束論

Lattice Theory

)を背景にした方が都合 が良い.束論とは,交わりなどを一般化 したプール代数と考えればよい. 

http://en.wikipedia.org/wiki/Hasse_diagram

非統計的順序:束論 

―プール代数から束へ

Hasse Diagram

http://en.wikipedia.org/wiki/Lattice_(order)

(7)

Cain Algebra: I

― 因果推論のための新しい統計数学の試み

16:底をもつ束

 

底をもつ束:因果推論の根底には順序,非対 称性,そして確率の概念が働いている.順序 を考える出発点として,まず底

ϕ

をもつ束

{

x, y, z,"

}

L =

を考える.底

ϕ

は順序の一番 低いモノなので,全てのモノの結果として解 釈される.ブール代数の場合,底

ϕ

は空集合

である.底の存在は因果の議論が常に意味をもつための条件である.

17:束の直積:原始コインの形成

     

   

原始コイン(

atom coin

): 次に非対称性を 論じるために,直積

LL =

{

Πxy x, yL

}

を導入する.要素である

Πxy

を原始コイン と呼び,我々の思考における基本単位となる.原始コイン は,非 対称性を強調して,通常 と書いたものと理解してよい. 

x

Πy

(

x, y

)

図18:コイン(原始コインの連結)

n n

x y x

y x

y Π Π

Π

=

Π 2 "

2 1

1

さて,有限個の原始コインを,やきとり のように繋いだもの, ,を コインと呼ぼう.束 が有限であっても,

コインは無限にあることに注意する. 

n n

x y x

y x

yΠ Π

Π

=

Π 2"

2 1 1

L

(8)

Cain Algebra: II

― 確率モデルに代わる新しい概念:

Cainoid

図19:Cainoid(C1-C5が満たされる束)

Cainoid

:さて,陽には出てこないが,

いよいよ 確率の概念が登場する.束

{

x, , ,"

}

L = y z

の各点を確率変数(ベ

クトル)と対応させ,コインの間に  図19で示される性質が満たされる「掛け算」を規定する.ただし,

などの略記を用いている. 

図20:ベイズの定理とその証明 ベイズの定理: 

ベイズの定理の証明: 

公理

C1-C5

は,確率密度関数から導かれ

る最も基本的性質のアナローグである.

例えば, を確率密度関数

f (x)

その逆数

1/ f (y)

と対応付ければ,

C5

) ( / ) , ( )

(x y

f = f x y f y

条 件 付 密 度 関 数 の定義に対応している.これらの公理か ら,統計的因果推論を進める上での基本  的性質を誘導し,理論的展開を行なっていく.例えば,色々な場面で 重要な役割を果たすベイズの定理を,図20のように証明できる. 

図21:数学的順序の埋め込み

     

   

Cain

では,元の束の順序 を1つのコ

イン恒等式 として表現でれる. 

(9)

Cain Algebra: III

― 条件付独立性と見かけ上の相関

図22:条件付独立性

統計的アプローチによる因果推論の最大の 成果の1つに,条件付独立性の検証で,見 かけ上の相関の検出ができることである.

(例えば熱波)を与えたとき,

x y

(例え

ばアイスクリームの売り上げ)と

z

(例え 

ば水死事故の数)の相関が見かけ上の相関であることは,条件付独立 性 の成立を検証すればよい.  

 

図23:コイン恒等式と条件付独立性  Cain algebra

では条件付独立性 を コイン恒等式  で表現し,コイ  ンの演算法則に従って,因果推論に必要な様々な概念・結果がここか ら導かれる.例えば,

Cain algebra

において,広い意味での情報的

irrelevance

を議論するための演繹的推理体系である,次の

separoid

公理

P1-P5

が満たされていることが証明できる. 

 

図 1:見かけ上の相関        www.safecom.org.au/sievx-kevin.htm  関連は必ずしも因果を意味しない  アイスクリームの売り上げと水死事故の数の間に強い相関があっても,両者に 因果関係が認められないのは,この見か け上の相関を引き起こした熱波が隠れ  た真の原因(交絡因子)であるからである.見かけ上の相関は,血圧 と給料,小学生の足の大きさと成績など,いたるところに観察される. 図2:脂肪の摂取量と癌の発生率:回帰分析の誤用

参照

関連したドキュメント

そのような発話を整合的に理解し、受け入れようとするなら、そこに何ら

した宇宙を持つ人間である。他人からの拘束的規定を受けていない人Ⅲ1であ

特に, “宇宙際 Teichm¨ uller 理論において遠 アーベル幾何学がどのような形で用いられるか ”, “ ある Diophantus 幾何学的帰結を得る

点から見たときに、 債務者に、 複数債権者の有する債権額を考慮することなく弁済することを可能にしているものとしては、

しかしながら、世の中には相当情報がはんらんしておりまして、中には怪しいような情 報もあります。先ほど芳住先生からお話があったのは

としても極少数である︒そしてこのような区分は困難で相対的かつ不明確な区分となりがちである︒したがってその

○安井会長 ありがとうございました。.

※1 各種宇宙船や船外活動時に着用する宇宙服サイズの制約から、担当する宇宙飛行士には