帰納論理とベイズ統計

(1)

帰納論理とベイズ統計

髙橋和孝

1,a) 概要：帰納推論の本性に関する議論には 2 つの異なるアプローチの仕方がある．一つは論理学的なものであり，もう一つは統計学的なものである．これまでこの 2 つのアプローチは全く異なる研究伝統に属してきたが，近年その数理的関連性に注目し，そこからより実り豊かな応用を引き出そうとする試みが現れている．本論では，こうした試みの一端を紹介し，論理と統計を結ぶアプローチがどこまで有望なものであるのかを議論する．キーワード：帰納論理、ベイズ統計

1. はじめに

1.1 論理と統計 本論は論理と統計の関係に焦点を当てる．論理的推論と統計的推論という二つの推論様式には，少なくとも形式的には明確な違いがあるように見える．論理的推論とは，前提となるいくつかの文の集まりから，結論となる文を一定の規則に基づいて導出する試みである．一方，統計的推論，すなわち推測統計学の目標とするのは，ある統計モデル（確率分布族）を仮定した上で，データを生成している母集団の性質（モデルのパラメータ）を推定／検定することにある．しかし近年，特にベイズ統計学において，論理と統計という異なる推論様式に横たわる数理的関連性に注目する研究が現れ始めている（Skyrms1996, Festa1993, 2011）．本論ではこうした試みの一端を紹介し，それがどの程度有用なもので，また，さらなる展開にとってどのような問題があるのかを論じる． 1.2 確率の主観説と論理説 本論が着目するのは統計的推論の中でも特にベイズ流のもの，すなわち今日ベイズ統計学と呼ばれているものである．これは歴史的には，デフィネッティやラムジーなどの確率の主観的解釈に由来し，サヴェッジによってその方法論的基盤が固められた統計手法である．フィッシャーらによって完成された，パラメータの値を固定的に捉える「正統な」統計手法と異なり，それを確率的に変動するもの（確率変数）として捉えるのがベイズ統計の大きな特徴である．つづいて論理学の歴史に目を転じてみると，妥当な論理的推論（演繹的推論）の形式についての研究はフレーゲ（より古くはアリストテレス）まで遡ることができる．カルナップはこれを帰納的推論にまで拡張しようと試みた．彼は ―――――――――――――――

1. School of Science, Hokkaido University, Japan a). [email protected] 確率を文と文との論理的関係とする，確率の論理的解釈に基づいて帰納論理の体系を構築した．このように両者は確率についての異なる解釈から出発した，ともに「正統」から見れば「異端」の体系として発展してきたが，近年その数理的関連性に注目が集まっている．論理と統計を結ぶこうした関連性は一体何を意味しており，我々はそこから何を引き出すべきなのか．以下では，これら二つの方法の基礎をできるだけ詳しく紹介しながら，こうした問いに対する答えを順を追って論じていきたい．

2. ベイズ統計学の基礎

本節ではまずベイズ統計学の方法について，特に後の議論で重要になる予測分布の導入を目標として紹介する．すでに述べたようにベイズ統計学の最も特徴的な事項は，統計モデルのパラメータを確率変数として考え，パラメータの確率分布とその変化を考察の対象とすることにある．いまある変数の値がパラメータで特徴付けられるある確率分布に従って生成されていると仮定しよう．すなわち我々はという統計モデルを立てるのである．もしある実現値を得たとすると，はの関数と見做すことができる．そこでこの関数をと書き，これをのもとでのの尤度関数と呼ぶことにしよう．このときを確率変数と見做し，その確率分布（事前分布）というものを考えると，それは次のベイズの定理に従って別の確率分布（事後分布）へと変化する．こうして得られた事後分布を用いることによって，我々は

(2)

パラメータの推定／検定を行うのである．例えば，事後分布で評価したの期待値はに対するひとつの点推定量を与える．次にベイズ統計学における予測の方法を見てみよう．一般に予測とは，変数について既知の実現値に基づいて，未知の実現値を推測する試みである．ベイズ統計学ではこれを，のもとでのの条件付き確率分布を用いて行う．これを予測分布と呼ぶ．予測分布は，既知のデータと未知のデータが，互いに独立で同一の確率分布に従う確率変数の実現値であるという仮定のもとで，以下のようにパラメータの事後分布を用いて展開できる．このように推定／検定そして予測の多くに積分計算が現れるのもベイズ統計学の大きな特徴である．ベイズ的予測の最も簡単なケースは，試行がベルヌーイ的である場合である．すなわち，実現値として 1（成功）か 0（失敗）という 2 値をとる離散確率変数列があり，それぞれの確率変数が互いに独立に同一の確率分布に従うという状況である．このとき，変数の和は二項分布 _{に従うことがわかる．この二項分布を尤度関数} とし，事前分布を一様分布とすると，事後分布としてベータ分布が得られる（一様分布はベータ分布の特別な場合である）．さらにここから予測分布を導くと，解析的な手段によって次のようなシンプルな表式が得られる．例えば，10 回の試行中 8 回成功というデータ（）を得たとき，11 回目の試行の結果として成功というデータ（）を得る予測確率は 3/4 となる．以上の例では，必要な積分計算が解析的に実行できるようなケースを紹介してきた．しかしながら，現在のベイズ統計学は，計算機の改良によってモンテカルロ法による数値計算が次第に浸透するに従って，その適用範囲を大きく広げている．

3. 帰納論理

素朴な意味での帰納的推論は，統計学という一つの学問分野の成立以前からなされてきたに違いない．その典型的なものは次のような形式の推論である． 2 日前，東から太陽が昇った．昨日，東から太陽が昇った．今日，東から太陽が昇った．明日，東から太陽が昇る．この結論自体に面白味があるかどうかは別にして，こうした帰納的推論すべてに共通する，何か普遍的な特徴が存在するのかどうかという問題は検討する意義がある．カルナップは文の形成規則が明確に規定された人工言語を用いてこの問題を体系的に分析した最初の人物である．本節ではカルナップの帰納論理の体系（連続体）を主にマー（Maher2004）に従いながら紹介する． 3.1 基本的枠組み 帰納論理の基本的枠組みは，確率の論理的解釈を推し進めることによって得られる．すなわち，ある帰納的推論において，その前提となっている文の連言と，その結論となっている文との論理的関係を 0 から 1 までの実数によって表現する．そしてその割当てられた実数をその帰納的推論の確率と解釈するのである．このことをもう少し形式的に展開してみよう．いま，個の個体と個の排他包括的な述語，そしてなどの論理結合子を含む人工言語を導入し，から形成されるすべての文（論理式）からなる集合をとする．例えば，やはの要素である．帰納論理において特に重要となるのは，状態記述 state description と呼ばれる形式の文である．個体の状態記述とは，個体の各々に対して述語のいずれかが付与され，これらの連言をとった文のことをいう．例えば，文は 3 個体の状態記述である．ある状態記述に対して，そこに現れる個体を任意に置換することで別の状態記述が得られるとき，2 つの状態記述は互いに同型 isomorphism であるという．以下はすべて互いに同型な状態記述である．以上の基本概念を踏まれた上で，次の公理(A1)-(A9)を満たすような写像を帰納的確率 inductive probability と呼ぶことにする．（これはマーの表現である．カルナップの表現は確証度 degree of confirmation）を任意の文，を任意の互いに同型な状態記述と

(3)

するとき， (A1) (A2) (A3) (A4) (A5) (A6) (A7) (A8) (A9) はに含まれるの個数にのみ依存する．においてが前提，が結論に対応付けられる．公理から，，という関係が得られるが，これは帰納論理の体系が演繹論理の特殊な場合として理解できることを示している．これにより，本節の冒頭で挙げた帰納的推論の確率（帰納的確率）は，形式的にの値を評価することで得られる．この値が 1 に近いほどその帰納的推論はより信頼できるということになる．すなわち，が最も信頼できる場合であり，それは演繹的推論（論理的に妥当な推論）に限られる．またが最も信頼できない場合であり，それは論理的に矛盾している（前提を真としたとき結論が必ず偽になる）ときに限られる．ここでが「帰納的」な「確率」である所以を説明しよう．前者は(A8)に，後者は(A1)-(A5)に関わる．まずが確率である理由は，測度論的確率論の公理と(A1)-(A5)の同値性にある．すなわち，標準的な確率論の公理によって得られるものと同様な関係が(A1)-(A5)によっても得られる．例えば，標準的な確率論の公理からという関係が得られるが，これと同様の内容を持つ関係として(A3) から直接にが得られる．が帰納的である理由は，それが(A8)を満たすということに関わる．そこでこの公理の持つ意味を詳しく説明しよう． (A8)においてとは，からまでの個体と述語を含む任意の文とする．例えば，とすると，がの一つの候補となる．よってこの場合には(A8)は次のことを表している．つまり，前提において述語によって指示される性質を有する個体の数が多ければ多いほど，結論において別のある個体がその性質を有するという推論はより信頼できるものになる．これを本節冒頭の例に即して言うと，明日も東から太陽が昇るという結論は，昨日までのデータよりも 2 日前まで，2 日前までのデータよりも 3 日前まで遡る方がより信頼できる，すなわち強い帰納的推論の結論であるということである．このようにデータが増大ごとに結論の信頼性が増大するという想定は，我々が帰納的推論を行う上で最も根底に置いているものではないだろうか．この意味でを特徴付ける(A8)はカルナップの帰納論理の体系を「帰納」論理たらしめる最も重要な公理であると言えるだろう． 3.2 連続体 帰納的推論のなかで最も典型的であるものは，上述ののような個の個体の性質を前提として番目の個体の性質を導出する型のもの，すなわち枚挙的帰納法であろう．この特別な場合に関しては， (A1)-(A9)を満たすものとしては次のようなシンプルな関数型になることがわかっている．左辺においてとは，が肯定を，が否定を表す記号であり，各々の項でそのいずれかをとるものとする．右辺のはの前提に肯定（）が何個含まれているのかを表し，はごとに決まるパラメータ，は単一のパラメータを表す．帰納論理のなかでもこの簡単な場合（枚挙的帰納推論の帰納確率）を特に連続体 continuum という．連続体に現れる 2 つのパラメータとにはそれぞれ固有の意味がある．まずの意味について説明しよう．いま仮に前提が何もない場合，すなわち我々が利用可能な情報を何も持たない場合を考える．これをと解釈すると，が成立することがわかる．よってとは，無前提（無情報）において，ある個体が述語によって指示される性質を有する帰納的確率を表していると解釈できる．ではその値を具体的に決めるにはどのようにすればよいであろうか．カルナップはここで述語の論理的空間と呼ばれるものを導入する．色を例にこれを説明しよう．色を表現する述語として「赤」「黄」「緑」「青」という 4 つのものを導入し，それぞれをによって表すとしよう．このとき問題は各が占める論理的空間の大きさをどのように与えたらよいのかということである．ここで注目したいのは，色，すなわち可視光は電磁波のある特定の波長領域（約 400nm-700nm）に対応しているという物理学的知見である．これを認めるとすると，（赤）という述語の論理的空間の大きさとは，可視光の全領域に占める「赤」という語が支持する領域として解釈される．他の述語についても同様である．このとき各述語の論理的空間の境界をどこにとるかについては多少の恣意性を免れないが，その境界が我々の言語的規約といて事前に共有されていれば問題はない．要するに，とは我々の言語的規約として設定されるの論理的空間の大きさであるという意味付けがなされるのである．次にの意味について説明する．いま仮にとすると

(4)

となり，これは全個体のなかで述語によって指示される性質を有する個体の数，すなわち相対度数（頻度）を表す．またとすると，はに収束する．このことからの意味を次のように述べることができる．の値が小さければ小さいほど（0 に近いほど）は経験的要因（アポステリオリ性）が重視され，の値が多きければ大きいほどは言語的要因（アプリオリ性）が重視される．すなわちというパラメータの導入によって，体系の経験依存性の度合いを連続的に調整することができるのである．以上で，カルナップによって展開された帰納論理の体系，特に連続体の枠組みの説明を終える．連続体は主に枚挙的帰納法に適用される論理であったが，カルナップ自身やそれ以降の人物，例えばヒンティッカ，ニイニルオトなどによって，アナロジー（類比）などのより広い意味での帰納的推論に対しても適用可能な帰納論理の開発が試みられた．また近年では，多項述語を含む言語への一般化を図る試みもある．しかし，本論に述べるテーマのエッセンスはすべて連続体のなかに含まれているので，こうした試みの紹介は省かせていただく．

4. 2 つの体系の数理的関連性

前節までは，異なる確率解釈（主観説と論理説）から出発して，一方では「統計学的」手法であるベイズ統計学の枠組みを，他方では「論理学的」手法である帰納論理の枠組みを概説してきた．この 2 領域は今日では全く異なった学問領域に属しているが，どちらも確率の概念を用いて展開される体系であること以上の類似性を備えている．ベイズ統計学の興隆に伴って，こうした類似性に着目する議論（Skyrms1996），さらにはこれを利用してベイズ統計学の内在的問題に積極的に解法を与えようとする議論（Festa1993,2011）が提出されている．本節では，ベイズ統計と帰納論理に存す数理的関連性からその類似性について論じたい．いま，あるフェアでないコインを投じて表が出るか裏が出るかを，そのコインを回投じたときの結果（表が出た回数）に基づいて予測，ないし，推論するという状況を考える．まずは，この問題をベイズ統計学に基づいて分析してみよう．コインを 1 回投じたときに可能な結果は，表か裏かの 2 通りしかないので，表が出る確率をとし，この確率が試行を通して不変であると仮定する．すると，回のコイントスで表が出る回数は二項分布に従うことがわかる．我々の目標は，実際に表が何回出たかに基づいて，回目のトスで表が出ることを予測確率によって予測することにある．2 節での議論により，尤度関数が二項分布で，さらに事前分布として一様分布をとった場合に，表が出ることの予測確率は，でとして次のようになる．これに従うと，例えば 10 回のコイントスで 8 回表が出たときに， 11 回目のトスで表が出るという予測確率は，よりと求めることができる．表が出た頻度が同じであっても，コインを投じた総回数が異なれば予測確率は異なった値となる．例えば，100 回のコイントスで 80 回表が出たとき，より，頻度は先の例と同一であるが，予測確率はとなり，より頻度に近い値となる．これはデータが増大することによって事前情報のウェイトが相対的に減少することによって生じる．次に同じ問題を帰納論理に基づいて分析してみよう．まず回のコイントスの結果を前提，回目のコイントスの結果を結論とする推論を立ててみると次のようになる． 1 回目のコイントスの結果は表／裏であった． 2 回目のコイントスの結果は表／裏であった． … n 回目のコイントスの結果は表／裏であった． n+1 回目のコイントスの結果は表／裏である．この推論を人工言語に翻訳する．回目のコイントスを個体によって，表，裏という述語をそれぞれによって表現しよう．すると上の推論は枚挙的帰納法であるから，帰納的確率は連続体によって与えられる．いま，表，裏という述語の論理的空間は互いに等しいとしてよいであろうからが成り立つ．すると 10 回目のコイントスで 8 回表が出たという前提から 11 回目のコイントスで表が出ると結論付けるような推論の帰納的確率は，より，だけの関数となる．の場合，帰納的確率は予測確率に一致することがわかる．一般にベイズ的方法における予測確率は事前分布の取り方に応じて異なった値になる．試行がベルヌーイ的であれ

(5)

ば，事前分布をベータ分布に取る限り，連続体との間に常に対応関係が存在することが示されている（Skyrms1996, Festa1993, 2011）．ベイズ統計の予測分布と帰納論理の連続体の間に横たわるこうした数理的関連性を応用して，フェスタらはベイズ統計の事前分布を最適化する方法を提案している．

5. 論理と統計の類似と相違

これまでは論理と統計の関係を，確率の論理説に起源を置く帰納論理と主観説に起源を置くベイズ統計の数理的関連性に注目して論じてきた．では両者の間に数理的関連性を超えた概念的関連性というべきものは存在するのであろうか．本節ではまず，論理と統計に横たわる相違に注目し，そのギャップを徐々に埋めていくという形で，両者の可能な限りの歩み寄りを論じてみたい．まず注目したい相違は，統計学は実際の統計的推論の方法を提供している一方で，帰納論理は実際の帰納的推論の方法を何ら与えていないように思われる点である．これはベイズ統計が現実に実用化され始めているのに対して，帰納論理がそれに程遠いという事実に現れている．では帰納論理を実際の帰納的推論に応用することはいかにして達成できるのであろうか．帰納論理の目標は文と文の論理的関係を確率によって与えることにあった．確率を計算することによって推論の信頼性を評価することができる．しかし実際の場面で我々が知りたいのは，ある結論を既知とした推論がどれほど信頼できるかではなく，結論そのものが何であるのかという点であろう．これを可能にするため，著者はカルナップ以来の帰納論理の体系に，次のような原則を付与したい．帰納的確率最大の原則前提となる任意の文に対して，結論は以下で与えられる．この原則をコイントスの例に適用してみよう．例えば，5 回のコイントスについての前提 1 回目のコイントスの結果は表であった． 2 回目のコイントスの結果は表であった． 3 回目のコイントスの結果は表であった． 4 回目のコイントスの結果は裏であった． 5 回目のコイントスの結果は表であった．から 6 回目のコイントスの結果についてどのような結論が得られるかという問題を考えよう．人工言語に翻訳すると，この前提はと表現できる．次にこれに対する帰納的確率をいろいろな文に対して計算したい．そこでとして連続体(2)を用いると，帰納的確率最大の原則により，結論は，すなわち「6 回目のコイントスの結果は表である」という結論が得られた．この原則は連続体に限らず，アナロジーを含む一般の帰納的推論や多項述語を含む文に対してもそのまま適用できる．帰納的確率最大の原則は，前提から結論を導く方法論としての帰納論理の解釈を可能にする．統計的推論において，帰納的推論と最も結び付きが深いと思われるのは統計的予測である．すでに述べたように，予測とは既知のデータに基づいて未知のデータを推測する手法である．これはオーソドックスには次のような流れで行われる．まず，既知のデータに対して，統計モデル（確率分布族）を立て，パラメータの推定／検定を行い，そのデータを生成しているところの確率分布を推測する．そしてこの確率分布を用いて，未知のデータについてその値の発生確率を得る．ベイズ統計においてはパラメータそのものが確率変数と見做されるので，各パラメータに対応する確率分布もまたそれ自体確率的に変動する．よって，未知のデータの予測は，ある確率分布の下でのデータの発生確率をその確率分布の確率で重み付けることによって得られる．こうしてなされたベイズ的な予測において，我々はある一定の条件の下で連続体と数学的に同一な結果が得られることを見てきた．今や我々は連続体（枚挙的帰納法）とベイズ的予測の間に，一方では文から文の導出，他方ではデータからデータの予測という平行関係を読み取ることができるであろう．論理：文文統計：データデータしかしこれは同時に論理と統計の決定的な違いを浮き彫りにしている。なぜなら，論理に関わるものとしての文と統計に関わるものとしてのデータとは互いに交換可能な概念であるとは思われないからである．論理においては，前提となる文は所与とされ，結論の信頼性は専ら推論の信頼性に存する．しかし，統計においてデータとは真なる確率分布によって生成されるもの，すなわち確率変数である．予測の信頼性はデータの背後にある確率分布としてどのような関数型を想定するか，つまり統計モデルの選択の妥当性に存する．論理は「推論形式」に焦点を当てるのに対して，統計は「モデル」に焦点を当てる．論理は文の背後に何らかの実体を想定しないが，統計はデータの背後にそれ

(6)

を生成している実体の存在を想定する．論理と比較した統計の有用性は，その手法がこのような強い仮定の上に成り立っていることにあるのである．以上のように，論理と統計の間にはある種の平行関係がある一方で，両者を完全に同一視することはできないことがわかった．我々は両者の相違を正しく見極めたうえで，論理と統計の相補的な関係を構築していかなければならない．

6. 結び

本論では帰納論理とベイズ統計の関係に焦点を当ててきた．枚挙的帰納法とベイズ的予測の間に数理的関連があることを確認し，さらに概念的にどこまで接近できるかという問題を検討した．帰納論理では，前提となる文から結論となる文の導出を帰納的確率の評価によって行う．一方，ベイズ統計では，既知のデータに基づいた未知のデータの予測を予測確率の評価によって行う．さらに帰納確的率と予測確率はある一定の条件の下では数学的に同一の値を取ることがわかる．しかし論理と統計には，文やデータの背後にある種の実体の存在を想定するのかどうかという点に決定的な違いがある．論理において重要なのは文の真偽とは独立な「推論形式」であるが，統計において重要なのはデータ生成に関わる「モデル」である．我々は論理と統計のこうした違いを十分に理解した上で，両者の相補的関係を目指さねばならない．

参考文献

Carnap, R. (1971). ‘A Basic System of Inductive Logic, Part I,’ In Carnap, R. and Jeffrey, R. C. (eds.) Studies in Inductive Logic and Probability, Volume I. University of California Press. Carnap, R. (1980). ‘A Basic System of Inductive Logic, Part II,’

In Carnap, R. and Jeffrey, R. C. (eds.) Studies in Inductive Logic and Probability, Volume II. University of California Press. Festa, R. (1993). Optimum Inductive Methods. Kluwer Academic

Publishers.

Festa, R. (2011). ‘Bayesian Inductive Logic, Verisimilitude, and Statistics,’ In Bandyopadhyay, P. S. and Forster, M. R. (eds.) Handbook of the Philosophy of Science. Volume 7: Philosophy of Statistics. Elsevier B. V.

Maher, P. (2004). ‘Probability captures the logic of scientific confirmation,’ In Hitchcock, C. (ed.) Contemporary Debates in Philosophy of Science. Blackwell.

Skyrms, B. (1996). ‘Carnapian inductive logic and Bayesian statistics,’ Statistics, Probability and Theory 30: 321-336.

帰納論理とベイズ統計