九州大学学術情報リポジトリ
Kyushu University Institutional Repository
従属観測データにおける局所漸近二次構造モデルの モデル比較
江口, 翔一
https://doi.org/10.15017/1931722
出版情報:Kyushu University, 2017, 博士(数理学), 課程博士 バージョン:
権利関係:
(様式3)
氏 名 :江口 翔一
論 文 名 : Model comparison for LAQ models with dependent observations ( 従属観測データにおける局所漸近二次構造モデルのモデル比較 ) 区 分 :甲
論 文 内 容 の 要 旨
近年の計算機システムの発展と利用環境の向上は、データの収集・分析の過程を効率化・高度化 させたばかりでなく、諸科学や産業界のあらゆる分野でデータの蓄積を促進している。このように して大量に蓄積されたデータから、その背後にある自然現象や社会現象のような複雑かつ不確実な 現象を読み解くには、データから本質的な情報を抽出するための手法の開発と数理の研究が不可欠 である。特に、不確実現象の解明と予測、知識獲得のために重要な役割を果たすのが現象のモデル 化である。現象のモデル化のためには、想定・推定されたモデルのよさを何らかの基準に基づいて 評価し、適切なモデルを選択することが必要となる。これが統計的モデル評価とモデル選択の問題 である。この問題に対して、Bayesアプローチに基づく相対モデル記述評価においては、事後確率 を最大とするモデルを最適なモデルとして選択すると考えることができる。特に、事前確率が想定 したすべてのモデルに対して等しいとすると、事後確率の最大化は周辺尤度の最大化を行うことと 等価となる。したがって、周辺尤度の自然対数をとった対数周辺尤度を使いやすい統計量で近似す ることにより、古典的な Bayes 情報量規準(BIC)が導出されるが、広範な従属データモデル族に対 して統一的に適用可能な BIC 型モデル評価基準の導出に関する数学的正当性が議論されない場合 がしばしばある。本論文では、局所漸近二次構造(LAQ)を想定した下で、真の尤度とは限らないと いう広い意味での疑似対数尤度関数を扱う。漸近混合正規性やモデル誤特定、疑似最尤推定量の各 要素が異なる収束率を持つ場合も統一的に扱うことができる設定の下で、対数周辺疑似尤度の確率 展開式を陽に与え、古典的なBIC の拡張を提案する。
第2 章では、Bayes 型モデル評価基準の導出に関する背景について記述し、一般の LAQ モデル
において、適当な条件を仮定し対数周辺疑似尤度の確率展開式を陽に与える。この確率展開式の発 散項を取り出すことで、Bayes モデルに対する疑似Bayes 情報量規準(Quasi-BIC;QBIC)を提案す る。また、QBIC は補正項に観測情報量を考慮した形を用いるが、補正項として推定量の収束率を 用いて BIC 型モデル評価基準を定義することもできる。こうして古典的な BIC の適用範囲が大き く拡張され、汎用性の高いBayes型モデル比較が可能となる。さらに、提案したQBICの性質とし て、モデル選択の一致性を持つことを示す。
第3・4章では、第2章の結果に基づき、より具体的なモデルを想定した下でBIC型モデル評価 基準の導出を行う。第3章では、一種の従属型一般化線形モデルに対し、疑似対数尤度関数を用い て、モデル誤特定の場合まで視野に入れたモデル設定で、QBIC の導出に関する数学的正当性を与 える。また、これらのモデル設定の下で得られる疑似最尤推定量が持つ漸近的性質(一致性、漸近正
規性)についても言及する。さらに、提案したモデル選択基準の有効性と性質の検証のため、QBIC を用いたモデル選択のシミュレーションの結果と実データ例を提示する。
第4章では、エルゴード的拡散過程や連続セミマルチンゲールのボラティリティ推定といった高 頻度従属データモデルを対象として、QBIC の導出とその正当性を与える。また、エルゴード的拡 散過程において、拡散項とドリフト項と呼ばれる項で構成され、疑似最尤推定量が2つの収束率を 持つことを利用して、以下のような二段階のBayes型モデル評価も提案する。
(1) 拡散項のみに着目し、ドリフト項を含まない形の疑似対数尤度とそれによって定まる QBIC を用いることで、拡散パラメータの推定と拡散項の選択を行う。
(2) (1)で得た拡散パラメータの推定値と拡散項の下、ドリフトパラメータの推定とQBIC を用い
たドリフト項の選択を行う。
さらに、提案したモデル選択基準と選択手法の有効性と性質の検証のため、高頻度従属データモデ ルを用いた数値実験例を提示する。
第 5 章では、確率過程から離散観測されたような時系列データを用いた現象のモデル化を扱う。
このとき、モデル(パラメータ)の推定のために不可欠な要素がモデル時間スケールの情報である。
例えば、第4章でも扱ったエルゴード的拡散過程を仮定すると、パラメータの推定に用いられる疑 似対数尤度はモデル時間スケールの情報を含んだ形で構成され、モデル時間スケールによって推定 の結果は変化する。そこで、モデル時間スケールが未知の場合、パラメータの推定とモデル時間ス ケールの推定を考慮する必要がある。本章では、エルゴード的拡散過程を対象のモデルとして、パ ラメータとモデル時間スケールを同時に推定する手法を提案する。具体的に、疑似対数尤度に含ま れるモデル時間スケールは拡散パラメータと観測データで構成される関数で近似することができ、
この近似した関数を利用することにより、モデル時間スケールの情報に依らない疑似対数尤度を用 いたパラメータの推定が可能となる。また、モデル時間スケールを近似した関数に拡散パラメータ の推定量を代入することにより、モデル時間スケールの推定も同時に行うことができる。パラメー タの推定に加えて、モデル時間スケールが未知の場合のエルゴード的拡散過程におけるBIC型モデ ル評価基準の導出についても言及する。これは、第4章で正当性を与えたQBIC を修正した形で得 ることができる。さらに、シミュレーションと実データ例を通して、提案した推定手法とモデル選 択基準の有効性を検証する。
第6 章では、R 言語内の yuima パッケージにて作成と実装を行った関数“IC”の使用について
述べる。yuimaパッケージとは、発展途上である確率微分方程式におけるシミュレーションや推定
を可能とするパッケージである。関数“IC”は、第 4章で導出した高頻度従属データモデルにおけ るQBIC等の情報量規準を計算するための関数となっている