I.実在現象の定式化 実在の現象を数学として定式化することは数 学以前の段階であるが,これを考えることは応 用にとって重要である。定式化に当たっては抽 象が行われ,現象からあるルールに従うモデル を作りだす。私の取り組んでいる極値問題では 従来から河川の氾濫や高潮など水に関する現象 を偶然によるものととらえ確率変数を用いてモ デル化してきた。ここで確率を扱う際には独立 性という概念が重要になる。これらの概念を説 明したうえで極値問題を定式化する。 I.1 抽象しモデル化する 現象には様々な側面があるが,その中で限ら れた少数のものだけに注目し他は捨てる抽象を 行うことで様々なことが可能になる。ここから ある仮定を持ったモデルを作り,そのモデルに ついて演繹的な考察を行う。 水に関する現象について今回は統計の方法に より水の高さを全くの偶然によるものとみる。 これは相当に乱暴な抽象である。水の現象を捉 えるのに流体としての側面に注目したり潮の干 満に注目したりする方法もあるだろう。これら は物理的なモデルと言える。もちろんそれを考 えるのにも意味があるが,今回は偶然による水 の高さとして扱いたいと言うのがモデルを使う ということである。 モデル化をするときには多少の無理があって も単純でわかりやすいモデルの方がよい。水の 高さは後述する独立で同分布な確率変数として モデル化する。まだ独立について詳しいことを 述べていないがこれはそれなりにきつい仮定で 必ずしも成立するかはわからない。だがこの単 純化によって実際に問題を解くことが可能にな る。逆に言えばこれがないと問題がほとんど解 けない。とりあえず解けるところを考え,その 後をどうするか考えるのもひとつの見識だと 思う。 単純でわかりやすいモデルには汎用性がある のもよい点と言える。極値理論はこのような洪 水の問題と深く関わってきたが,現在は気象 学・建築工学・工業製品の信頼性解析・人間の 寿命・保険・金融工学など様々な応用がある。 これは分野個別の事情を捨象して抽象化し,さ
極値理論・偶然現象の最大値の挙動を通して見る数学
西 郷 達 彦
山梨大学医学工学総合研究部社会医学講座 要 旨:編集者から研究紹介のご依頼があったが,私の専門は数学の確率論でその論文形態のもの を医学を専門とする本雑誌にそのまま提出するのは適当でないと考える。そこで私の研究テーマで ある極値理論すなわち偶然の値の最大値の挙動に関する研究の概要を紹介しながら,そこに現れる 数学の発想を応用との関係を意識しつつ記述することを図った。記述の順としては取り組んでいる 分野について,まず実在の現象を数学にすること,次に数学としての展開,最後に私自身が行って いる研究とする。 キーワード 極値理論総 説
〒 409-3898 山梨県中央市下河東 1110 番地 受付:2013 年 3 月 29 日 受理:2013 年 5 月 30 日らに単純でわかりやすいモデルであることから 応用が可能になったと言える。 I.2 確率変数と分布 偶然によって決まる量を数学的に扱う際に用 いられるのが確率変数である。ここではまず確 率変数の定義について述べ,それからその性質 を記述するのに重要な分布について触れる。 数学では必ず定義があり,確率変数であれば その定義を満たすし,逆に定義を満たすものは それが何であっても,例え猫であっても確率変 数となる。この点は完全な約束事で個々の現象 についての事情が入る余地はない。ただどんな かってな約束事でもしてよいかといえば,して も構わないがあまりに数学なり他の学問の要請 から外れた定義では有用性がなくなってしま う。定義を行うときにはそれをする動機や合理 性があり,それに基づいて定義をする。 確率変数はある種の関数と考える。変数が偶 然によって決まるというのは,偶然によって出 来事が起こりその出来事によって値が決まると 考えられ,一種の関数と言える。この関数があ まりにもひねくれた性質で数学が展開できなく なるのを避けるため,詳しくは書かないが可測 性とよばれる合理的な仮定を置く。 確率変数は出来事ω の関数として X(ω) など と書く。関数であるがふつうの f, g などでなく, 大文字の X, Y, Z 等で表わし,また偶然による 出来事をω で表すため上記のようになる。ふ つうの関数が実数 x が決まるとそれに対応して 実数 f(x) が決まるように,確率変数は出来事ω が決まるとそれに対応して実数 X(ω) がきまる。 自変数 x の取る値の集合全体を実数 R とし区 間 [a, b] などを考えるように,出来事ω の取る 集合全体を全事象Ω と書きその部分集合を事 象 A, B などと書く。そこで f : R → R と同様に X: Ω → R などと書く。 例としては宝くじであれば全事象は一つには Ω = {1 等,1 等の前後賞,1 等の組違い賞,2 等,3 等,4 等,5 等,6 等,はずれ } ととるこ とができる。そこで賞金は確率変数と見ること ができるので,X(1 等)= 4 億,X(1 等の前後 賞)= 1 億,...X(6 等)= 300,X(はずれ)= 0(第 633 回全国自治宝くじ)などとなる。ここで Z = X − 300 とすればこれも偶然の出来事による 関数なので確率変数であり,1 枚買ったときの 儲けという意味が付く。また別の例としてサイ コロの目であれば全事象はやはり一つには Ω′ = { 赤い点 1 つ,黒い点 2 つ,黒い点 3 つ,..., 黒い点 6 つ } ととれ,目の数を確率変数として Y(赤い点 1 つ)= 1,...,Y(黒い点 6 つ)= 6 など となる。 確率変数を扱うには分布を用いる。分布とは 実数の集合を入力として確率が出力される一種 の関数である。ある集合に対し確率変数の取る 値がその集合の範囲に入る確率を対応させる。 例えばさきほどのサイコロの例の場合,確率を P と書いて公平なサイコロであれば集合 {1, 2}, {2, 4, 6} に対し,P(Y∈{1, 2}) = 13,P(Y∈{2, 4, 6}) = 12などとなる。前者はサイコロの目が 1 か 2 の確率は13という意味だし,後者はサイコ ロの目が偶数になるのは12の意味となる。一般 には確率変数 X の分布は実数の部分集合 A を 与えたとき, P(X ∈ A) となり,これを μ(A) = P ◦ X− 1(A) = P (X ∈ A) などと表したりする。 ここで確率変数 X の関数の逆を考えることで, ある実現値の集合から出来事ω の集合である 事象を作り,その事象に何らかの確率 P を導 入することで分布を作る。実現値の集合とそれ をとる確率を間の事象を飛び越してつなげて いる。 最後に複数の確率変数の分布が同じというこ とは対応する確率変数が全く一致するわけで ないことを付け加える。確率変数 X1, X2があっ たときに,分布が同じというのは常に X1(ω) = X2(ω) となることではなく,上の意味での分布 だけ同じということである。例えば表裏が同様 とみなせるコイン 10 枚を投げる試行によって, 表の枚数 X1と裏の枚数 X2は必ずしも一致しな いが,分布は同じと言える。
I.3 独立性 複数の確率変数があったときそれぞれバラバ ラに扱うために独立性が必要となる。複数の事 象あるいは複数の確率変数を同時に扱うのは難 しいが,バラバラに扱えれば解析は容易になる。 ここに確率論で重要な独立性が導入される。確 率論は一般に解析学の言葉で記述され解析学の 一部ともみなされるが,この独立性は特別な概 念である。事象が独立であるとはどういうこと か,確率変数の独立,そして応用に当たっての 注意の順で説明する。 複数の事象をバラバラに考えるためにはそれ ぞれの事象が他に影響を与えないことが必要と なる。影響を与えないとき一つの事象の情報を 得ても,他の事象の情報は得られない。この ように A,B なる事象すなわち出来事の集合が あったとき,A が起こったという情報を得ても B について起こるか起こらないか確率がなんら 変わらないとき,事象 A,B は独立と言う。例 えば公平なサイコロを 1 個振った偶然の結果を 考えるとき,A:2 以下である事象,B:5 以上 である事象,C:偶数である事象とすれば,C であることが分かったからと言って,A や B で あることの確率は13のまま変わらない。これか ら A と C あるいは B と C は独立と言える。だ が A であることが分かれば B ではあり得ずそ の確率は 0 となり,情報が得られているので A と B は独立ではない。 確率変数でもやはりバラバラに考えるため独 立性が導入される。確率変数の独立は事象の独 立に帰着し,確率変数同士で一方の情報がもう 一方に影響を与えずバラバラになることであ る。確率変数の独立はその実現値の集合を考え ることで前の事象の独立に帰着する。確率変 数 X,Y に対して実現値の集合 I1,I2を与える と {ω|X(ω) ∈ I1},{ω|Y(ω) ∈ I2} は事象となる。 どんなかってな実数の集合 I1,I2を与えても両 者が事象として独立なら,その二つの確率変数 は独立とする。このとき一方がある値をとった と言う情報が,もう一方にとってなんらの情報 になってないと言える。 応用に当たってこの独立の仮定が置かれるこ とが多いが,悩ましい点もある。前に独立性が あると解析が容易になるといったが,実はそう でないと難しくてほとんど手出しできない場合 が多い。世の中の現象から作る確率変数が独立 とは言い切れないのに,この仮定を置かざるを 得ない。この点を統計学について見ていこう。 ふだん統計を使う際にも独立であることは意 識しないまま縦横に使っている。一部だけを取 り出して調べ全体の結論が言えるのは,全体か ら無作為に偏らず標本を取りだしたとみなすか らである。ここで標本の特性値を測るとき,偶 然により標本抽出されているので確率変数と言 える。無作為抽出とはこの確率変数が独立で同 じ分布に従うという仮定を置いたことになる。 世論調査などの時に全くの無作為に調査対象を 選ぶからそれが全体の代表と見なせるのであっ て,もし知り合いからさらに知り合いなどとた どったら同質の人が多くなってしまうだろう。 いろいろな応用研究において実は無作為では なくつまり独立でない確率変数に独立であるこ とを前提とした理論を使っているのが現状であ る。独立でない場合にはあまりにも議論が煩雑 になりしかもまともな結果が言えないので致し 方ないところがある。独立を前提とした議論を 用いる際に,独立かどうかデータから判断する 検定もあるが,これは不十分なものであり参考 程度にしかならない。実験や調査のデザインの 段階で十分に独立と見なせるものであればよい が,その他は要注意の結論となる。 I.4 極値問題とは 極値問題は独立な確率変数の列 X1, X2, ..., Xn について最大値の挙動がどうなるかを調べる理 論である。毎月あるいは毎年の河川や高潮の高 さを独立な確率変数してモデル化した場合にそ の最大値がどうなるかというのは堤防の高さを どうするべきかという意味で興味深い。数式を 用いて書けば 1 ∼ n 年について X1, X2, ..., Xnの 最大値が n を大きくした時にどのようになるか である。
この問題は歴史を見ても極めて応用的であ る。もともと技術者 Tippet が綿糸にかかる力 の最大値について考え統計学者 Fisher に相談 して研究が始まった1)。その後は水を含めさま ざまな応用と数学のような基礎両面で発展す る。ヨーロッパでは研究が盛んだが,日本では あまり多くはない。教科書としてはかつて一冊 だけ和書があった2)が絶版で,統計数理研究 所の講義資料3)があるくらいである。しかし 土木工学の専門書にはこの問題について簡単な 解説が載っているなど,実に応用に近い学問と 言える。研究面では工学への応用を視野に入れ た統計数理研究所のリポートがある4)。 II.数学としての展開 前節までの話は数学以前の段階である。ここ で数学の問題として考えるが,数学には独自の 発想があり,それらについて記述する。まずは 論理的な正しさについて,次に無限を扱うこと と確率論で無限を扱った時の極限定理につい て,そして最後に極値理論について書いていく。 II.1 論理的な正しさ 数学においては論理的に正しいことが要求さ れるが,これには応用の上で欠点と利点がある。 このことについて具体的な問題を見ながら考え よう。 問題 ある国の有権者は 1 億人ちょうどで,こ の国での内閣支持率を調べることになった。全 員調べると費用がかかりすぎるので無作為に 3,000 人を抽出して調べたところ,900 人が支 持し 2,100 人が不支持であった。ここから有権 者全体では支持率はいくらになるだろうか? 実際には無回答がたくさんいるはずだが,今 回は問題を単純化した。これは統計学ではわり と基本的な問題でまずその答えを提示し,それ から(数学とも言い難いが)論理的に正しい答 えも書いてみよう。 統計学での答えは 28.36%∼ 31.64%となる。 これは 95%信頼区間を求めたものである。つ いでなので 95%信頼区間について触れておく と,これは 95%の確率でこの区間内に 1 億人 の支持率があると言うことではない。調査をし て偶然を伴う抽出をすでにしてしまい確定して しまった以上は,この中に入っているかいない かであって確率が出る余地はない。ただ 3,000 人の抽出を実行する前だったらそれは 95%の 確率と言えたもので,例えるなら 95%の確率 でうまくいく輪投げで目隠しをしてすでに投げ てしまって目隠しが取れない状態と言える。 論理的に正しい答えは 0.0009%∼ 99.9979% である。ほとんど全員支持かもしれないし不支 持かもしれないと言っている。どうしてこのよ うな結果になったかと言うと 3,000 人だけ調べ たが残りの 9,999 万 7,000 人は全員支持かもし れないし,全員不支持かもしれないからである。 まさにこれが論理的に正しい解答と言える。 二つ比べて統計学での答えはもっともで論理 的に正しい答えはほとんどナンセンスと言える だろう。実際に日本では有権者の数も世論調査 の対象者数もこの程度で,内容はさておき 1 億 人中わずか 3,000 人の調査で統計学での答えで 出したような精度になると言える。 ただし論理的に正しいことには汎用性の強み がある。応用上は大体の正しさでよいと思われ るかもしれない。しかし数学は広い分野に応用 される議論である。ある分野では 95%の正し さで十分だが,別の分野では 99%や 99.9%の 正しさでないと困ると言うこともありうる。こ の点で数学の 100%正しい議論は確実なよりど ころとしてどこに持っていっても何の問題もな く使えることにつながる。 II.2 無限と有限 現象は有限の世界だが,数学は無限を扱う。 現象を扱うとき無限の個体や無限の時間などは ありえず有限であるが,数学では無限がしばし ば顔を出し,その間にギャップが起こる。数学 でなぜ無限を考えるかの一つの理由は,あまり に大きい有限を扱うのは困難で,むしろ無限の 方がやさしいからである。
コイン投げの例で有限のときの困難を見てみ よう。表と裏が12ずつ出るコインを多数回投げ て表の出る合計回数の分布はいくらになるか? 例 え ば 1 万 回 投 げ て 表 が 5,000 回 と か 7,000 回とか 9,000 回になる確率はいくらになるか を 考 え る。 こ れ は 2 項 分 布 B(n, p) の 問 題 で n = 10,000, x = 5,000, 7,000, 9,000 の と き の nCx
(
12)
x(
1 2)
n−x とわかる。ここでnCxはきわめ て大きくなり,逆に(
12)
x(
1 2)
n−x がきわめて小 さくなる結果として穏当な値に落ち着くが,こ れを実際にコンピュータで計算することは難し い。ところがこれを無限の場合で考えると,あ る操作をすることで有名な標準正規分布で近似 することができる。正規分布であれば計算は容 易なので無限を扱った方がよい。 近似がどれくらい良いかは応用の場面では重 要だが難しい問題である。前の 2 項分布では n を大きくすればするほど正規分布には近くな る。ところでこの話は統計にも応用されている が,標本サイズを大きくすればするほどよいと 言われても,実際には費用や手間やその他の理 由でそこまで増やせるものでもない。どれくら いの n で近似がよくなるかは問題に関わる確 率分布の質による。これが左右対称に近ければ さほど大きくなくてよいし,対称からかけ離れ ていれば大きくする必要がある。コイン投げの 問題は素直な上に確率変数は12ずつの確率で 0, 1 を取るという素直なものなのでわりと小さな n でも近似がよいが,もしこれをコインが立っ た場合も考えて表 0.49999,裏 0.49999,立つ 0.00002 でモデル化し,コインが立った回数を 考えたら相当大きな n が必要になる。別の例と して前に挙げた世論調査の問題で,標本以外の 全員が指示や不支持などという極端なことが起 こりうる場合には大量に調べなければならない し,そうでなければ 3,000 人程度で十分だと言 える。 II.3 極限定理と極値問題 オリジナルの極値問題は極限定理が重要にな る。これは多数個の独立同分布の確率変数につ いて最大値の分布すなわち最大値がある範囲の 中に入る確率を求める問題であり,やはり無限 を考えて極限操作を行う。極限定理の例として 極値問題だと少しイメージがわきにくいので代 わりに確率変数列の和であるランダムウォーク について見てみよう。 ランダムウォークを導入するが,そのままの 形では分布の極限に意味がない。公平なコイン を投げてそれに応じて数直線の 0 からスター トしてコマを動かす。表であれば右に 1,裏で あれば左に 1 とする。n 回投げるときにある点 x やある区間 I にいる確率を求めたい。コマは 右に行ったり左に言ったり揺れ動くが,n を大 きくすれば,x が± 100,000,000 のような大き い値でもいずれは行きつくし,何度でもコマ は 0 に戻ってくることが確率論の一般論で知 られている。コマの位置を Snとしてこの分布 はあるかってな区間 I にいる確率としてμn(I) = P(Sn ∈ I) と書けるが,I をどんなに広くして も有限な区間である限り,n を大きくしたとき μn(I) は 0 に限りなく近づく。 動く幅が広すぎるので適当に潰したいが,そ の幅の見積もりが必要になる。もし一方通行な ら動く範囲は [0, n] や [– n, 0] だが,両方に動 く場合は事情が異なる。[– n, n] の部分集合で あることはわかるが,実際に Sn = n, – n となる 確率はそれぞれ(
12)
nで極めて小さい。動く範 囲の見積もりを取れば [ ] であること が知られている。 これの意味は [ ] 分のスケールで潰 してみることで多くの情報が得られるというこ とである。有限な区間 I と正の定数α に対し, のように Snの動く範囲を適当に潰してみて分 布 を 考 え る。 こ の と き 例 え ばα = 1.9, 2, 2.1 とすると n– 1/1.9 < n– 1/2 < n– 1/2.1はそれぞれ n = 10,000 なら 0.00785 < 0.01 < 0.01245 で左の方 がよく潰れることになる。そこで集合 {0} と かってな有限区間 I についてとなり,n– 1/1.9 Snは潰しすぎたためほとんど 0 にいて,逆に n– 1/2.1 Snは潰し方が足りなかった ためまだふらふらと遠くまで左右を往復してい ることが分かる。n– 1/2 Snだとちょうどよくて何 と正規分布が出てくる。これは中心極限定理と 呼ばれる大定理の特別な場合である。 このように n を無限に大きくするときに Sn の動く範囲のよい見積もりが必要になる。見 積もりは大きすぎても小さすぎてもつまらず, ちょうどいい場合が求められる。α = 1.9, 2.1 とも見積もりとしては無意味でα = 2 の時だけ 有用な情報になる。解析学の多くの問題はこの ような微妙なところを相手にするために難しく なる。 さて本題の極値問題でも極限定理が得られ, 上のような微妙な点で多くの情報が得られる。 独立同分布な確率変数列 X1, X2, ..., Xnについて 最大値 を考える。それについて まずはつまらない場合,それから意味のある場 合を考える。 なにもスケールやずらしを取らないと面白い 話ではない。ただ Mnとすれば Xiの分布で 一番大きい 1 点に行きつく。これは例えばサイ コロを多数回ふればいつかは 6 が出るし,もし 1 億の面のある 1 ∼ 1 億の面のサイコロでも極 めて多数回ふればいつかは 1 億が出る。つまり 後者なら P(Mn = 100000000) = 1 と分布が 1 点に集中する。ただ 1 点で潰れている話は情 報が少ないのでつまらない。 これに対しスケール an > 0 とずらし bn ∈ R を用いると情報が多くなる。 の分布す なわちかってな実数の区間 I についてμn(I) = P( ∈ I) としたものが n →∞のとき分布 が 1 点に集中せずに 2 点以上に本当に「分布」 しているとき,その極限の分布を極値分布と いう。この極値分布は Fisher,Tippet および Gnedenko により 3 種類であることとその形が 分かっていて,少数の点に分布しているような ものではない。 この極値分布により最大値の現象の予測が可 能になる。もし極限がつぶれていたら予測など まるでかなわない。しかし潰れていないという ことで情報がきちんとある。よって現象から求 めた確率変数列の最大値に適当な操作を施すと n が十分大きければ極値分布で近似することが できる。堤防の問題に限らず工学の諸分野で有 用であるわけである。 III.研究紹介とまとめ 私は極値問題の一般化を研究している。数学 者は一般化ばかり考えるとの陰口も聞かれるほ ど数学にとって一般化は重要である。この節で は一般化とは何かについて述べ,それから私の 研究を紹介し,最後に全体のまとめとして特に 応用との関係を意識しながら数学の特徴を述べ たいと思う。 III.1 一般化とは 数学において一般化とは,定理や理論で要求 される仮定を緩くしても何らかの結果を得るこ とと言える。数学の定理はある条件が成り立て ば何らかの結果が成り立つという構造をしてい る。これについて条件を緩くしても同じ結果が 成りたち今までのきつい条件は無駄とわかるこ ともあるし,条件を緩くするといままでの結果 を含むようなより緩い結果を得ることもある。 一般化の例としては三平方の定理の一般化と しての余弦定理がある。前者は直角三角形に ついてのみ成り立つものでその斜辺の長さを a, 他二辺の長さを b, c としたとき,a2 = b2 + c2 となるあまりにも有名な結果である。後者は一 般の三角形について成り立つもので,三辺の長 さを a, b, c として b, c に当たる辺の間の角を A とすれば,a2 = b2 + c2 − 2bc cos A が成り立つ というものだ。これは A が直角のとき cos A = 0 となるので前者を含んでいる。 そこで三平方の定理より余弦定理の方がよい 定理かというと必ずしもそうは言えない。それ
は形を見ただけでも三平方の定理の方が美しい し,直感にもなじみやすい。また余弦定理の中 を三平方の定理に当たる部分とそうでない部分 に分ければ,前者の方が初等幾何はもとより数 学の他の分野においても圧倒的に多く用いられ る。もちろん余弦定理は必要なのだが,一般化 が必ずしも良いとはされないこともあり,数学 者への陰口につながる。 一方で一般化により複数の数学的な結果が一 つにまとまり非常に良い場合もある。統計学に も応用される中心極限定理という確率論の大定 理はもともとドモアブル・ラプラスの定理とい う特別な場合から一般化された。ドモアブル・ ラプラスの定理は二項分布という特定一つの分 布についての極限定理にすぎないが,中心極限 定理は大変多くの分布についてその分布に対応 する独立確率変数列の和に対する極限定理であ り適用範囲だけでなく視野もはるかに広い。こ こで二項分布もベルヌーイ分布に対応する確率 変数列の和の分布となっているので中心極限定 理はドモアブル・ラプラスの定理を含んでいる。 一般化で条件を緩めることで応用の範囲が広 がるが,そこには功罪両面がある。前に挙げた 余弦定理は明らかに三平方の定理より応用の範 囲が広がっている。また確率論でブラウン運動 を含む加法過程によってそれまで扱えなかった ジャンプを含むような株価などの動きに対する モデルを構築できるようになった。しかし一般 化したものはたいてい議論が難しくなるし,一 般化してモデルを作るとより多くのパラメータ を指定しなければならず限られたデータからで は信頼できる指定がしきれなくなるかもしれ ない。 III.2 研究紹介 著者は最大値半自己分解可能分布と呼ばれる 分布を中心にその周辺を研究している(高橋編 (8),(9),(10) 2011-13)。繰り返しになるが極値問 題は確率変数列の最大値に関する極限定理であ る。一方で確率論には中心極限定理のような確 率変数列の和に関する極限定理もある。両者は 理論の構造が下に挙げる表 1 のように酷似して いるが,和に関する理論の方が先行しているた め,最大値に関して同様のものを考えている。 ここで和に関して安定・半安定・自己分解可 能・半自己分解可能などの分布があり,最大値 に関しては公刊されている論文では最大値安 定・最大値半安定・最大値自己分解可能までで 最大値半自己分解可能はきちんとは扱われてい ない。 それぞれどのような一般化になっているか述 べてみよう。安定から半安定や自己分解から半 自己分解は一般化になっており,これは収束を 考えるときに全部の列の収束を考えるか部分列 の収束を考えるかの違いである。安定から自己 分解可能や半安定から半自己分解可能も拡張に なっている。これは(半)安定では独立だけで なく同分布まで仮定していたものを(半)自己 分解では独立だけの仮定にしたものである。簡 単に言えば 6 面体サイコロだけ振っていたとこ 表 1.確率変数列の和と最大値の枠組の対応 ここで ˆμ は特性関数,F は分布関数,Ttは Rd→ Rdの作用素である. 和 最大値 無限分解可能 確率変数の和 ˆ μ(z) = ˆμn(z)n 確率変数列の最大値 F(x) = Fn(x)n (半)自己分解可能 独立確率変数列の和 ˆ μ(z) = ˆμ(bz)ρ(ˆz) 独立確率変数列の最大値F(x) = F(T x)Fβ(x) (半)安定 i.i.d. 確率変数列の和 ˆ μ(z)a = ˆμ(bz)ei<c,z> i.i.d. 確率変数列の最大値 Ft(x) = F(T t(x))
ろ,8 面体や 12 面体や 20 面体などまぜこぜで 振るようなものである。仮定が緩くなり,結果 も元の結果を含むものになる。 この研究は必ずしも応用を目的としてはいな いし,応用につなげるのは難しいかもしれない。 それはこの極限分布でモデルを作ろうとしても あまりにも自由度が高すぎてうまく当てはめが できないかもしれないからである。しかしこれ でも作るモデルに意味は付くし,実際に応用が なくても数学としての形が整っていれば,それ は価値があるものと考えられる。 III.3 まとめ ここでまとめに入る。現象に数学的に扱う方 法として,既存の議論を使うならまず条件を チェックし,それがうまくないなら改めて考え 直したり一般化する必要がある。最後に極値の 問題について述べる。 現象に対し既存の議論を使ってモデルを作る なら,それに必要な条件をチェックしなければ ならない。I.1 節で述べたように現象をモデル 化するに当たっては,成り立つかどうか分か らない強い仮定をおくことが多い。これは II.1 節にあるような正しい議論を行うためである。 そのためには I.2 で述べた定義の条件を満たす 必要があるが,これをデータから確認すること は原理的にできない。研究デザインの上で無理 がないことを確認し,解析結果を経験と比較す ることが求められる。 それがうまくいかない場合には,改めて考え 直すと分野や場合によっては数学の進展につな がりうる。上で述べた定義の条件を満たさなく てもまあまあ良い結果が得られることも少なく ない。この場合にはもっと良い形の条件があっ たり,何か別の条件や構造が隠れているかもし れない。それを意識することが重要で,意識さ せるような方法は良い方法だと思う。数学や統 計を使う際に単なる手順とは考えずに発想や技 法として柔軟に生かすことが求められる。 また III.1 節で述べたように一般化を図るこ ともありうる。これは難しいし直ちにできるこ とではないが,数学の発展のひとつの動機に なっている。
I.4 節および II.3 節,III.2 節で述べた極値問 題は偶然現象の最大値と言う非常に考えやすく 応用の広い概念を扱っている。独立性の条件が もともとあるが,mixing と言うやや弱い条件 に弱められて一般化されたりもしている。和書 がないのが難点であるが,現在ある先生が出版 準備中であるとのことで近い将来日本でも応用 が広がるものと思われる。 参考文献 1) サルツブルグ デイヴィッド:統計学を拓いた 異才たち 日本経済新聞社 2006. 2) グンベル E.J.:極値統計学 生産技術センター 新社 1978. 3) 志村隆彰・渋谷政昭・高橋倫也・牧本直樹:極値 統計学 統計数理研究所公開講座資料 2010. 4) 高橋倫也 編:統計数理研究所共同研究リポー ト『極値理論の工学への応用および同(2)∼ (10)』2004∼2013.