<総説>極値理論・偶然現象の最大値の挙動を通して見る数学利用統計を見る

(1)

I．実在現象の定式化実在の現象を数学として定式化することは数学以前の段階であるが，これを考えることは応用にとって重要である。定式化に当たっては抽象が行われ，現象からあるルールに従うモデルを作りだす。私の取り組んでいる極値問題では従来から河川の氾濫や高潮など水に関する現象を偶然によるものととらえ確率変数を用いてモデル化してきた。ここで確率を扱う際には独立性という概念が重要になる。これらの概念を説明したうえで極値問題を定式化する。 I.1 抽象しモデル化する現象には様々な側面があるが，その中で限られた少数のものだけに注目し他は捨てる抽象を行うことで様々なことが可能になる。ここからある仮定を持ったモデルを作り，そのモデルについて演繹的な考察を行う。水に関する現象について今回は統計の方法により水の高さを全くの偶然によるものとみる。これは相当に乱暴な抽象である。水の現象を捉えるのに流体としての側面に注目したり潮の干満に注目したりする方法もあるだろう。これらは物理的なモデルと言える。もちろんそれを考えるのにも意味があるが，今回は偶然による水の高さとして扱いたいと言うのがモデルを使うということである。モデル化をするときには多少の無理があっても単純でわかりやすいモデルの方がよい。水の高さは後述する独立で同分布な確率変数としてモデル化する。まだ独立について詳しいことを述べていないがこれはそれなりにきつい仮定で必ずしも成立するかはわからない。だがこの単純化によって実際に問題を解くことが可能になる。逆に言えばこれがないと問題がほとんど解けない。とりあえず解けるところを考え，その後をどうするか考えるのもひとつの見識だと思う。単純でわかりやすいモデルには汎用性があるのもよい点と言える。極値理論はこのような洪水の問題と深く関わってきたが，現在は気象学・建築工学・工業製品の信頼性解析・人間の寿命・保険・金融工学など様々な応用がある。これは分野個別の事情を捨象して抽象化し，さ

極値理論・偶然現象の最大値の挙動を通して見る数学

西郷達彦

山梨大学医学工学総合研究部社会医学講座 要旨：編集者から研究紹介のご依頼があったが，私の専門は数学の確率論でその論文形態のもの を医学を専門とする本雑誌にそのまま提出するのは適当でないと考える。そこで私の研究テーマである極値理論すなわち偶然の値の最大値の挙動に関する研究の概要を紹介しながら，そこに現れる数学の発想を応用との関係を意識しつつ記述することを図った。記述の順としては取り組んでいる分野について，まず実在の現象を数学にすること，次に数学としての展開，最後に私自身が行っている研究とする。 キーワード極値理論

総説

〒 409-3898 山梨県中央市下河東 1110 番地受付：2013 年 3 月 29 日受理：2013 年 5 月 30 日

(2)

らに単純でわかりやすいモデルであることから応用が可能になったと言える。 I.2 確率変数と分布偶然によって決まる量を数学的に扱う際に用いられるのが確率変数である。ここではまず確率変数の定義について述べ，それからその性質を記述するのに重要な分布について触れる。数学では必ず定義があり，確率変数であればその定義を満たすし，逆に定義を満たすものはそれが何であっても，例え猫であっても確率変数となる。この点は完全な約束事で個々の現象についての事情が入る余地はない。ただどんなかってな約束事でもしてよいかといえば，しても構わないがあまりに数学なり他の学問の要請から外れた定義では有用性がなくなってしまう。定義を行うときにはそれをする動機や合理性があり，それに基づいて定義をする。確率変数はある種の関数と考える。変数が偶然によって決まるというのは，偶然によって出来事が起こりその出来事によって値が決まると考えられ，一種の関数と言える。この関数があまりにもひねくれた性質で数学が展開できなくなるのを避けるため，詳しくは書かないが可測性とよばれる合理的な仮定を置く。確率変数は出来事ω の関数として X(ω) など と書く。関数であるがふつうの f, g などでなく， 大文字の X, Y, Z 等で表わし，また偶然による 出来事をω で表すため上記のようになる。ふ つうの関数が実数 x が決まるとそれに対応して 実数 f(x) が決まるように，確率変数は出来事ω が決まるとそれに対応して実数 X(ω) がきまる。 自変数 x の取る値の集合全体を実数 R とし区 間 [a, b] などを考えるように，出来事ω の取る集合全体を全事象Ω と書きその部分集合を事 象 A, B などと書く。そこで f : R → R と同様に X: Ω → R などと書く。例としては宝くじであれば全事象は一つには Ω = {1 等，1 等の前後賞，1 等の組違い賞，2 等，3 等，4 等，5 等，6 等，はずれ } ととることができる。そこで賞金は確率変数と見ること ができるので，X（1 等）= 4 億，X（1 等の前後 賞）= 1 億，...X（6 等）= 300，X（はずれ）= 0（第 633 回全国自治宝くじ）などとなる。ここで Z = X − 300 とすればこれも偶然の出来事による 関数なので確率変数であり，1 枚買ったときの儲けという意味が付く。また別の例としてサイコロの目であれば全事象はやはり一つには Ω′ = { 赤い点 1 つ，黒い点 2 つ，黒い点 3 つ，...，黒い点 6 つ } ととれ，目の数を確率変数として Y（赤い点 1 つ）= 1,...，Y（黒い点 6 つ）= 6 など となる。確率変数を扱うには分布を用いる。分布とは実数の集合を入力として確率が出力される一種の関数である。ある集合に対し確率変数の取る値がその集合の範囲に入る確率を対応させる。例えばさきほどのサイコロの例の場合，確率を P と書いて公平なサイコロであれば集合 {1, 2}， {2, 4, 6} に対し，P(Y∈{1, 2}) = 13，P(Y∈{2, 4, 6}) = 12などとなる。前者はサイコロの目が 1 か 2 の確率は1₃という意味だし，後者はサイコロの目が偶数になるのは1₂の意味となる。一般 には確率変数 X の分布は実数の部分集合 A を 与えたとき， P(X ∈ A) となり，これを μ(A) = P ◦ X− 1_{(A) = P (X ∈ A) などと表したりする。} ここで確率変数 X の関数の逆を考えることで， ある実現値の集合から出来事ω の集合である 事象を作り，その事象に何らかの確率 P を導 入することで分布を作る。実現値の集合とそれをとる確率を間の事象を飛び越してつなげている。最後に複数の確率変数の分布が同じということは対応する確率変数が全く一致するわけで ないことを付け加える。確率変数 X1, X2があっ たときに，分布が同じというのは常に X1(ω) = X2(ω) となることではなく，上の意味での分布だけ同じということである。例えば表裏が同様とみなせるコイン 10 枚を投げる試行によって， 表の枚数 X1と裏の枚数 X2は必ずしも一致しないが，分布は同じと言える。

(3)

I.3 独立性複数の確率変数があったときそれぞれバラバラに扱うために独立性が必要となる。複数の事象あるいは複数の確率変数を同時に扱うのは難しいが，バラバラに扱えれば解析は容易になる。ここに確率論で重要な独立性が導入される。確率論は一般に解析学の言葉で記述され解析学の一部ともみなされるが，この独立性は特別な概念である。事象が独立であるとはどういうことか，確率変数の独立，そして応用に当たっての注意の順で説明する。複数の事象をバラバラに考えるためにはそれぞれの事象が他に影響を与えないことが必要となる。影響を与えないとき一つの事象の情報を得ても，他の事象の情報は得られない。この ように A，B なる事象すなわち出来事の集合が あったとき，A が起こったという情報を得ても B について起こるか起こらないか確率がなんら 変わらないとき，事象 A，B は独立と言う。例 えば公平なサイコロを 1 個振った偶然の結果を 考えるとき，A：2 以下である事象，B：5 以上 である事象，C：偶数である事象とすれば，C であることが分かったからと言って，A や B で あることの確率は13のまま変わらない。これか ら A と C あるいは B と C は独立と言える。だ が A であることが分かれば B ではあり得ずそ の確率は 0 となり，情報が得られているので A と B は独立ではない。 確率変数でもやはりバラバラに考えるため独立性が導入される。確率変数の独立は事象の独立に帰着し，確率変数同士で一方の情報がもう一方に影響を与えずバラバラになることである。確率変数の独立はその実現値の集合を考えることで前の事象の独立に帰着する。確率変 数 X，Y に対して実現値の集合 I1，I2を与えると {ω|X(ω) ∈ I1}，{ω|Y(ω) ∈ I2} は事象となる。 どんなかってな実数の集合 I1，I2を与えても両者が事象として独立なら，その二つの確率変数は独立とする。このとき一方がある値をとったと言う情報が，もう一方にとってなんらの情報になってないと言える。応用に当たってこの独立の仮定が置かれることが多いが，悩ましい点もある。前に独立性があると解析が容易になるといったが，実はそうでないと難しくてほとんど手出しできない場合が多い。世の中の現象から作る確率変数が独立とは言い切れないのに，この仮定を置かざるを得ない。この点を統計学について見ていこう。ふだん統計を使う際にも独立であることは意識しないまま縦横に使っている。一部だけを取り出して調べ全体の結論が言えるのは，全体から無作為に偏らず標本を取りだしたとみなすからである。ここで標本の特性値を測るとき，偶然により標本抽出されているので確率変数と言える。無作為抽出とはこの確率変数が独立で同じ分布に従うという仮定を置いたことになる。世論調査などの時に全くの無作為に調査対象を選ぶからそれが全体の代表と見なせるのであって，もし知り合いからさらに知り合いなどとたどったら同質の人が多くなってしまうだろう。いろいろな応用研究において実は無作為ではなくつまり独立でない確率変数に独立であることを前提とした理論を使っているのが現状である。独立でない場合にはあまりにも議論が煩雑になりしかもまともな結果が言えないので致し方ないところがある。独立を前提とした議論を用いる際に，独立かどうかデータから判断する検定もあるが，これは不十分なものであり参考程度にしかならない。実験や調査のデザインの段階で十分に独立と見なせるものであればよいが，その他は要注意の結論となる。 I.4 極値問題とは 極値問題は独立な確率変数の列 X1, X2, ..., Xn について最大値の挙動がどうなるかを調べる理論である。毎月あるいは毎年の河川や高潮の高さを独立な確率変数してモデル化した場合にその最大値がどうなるかというのは堤防の高さをどうするべきかという意味で興味深い。数式を 用いて書けば 1 ∼ n 年について X1, X2, ..., Xnの 最大値が n を大きくした時にどのようになるか である。

(4)

この問題は歴史を見ても極めて応用的である。もともと技術者 Tippet が綿糸にかかる力の最大値について考え統計学者 Fisher に相談して研究が始まった1）。その後は水を含めさまざまな応用と数学のような基礎両面で発展する。ヨーロッパでは研究が盛んだが，日本ではあまり多くはない。教科書としてはかつて一冊だけ和書があった2）が絶版で，統計数理研究所の講義資料3）があるくらいである。しかし土木工学の専門書にはこの問題について簡単な解説が載っているなど，実に応用に近い学問と言える。研究面では工学への応用を視野に入れた統計数理研究所のリポートがある4）。 II．数学としての展開前節までの話は数学以前の段階である。ここで数学の問題として考えるが，数学には独自の発想があり，それらについて記述する。まずは論理的な正しさについて，次に無限を扱うことと確率論で無限を扱った時の極限定理について，そして最後に極値理論について書いていく。 II.1 論理的な正しさ数学においては論理的に正しいことが要求されるが，これには応用の上で欠点と利点がある。このことについて具体的な問題を見ながら考えよう。 問題ある国の有権者は 1 億人ちょうどで，こ の国での内閣支持率を調べることになった。全員調べると費用がかかりすぎるので無作為に 3,000 人を抽出して調べたところ，900 人が支持し 2,100 人が不支持であった。ここから有権者全体では支持率はいくらになるだろうか？実際には無回答がたくさんいるはずだが，今回は問題を単純化した。これは統計学ではわりと基本的な問題でまずその答えを提示し，それから（数学とも言い難いが）論理的に正しい答えも書いてみよう。統計学での答えは 28.36％∼ 31.64％となる。これは 95％信頼区間を求めたものである。ついでなので 95％信頼区間について触れておくと，これは 95％の確率でこの区間内に 1 億人の支持率があると言うことではない。調査をして偶然を伴う抽出をすでにしてしまい確定してしまった以上は，この中に入っているかいないかであって確率が出る余地はない。ただ 3,000 人の抽出を実行する前だったらそれは 95％の確率と言えたもので，例えるなら 95％の確率でうまくいく輪投げで目隠しをしてすでに投げてしまって目隠しが取れない状態と言える。論理的に正しい答えは 0.0009％∼ 99.9979％である。ほとんど全員支持かもしれないし不支持かもしれないと言っている。どうしてこのような結果になったかと言うと 3,000 人だけ調べたが残りの 9,999 万 7,000 人は全員支持かもしれないし，全員不支持かもしれないからである。まさにこれが論理的に正しい解答と言える。二つ比べて統計学での答えはもっともで論理的に正しい答えはほとんどナンセンスと言えるだろう。実際に日本では有権者の数も世論調査の対象者数もこの程度で，内容はさておき 1 億人中わずか 3,000 人の調査で統計学での答えで出したような精度になると言える。ただし論理的に正しいことには汎用性の強みがある。応用上は大体の正しさでよいと思われるかもしれない。しかし数学は広い分野に応用される議論である。ある分野では 95％の正しさで十分だが，別の分野では 99％や 99.9％の正しさでないと困ると言うこともありうる。この点で数学の 100％正しい議論は確実なよりどころとしてどこに持っていっても何の問題もなく使えることにつながる。 II.2 無限と有限現象は有限の世界だが，数学は無限を扱う。現象を扱うとき無限の個体や無限の時間などはありえず有限であるが，数学では無限がしばしば顔を出し，その間にギャップが起こる。数学でなぜ無限を考えるかの一つの理由は，あまりに大きい有限を扱うのは困難で，むしろ無限の方がやさしいからである。

(5)

コイン投げの例で有限のときの困難を見てみよう。表と裏が12ずつ出るコインを多数回投げて表の出る合計回数の分布はいくらになるか？例えば 1 万回投げて表が 5,000 回とか 7,000 回とか 9,000 回になる確率はいくらになるか を考える。これは 2 項分布 B(n, p) の問題で n = 10,000, x = 5,000, 7,000, 9,000 のときの nCx

(

1₂

)

x

(

1 2

)

n−x とわかる。ここでnCxはきわめて大きくなり，逆に

(

12

)

x

(

1 2

)

n−x がきわめて小さくなる結果として穏当な値に落ち着くが，これを実際にコンピュータで計算することは難しい。ところがこれを無限の場合で考えると，ある操作をすることで有名な標準正規分布で近似することができる。正規分布であれば計算は容易なので無限を扱った方がよい。近似がどれくらい良いかは応用の場面では重 要だが難しい問題である。前の 2 項分布では n を大きくすればするほど正規分布には近くなる。ところでこの話は統計にも応用されているが，標本サイズを大きくすればするほどよいと言われても，実際には費用や手間やその他の理由でそこまで増やせるものでもない。どれくら いの n で近似がよくなるかは問題に関わる確 率分布の質による。これが左右対称に近ければさほど大きくなくてよいし，対称からかけ離れていれば大きくする必要がある。コイン投げの問題は素直な上に確率変数は12ずつの確率で 0, 1 を取るという素直なものなのでわりと小さな n でも近似がよいが，もしこれをコインが立っ た場合も考えて表 0.49999，裏 0.49999，立つ 0.00002 でモデル化し，コインが立った回数を 考えたら相当大きな n が必要になる。別の例と して前に挙げた世論調査の問題で，標本以外の全員が指示や不支持などという極端なことが起こりうる場合には大量に調べなければならないし，そうでなければ 3,000 人程度で十分だと言える。 II.3 極限定理と極値問題オリジナルの極値問題は極限定理が重要になる。これは多数個の独立同分布の確率変数について最大値の分布すなわち最大値がある範囲の中に入る確率を求める問題であり，やはり無限を考えて極限操作を行う。極限定理の例として極値問題だと少しイメージがわきにくいので代わりに確率変数列の和であるランダムウォークについて見てみよう。ランダムウォークを導入するが，そのままの形では分布の極限に意味がない。公平なコインを投げてそれに応じて数直線の 0 からスタートしてコマを動かす。表であれば右に 1，裏で あれば左に 1 とする。n 回投げるときにある点 x やある区間 I にいる確率を求めたい。コマは 右に行ったり左に言ったり揺れ動くが，n を大 きくすれば，x が± 100,000,000 のような大き い値でもいずれは行きつくし，何度でもコマは 0 に戻ってくることが確率論の一般論で知 られている。コマの位置を Snとしてこの分布 はあるかってな区間 I にいる確率としてμn(I) = P(Sn ∈ I) と書けるが，I をどんなに広くして も有限な区間である限り，n を大きくしたとき μn(I) は 0 に限りなく近づく。 動く幅が広すぎるので適当に潰したいが，その幅の見積もりが必要になる。もし一方通行な ら動く範囲は [0, n] や [– n, 0] だが，両方に動 く場合は事情が異なる。[– n, n] の部分集合で あることはわかるが，実際に Sn = n, – n となる 確率はそれぞれ

(

1₂

)

nで極めて小さい。動く範囲の見積もりを取れば [ ] であることが知られている。これの意味は [ ] 分のスケールで潰してみることで多くの情報が得られるというこ とである。有限な区間 I と正の定数α に対し， のように Snの動く範囲を適当に潰してみて分布を考える。このとき例えばα = 1.9, 2, 2.1 とすると n– 1/1.9 < n– 1/2 < n– 1/2.1はそれぞれ n = 10,000 なら 0.00785 < 0.01 < 0.01245 で左の方がよく潰れることになる。そこで集合 {0} と かってな有限区間 I について

(6)

となり，n– 1/1.9 Snは潰しすぎたためほとんど 0 にいて，逆に n– 1/2.1 Snは潰し方が足りなかったためまだふらふらと遠くまで左右を往復してい ることが分かる。n– 1/2 Snだとちょうどよくて何と正規分布が出てくる。これは中心極限定理と呼ばれる大定理の特別な場合である。 このように n を無限に大きくするときに Sn の動く範囲のよい見積もりが必要になる。見積もりは大きすぎても小さすぎてもつまらず，ちょうどいい場合が求められる。α = 1.9, 2.1 とも見積もりとしては無意味でα = 2 の時だけ有用な情報になる。解析学の多くの問題はこのような微妙なところを相手にするために難しくなる。さて本題の極値問題でも極限定理が得られ，上のような微妙な点で多くの情報が得られる。 独立同分布な確率変数列 X1, X2, ..., Xnについて最大値を考える。それについてまずはつまらない場合，それから意味のある場合を考える。なにもスケールやずらしを取らないと面白い話ではない。ただ Mnとすれば Xiの分布で一番大きい 1 点に行きつく。これは例えばサイコロを多数回ふればいつかは 6 が出るし，もし 1 億の面のある 1 ∼ 1 億の面のサイコロでも極めて多数回ふればいつかは 1 億が出る。つまり後者なら P(Mn = 100000000) = 1 と分布が 1 点に集中する。ただ 1 点で潰れている話は情報が少ないのでつまらない。 これに対しスケール an > 0 とずらし bn ∈ R を用いると情報が多くなる。の分布す なわちかってな実数の区間 I についてμn(I) = P( ∈ I) としたものが n →∞のとき分布が 1 点に集中せずに 2 点以上に本当に「分布」しているとき，その極限の分布を極値分布という。この極値分布は Fisher，Tippet および Gnedenko により 3 種類であることとその形が分かっていて，少数の点に分布しているようなものではない。この極値分布により最大値の現象の予測が可能になる。もし極限がつぶれていたら予測などまるでかなわない。しかし潰れていないということで情報がきちんとある。よって現象から求めた確率変数列の最大値に適当な操作を施すと n が十分大きければ極値分布で近似することが できる。堤防の問題に限らず工学の諸分野で有用であるわけである。 III．研究紹介とまとめ私は極値問題の一般化を研究している。数学者は一般化ばかり考えるとの陰口も聞かれるほど数学にとって一般化は重要である。この節では一般化とは何かについて述べ，それから私の研究を紹介し，最後に全体のまとめとして特に応用との関係を意識しながら数学の特徴を述べたいと思う。 III.1 一般化とは数学において一般化とは，定理や理論で要求される仮定を緩くしても何らかの結果を得ることと言える。数学の定理はある条件が成り立てば何らかの結果が成り立つという構造をしている。これについて条件を緩くしても同じ結果が成りたち今までのきつい条件は無駄とわかることもあるし，条件を緩くするといままでの結果を含むようなより緩い結果を得ることもある。一般化の例としては三平方の定理の一般化としての余弦定理がある。前者は直角三角形についてのみ成り立つものでその斜辺の長さを a, 他二辺の長さを b, c としたとき，a2 = b2 + c2 となるあまりにも有名な結果である。後者は一般の三角形について成り立つもので，三辺の長 さを a, b, c として b, c に当たる辺の間の角を A とすれば，a2 = b2 + c2 − 2bc cos A が成り立つ というものだ。これは A が直角のとき cos A = 0 となるので前者を含んでいる。そこで三平方の定理より余弦定理の方がよい定理かというと必ずしもそうは言えない。それ

(7)

は形を見ただけでも三平方の定理の方が美しいし，直感にもなじみやすい。また余弦定理の中を三平方の定理に当たる部分とそうでない部分に分ければ，前者の方が初等幾何はもとより数学の他の分野においても圧倒的に多く用いられる。もちろん余弦定理は必要なのだが，一般化が必ずしも良いとはされないこともあり，数学者への陰口につながる。一方で一般化により複数の数学的な結果が一つにまとまり非常に良い場合もある。統計学にも応用される中心極限定理という確率論の大定理はもともとドモアブル・ラプラスの定理という特別な場合から一般化された。ドモアブル・ラプラスの定理は二項分布という特定一つの分布についての極限定理にすぎないが，中心極限定理は大変多くの分布についてその分布に対応する独立確率変数列の和に対する極限定理であり適用範囲だけでなく視野もはるかに広い。ここで二項分布もベルヌーイ分布に対応する確率変数列の和の分布となっているので中心極限定理はドモアブル・ラプラスの定理を含んでいる。一般化で条件を緩めることで応用の範囲が広がるが，そこには功罪両面がある。前に挙げた余弦定理は明らかに三平方の定理より応用の範囲が広がっている。また確率論でブラウン運動を含む加法過程によってそれまで扱えなかったジャンプを含むような株価などの動きに対するモデルを構築できるようになった。しかし一般化したものはたいてい議論が難しくなるし，一般化してモデルを作るとより多くのパラメータを指定しなければならず限られたデータからでは信頼できる指定がしきれなくなるかもしれない。 III.2 研究紹介著者は最大値半自己分解可能分布と呼ばれる分布を中心にその周辺を研究している（高橋編 (8),(9),(10) 2011-13）。繰り返しになるが極値問題は確率変数列の最大値に関する極限定理である。一方で確率論には中心極限定理のような確率変数列の和に関する極限定理もある。両者は理論の構造が下に挙げる表 1 のように酷似しているが，和に関する理論の方が先行しているため，最大値に関して同様のものを考えている。ここで和に関して安定・半安定・自己分解可能・半自己分解可能などの分布があり，最大値に関しては公刊されている論文では最大値安定・最大値半安定・最大値自己分解可能までで最大値半自己分解可能はきちんとは扱われていない。それぞれどのような一般化になっているか述べてみよう。安定から半安定や自己分解から半自己分解は一般化になっており，これは収束を考えるときに全部の列の収束を考えるか部分列の収束を考えるかの違いである。安定から自己分解可能や半安定から半自己分解可能も拡張になっている。これは（半）安定では独立だけでなく同分布まで仮定していたものを（半）自己分解では独立だけの仮定にしたものである。簡単に言えば 6 面体サイコロだけ振っていたとこ表 1．確率変数列の和と最大値の枠組の対応ここで ˆμ は特性関数，F は分布関数，Ttは Rd→ Rdの作用素である．和最大値無限分解可能確率変数の和 ˆ μ(z) = ˆμn(z)n 確率変数列の最大値 F(x) = Fn(x)n （半）自己分解可能独立確率変数列の和 ˆ μ(z) = ˆμ(bz)ρ(ˆz) 独立確率変数列の最大値F(x) = F(T x)Fβ(x) （半）安定 i.i.d. 確率変数列の和 ˆ μ(z)a_{= ˆ}_μ(bz)ei<c,z> i.i.d. 確率変数列の最大値 Ft_{(x) = F(T} t(x))

(8)

ろ，8 面体や 12 面体や 20 面体などまぜこぜで振るようなものである。仮定が緩くなり，結果も元の結果を含むものになる。この研究は必ずしも応用を目的としてはいないし，応用につなげるのは難しいかもしれない。それはこの極限分布でモデルを作ろうとしてもあまりにも自由度が高すぎてうまく当てはめができないかもしれないからである。しかしこれでも作るモデルに意味は付くし，実際に応用がなくても数学としての形が整っていれば，それは価値があるものと考えられる。 III.3 まとめここでまとめに入る。現象に数学的に扱う方法として，既存の議論を使うならまず条件をチェックし，それがうまくないなら改めて考え直したり一般化する必要がある。最後に極値の問題について述べる。現象に対し既存の議論を使ってモデルを作るなら，それに必要な条件をチェックしなければならない。I.1 節で述べたように現象をモデル化するに当たっては，成り立つかどうか分からない強い仮定をおくことが多い。これは II.1 節にあるような正しい議論を行うためである。そのためには I.2 で述べた定義の条件を満たす必要があるが，これをデータから確認することは原理的にできない。研究デザインの上で無理がないことを確認し，解析結果を経験と比較することが求められる。それがうまくいかない場合には，改めて考え直すと分野や場合によっては数学の進展につながりうる。上で述べた定義の条件を満たさなくてもまあまあ良い結果が得られることも少なくない。この場合にはもっと良い形の条件があったり，何か別の条件や構造が隠れているかもしれない。それを意識することが重要で，意識させるような方法は良い方法だと思う。数学や統計を使う際に単なる手順とは考えずに発想や技法として柔軟に生かすことが求められる。また III.1 節で述べたように一般化を図ることもありうる。これは難しいし直ちにできることではないが，数学の発展のひとつの動機になっている。

I.4 節および II.3 節，III.2 節で述べた極値問題は偶然現象の最大値と言う非常に考えやすく応用の広い概念を扱っている。独立性の条件がもともとあるが，mixing と言うやや弱い条件に弱められて一般化されたりもしている。和書がないのが難点であるが，現在ある先生が出版準備中であるとのことで近い将来日本でも応用が広がるものと思われる。 参考文献 1）サルツブルグデイヴィッド：統計学を拓いた異才たち日本経済新聞社 2006． 2）グンベル E.J.：極値統計学生産技術センター新社 1978． 3）志村隆彰・渋谷政昭・高橋倫也・牧本直樹：極値統計学統計数理研究所公開講座資料 2010． 4）高橋倫也編：統計数理研究所共同研究リポート『極値理論の工学への応用および同（2）∼ （10）』2004∼2013．

<総説>極値理論・偶然現象の最大値の挙動を通して見る数学 利用統計を見る

極値理論・偶然現象の最大値の挙動を通して見る数学

西 郷 達 彦

総 説

(

)

(

)

(

)

(

)

(

)

<総説>極値理論・偶然現象の最大値の挙動を通して見る数学利用統計を見る

西郷達彦

総説