16(698)
標本調査の基礎理論
木 村
D. 序
標本調査ほ、全体について調査することなく、一部分を調査して、その結果 から全体についての様子を知ろうとするものである。これほ不完全帰納であっ て、論理的にほゆるされないものである。しかしながら、この不完全帰納を、
ある意味において、信頼できるような方法で実行するのが標本調査である。本 稿は、この標本調査の理論的な構造を論じようとするものである。この知識を えようとする全体と、調査な実行する一部分を、むすびつけるのほ、確率なの であって、本稿も、まず準腑として、確率をどのように考えるかを論じておか なければならない。確率む定義するにほ、いろいろな方法があるが、ここで ほ、標本抽出を最もよく説明できると考えられる系列による方法をとる。
1.確 率
我々ほフォン。ミーゼスにしたがって、コレクティフによって確率を定義す る○ コレクディフほ事象のくりかえしの系列から拍象された概念である。いま
「銭ふり」を実行してるる。すなわち、10円の銅貨をなげて、表がでたか、裏 がでたかを記録する。表がでたことを1、裏がでたことを0であらわせば、
101101.0101 0 01011010 0 10 0 0111011 0 010 0 0 010 1 10 0 0101101 010 0 010101 1101010 0 01 0 0 01111101
0 0 0 01110 0 0 101110110、1
という系列がえられる。この系列について表のでた相対度数をもとめてみると
第1表がえられる。
(699)17
第 1 表
この節1表からわかるように、投げる数をふやせばふ やすはど、真のでる相対度数のばらつきほ小さくなって 相対度数ほ0.5に近ずいていくようにみえる。このこと ほ、確率事象を特徴づける1つの性質である。またこれ だけでなく、貨幣を投げる前に鱒、投げた結果、表がで るか、裏がでるかほ、あらかじめ知ることができないと いう性質もまた、確率事象を特徴ずけるものである。この2つの性質でもって 確率を競走しようとするのがコレクティフの理論である。
1.1 コレクティフ
「銭ふり」で表がでることを1、裏がでることを0であらわしたように、あ る事象のおこることを記号であらわし、.この記号を標識とよんでいる。
いまある行為、あるいほ現象からおこる事象をしめす標識の全体を(A,β,
C,…… )とし、この標識からなる無限系列を
(∬)∽1,ク瑠2,ク羅3,桝4,・
とする。
条件1.この系列(∬)において、ほじめの〝項にふくまれる標識ズの数を
〃(ズ)とすれば、相対度数〝(ズ)/卵ほ、兜をかぎりなく大きくしたとき、極限
OLIVE 香川大学学術情報リポジトリ
18(700)
をもつ、すなわち、
〃川
花′−>00
= P(ズ)
がなりたつ。
第2の条件をのべるために、選択行為を定義する。
定義1つの標識系列から部分列を構成するのに、5(1)第1項を部分列のなか にとり入れるかどうかを、第1項の標識匿関係なく決定する。(2)第オ項を部分 列のなかにとり入れるかどうかを、第1項から第才一1項までの標識の知識は
もちいてもよいが、第オ項の標識にほ関係なく決定する。上の(1),(2)をみたす ような、部分列の構成方法を選択行為という。
例えば奇数項をすべてとるという部分列の構成方法ほ、すべての標識に無関 係に部分列が構成されるのであるから、1つの選択行為である。また、標識と
して、1と0をもつような系列において、(1)第1項をとる、(2)第2項ほとらな い、(3)て1,0)とつづいたあとをとる。という(1)、(2)および(3)によってあた えられる部分列の構成方法ほまた、選択行為である。この選択行為をもちい
て、コレクティフについての第2の条件をつぎのように規定する。
* 条件2.任意の選択行為によってえられる部分列について、第1の条件と
同じこと、すなわち、この部分列の最初のク〆項にふくまれる標識ズの個数を 乃′(ズ)とすれほ、
〃研
乃/→CO
がなりたつ。
第2の条件でほ、部分列について、単に相対度数が収束することだけでな く、その極限値ほ、もとの系列における極限値と一致することまで規定してい る。以上の2つの条件をみたす標識系列をコレクティフとよび、コレクティフ 戸おける相対度数の極限値P(Ⅹ)を事象ズのおこる確率とよぶ。
このように、確率をコレクティフによって定義するのであるから、確率とい
# 任意の選択行為という場合にも選択行為は、行為しうるものでなけれぼならないか
ら、その個数は可附番個をこえることほできない。
(701)19
う言葉がもちいられるときにほ、その基礎に、当然コレクティフが考えられな ければならない。したがって、ここでほ、火星に生物のいる確率という言葉ほ 意味をもたない。
1.2 基本的操作
確率についての計算法則をもとめるために、コレクティフにどのような操作 がゆるされるかということを規定しておかなければならない。すなわち、コレ クティフにある操作をはどこして、なおコレクティフであるという性質を失し なわないような操作には、どのようなものがあるか。またその操作をはどこす ことによって確率がどのようにかわるかということをみておかなければならな い。このような操作としてほ、選択、混合、分割、結合の4つがある。
選 択 これほ、コレクティフの第2の条件をのべたときに定義した選択 行為そ鱒ものである。定義から明らかなように、選択によって確率ほかわらな い。
混 合 いくつかの標識を1つの標識にまとめることを混合となづける。
例えば、†A、β、C)からなる標識系列
C,C,B,B,C,A,B,A,A,B,C,‥
において、Aとβをともに1つの標識〟であらわすならば、
C,C,M,M,C,M,M,M,M,C,M,C,
という標識の系列がえられる。これが1つの混合操作である。このとき、〟の 確率P(〟)をもとめると、最初の乃項にふくまれる標識掴の個数乃(〃)ほ、
Aの個数〝(A)とβの個数〃(β)の和であるから、
習(A)+〃(月)
乃−→○◇ 乃
兜・・→Cわ乃
=Ll仔椚_44L+Jf椚ゼ些L=P(A)+P(β)
〝→CO乃 形→0〇〝
をうる。すなわち、加法定理がえられた。このように、加法定理に対応するの
が混合行為である。
分 割 1つのコレクティフから、一部の標識のみに着目して、これらの 標識のみからなる部分列をとり出す操作を分割という0
OLIVE 香川大学学術情報リポジトリ
20(702)
例えば、
(Ⅰ)C,C,B,B,C,A,B,A,A,C,B,C,‥‥・
から、標識Aとβだけからなる部分列
(Ⅱ)β,β,A,β,A,A,β,…
をとりだすのが匁割である。このとき分割によってえられた系列でのAの確率 をもとめる。いま系列(Ⅱ)の最初の乃′項をとる。このプ〆に対して、もとの系列
(Ⅰ)の最初の〝項をとれば、そのなかにふくまれるAとβの個数乃(A)+〝(β)
が丁度プ富′であるような数〝が少なくとも1つ存在する。この期ほ1つの乃′に対 して、1つにきまるとほかぎらないけれども、乃′をかぎりなく大きくすれば、
それにつれて、〝もまたかぎりなく大きくなる。また系列(Ⅱ)の最初の乃′項に ふくまれるAの個数犯′(A)ほ、もとの系列(Ⅰ)の最初の乃項にふくまれるA の個数プ富(A)に等しい、そこで、
′一・・ト ∴…∫・●l 伽 .′‥l. 血 ′J∴ト〃.
才子′→∞ 乃′
タ二【(A)
PI(A)+PI(月)
をうる。
結 合 これまでの3つの操作ほ、1っのコレクティフから1つのコレク ティフをとりだすものであったけれど、この結合という操作ほ、2つ以上のコ レクティフから、1つのコレクティフをつくりだすものである。
いま、2つのコレクティフ
(Ⅰ)〃71,∽2,∽3,
(Ⅱ)〝h′,∽2′,椚3′,
から、
(Ⅱ)(研1,∽1′),(∽2,∽2′),(∽3,∽3′),
をつくったとき、この系列(Ⅱ)がまた,コレクティフになるならば、(Ⅰ)と
(Ⅱ)ほ結合可能であるといい、コレクティフ(Ⅱ)ほコレクティフ(Ⅰ)とコレク
ティフ(Ⅱ)の結合によってえられたコレクティフという。このように結合に
(703)21
よってえられるコレクティフにおいてほ、標識ほ、もとのコレクティフの標識 の対になっている。
例えば、2つのコレクティフ
(Ⅰ)A,A,C,B,C,A,B,B,A,C,C,B,A,A,C,・・・
(I[)B,B,C,A,B,C,C,A,B,A,A,A,C,A,B,‥
から、
(Ⅱ)(A,B),(A,B),(C,C),(B,A),(C,B),(A,C),
をつくったとき、系列(Ⅱ)がまたコレクティフであるとする。系列(Ⅱ)におけ る、(A,β)の確率をもとめる。系列(Ⅰ)において、毅初の紹項にふくまれるA
の個数を犯Ⅰ(A)、系列(Ⅱ)において、最初の〝項にふくまれる(A,β)の個数を 押Ⅱ(A)というように、系列の符号を右肩につゆてあらわす。いま、系列(Ⅰ)に おいてAのあらわれる項と同じ番号をもつ項を系列(Ⅱ)からぬきだすならば、
(Ⅳ)β,β,C,β,C,A,・
というような系列がえられる。この系列(Ⅳ)の最初のが(A)項にふくまれるβ 個数媚(β)ほ、系列(Ⅳ)のつくりかたからわかるように、系列(Ⅱ)において最 初の循項にふくまれる(A,β)の個数犯(A,β)に等しい。そこで、
叫。,β、=肋4旦些_=′才別姓些
〝→CO 〝 才2→C8 紹
血相(β) Ⅰ(A)
〝−>∞両●㌃
をうるが、祀(β)/ク£1(A)は、系列(Ⅳ)におけるβの相対度数であり(工)と(Ⅱ が結合可虚であるとき、すなわち、(Ⅱ)がコレクティフであるときにほ、この
極限が存在するのであるが、とくに、
血,′い∴八 丁川′,∫・ハ・
ね→∞瑠二[(A) ̄〝→∞ 押
が、すべての標識の対に対してなりたつとき、、(Ⅰ)と(Ⅱ)ほ独立であるとい う。したがって、(工)と(Ⅱ)が独立であるときにほ、
アⅡ(A,β)=,2禁誓・巧禁 ⅠよA)
OLIVE 香川大学学術情報リポジトリ
22(704)
=PⅡ(β)・P工(A)=PI(A)・PⅡ(β)
がなりたつ。すなわち、乗法定理がえられる。
たとえば、1つのコレクティフ
(K)C,C,B,C,A,C,A,A,B,B,B,B,C,C,A,C,…
の奇数項からなる部分系列
(Å′)C,β,A,A β,β,C,A.・
は、1つの選択行為によってえられたものであるから、コレクティフである。
同じように偶数項からなる部分系列
(g′′)C,C,C,A,β,β,C,C,・‥
もまたコレクティフである。いま(斤′)において標識Aをもつ項と、同じ番号 をもつ項を(g′′)からえらんだ系列
(茸′′′)C,A,C,‥
をつくれほ、(仔′′′)ほもとのコレクティフ(∬)から「奇数項がAであるとき、そ の次の項をとる」という選択行為によってえられた部分系列であるから(茸′′′)
における各標識の相対度数の極限ほ、(片)および(g′′)におけるものと同じ値 をとる。(互′)の他の標識によって、(仔′′)から部分系列をえらんでも、同じこ とがなりたつのであるから、(打′)と(∬/′)は独立である。
1.5 平均値および分散
* 有限個の実数ズ1,為,t …,g〟を標識とするコレクティフを考える。変数ズ がズ才をとる確率が、考えているコレクティフに∴ねけるズgの確率P(ⅩZ)に 等しいような変数ズを確率変数という。
考えているコレクティフにおける確率のあつまり、すなわち、ズ1に対して
ズ1の確率P(ズ1)を、・範に対してぁの確率P(競)を、・・ 、‰にズⅣの確率 P(ズ∬)を対応させる対応関係を確率分布という。
確率変数の期待値茸(X)をつぎのように定義する。すなわち、コレクティフ
もちろん、無限個の実数を標識とする場合にも.コレクティフによって確率を論ず
ることができるのであるが、榎本理論の展開にほ有限の場合で充分であるので、有
限の場合にかぎっておく。
■
(705)23
(∬)沼1,〝柏,研3,
において、
沼1+抑短+…+川和 E(艮)=〟研
邦・・→CQ
乃
とする。これほ、このコレクティフにあらわれた標識の回数による平均の極限 値である。したがって、確率変数の平均あるいほ、このコレクティフのもつ確 率分布の平均とよぶこともある。
コレクティフ(斤)の最初の〝項にふくまれる標識ズオの個数をナ富(苅)とすれば、
∽1+研2+‥・+∽乃 且(ズ)=J如
Jトヽい、「
〝
・ズ1十〝(ズ望・・孝㌢ト・・+〟(ⅩⅣ)・方Ⅳ 打出〃・\一−
チ£一一>D〇
=ズ1・肋杢茎立+ズ2・伽埋+‥・+粘・肋 〃  ̄ 帽 ナノ
堕)
=ズ1・P(ズ1)+ズ2P(ズ2)+…+ⅩⅣア(私)
がなりたつ。
期待値の考えをもちいて分散か2(ズ)を即(ズーβ(ズ))皇)として定義する。す
なわち・、コレクティフ(打)から
(足り(沼1一別Ⅹ))2,(∽ヱ一月(Ⅹ))2,(沼3一月(ズ))2,
をつくれば、(好′)ほ、(ズ才一即ズ))2の確率が、(茸)におけるズ名の確率に等 し)1ようなコレクティフであるから、(足りにおける期待値ほ、
+(∽和一茸(ズ))2
(椚⊥一E(ズ))2+〈椚2一方(ズ)〉2+
β〔〈ズーβ(ズ))2〕=〟沼
′Z→C8
=〈ズ1−E(ズ)〉2f)(ズ1)+(量一β(ズ)〉2f)(量)+…+〈孝Ⅳ−β(g))2P(耳Ⅳ)
となる。これを確率変数芽の分散とよび、β2(Ⅹ)あるいほ♂2であらわす○ま た分散の平方根を標準偏差とよぶ。
平均と分散があたえられたとしても、分布を決定することほできない○ しか しながら、或程度分布の様子を示すものとして、チェビジュフの不等式があ る。すなわち、不等式
′・、−‥ト ′
OLIVE 香川大学学術情報リポジトリ
24(706)
がなりたつ。
この不等式がなりたつことは、らぎのようにして示すことができる。すなわ ち、
♂2=且〔(g【属(ズ))2〕
=(ズ1【月(ズ))2P(ズ1)」一〈ズ2一月(ズ)〉2f)(ズ2)+・■・+〈方Ⅳ一月(ズ)〉2p(方Ⅳ)
こ \′\り、−−
ト、′.、.′. 、・・ト
≧ ∑
(右一月(ズ))コア(ズ豆)J薫−E(ズ)l≧伽
≧ 研(弟)=裾 (ズ£)
J弟一氾 ∫弟_,■≧ゐ
=ゐ2αコア(lズー屈(ズ)l≧毎)
よって、
〃、′∴\′・r 」 がえられる。
2・調査対象・母集団・標本
我々が知識をえようとする対象となる集団を調査対象とよギ。調査対象を構 成する個体ほ、調査項目ごとに、いろいろな反応をしめすほずである。このお のおのの反応を標識であらわす。いま、1つの調査項目について、調査対象を
構成するⅣ個の個体1,2,……,Ⅳの反応をあらわす標識をXl,g2,・ ,ズ∬
とすれば、この平均ほ
gl+ズ2+‥■+芳Ⅳ
β −=
.Ⅳ
である○もちろん、平均値以外のものについてもとりあつかうことができるの であるが、いづれの場合にも、標識の関数の平均値という型をとるので、本質
的にほ平均値について論じておけば、充分である。また調査項目が定性的な反
応をもつものである場合、ある反応をしめした個体に1、それ以外の個体に0
という標…裁をあたえるならば、算術平均βほ、容易にわかるように、ある反応
(707)25
をしめした個体の比率である。このように、定性的なものに対しても標識のあ たえかたによって、いろいろな量が算術平均の型に表現できるのである。いづ れにせよ、βほ単なる算術平均であって、確率とほ関係のないものである。こ の調査対象に確率を導入して、母集団を構成する。
ここで導入する確率ほ、調査対象の個体を抽出する確率であって、確率が定
まれば、抽出の方法が定まり、また、抽出の方法が定まれば、抽出確率が定ま るものである。このように抽出確率ほ抽出の実際の方法ときりほなすことので
きないものである。抽出確率を導入するということほ、調査対象の各個体1,2,
‥,〃がおのおの、あたえられた確率をもつようなコレクティフを構成するこ とである。コ.レクティフほもちろん理論的な概念であって、実際につくりだ すことほできないものであるけれども、現実の中に、実際問題への適用におい て、充分コレク・ティフとしてとりあつかいうるものをつくりだすことほでき る。これが乱数表である。乱数表をもちいて実際に母集団を構成し、標本をと
り出す方法についてほ後にのぺる。
本稿でほ、すべての個体が等しい確率1/Ⅳで抽出されるような場合について 論ずる。このような母集団が構成されたということほ、調査対象の各個体すな わち、母集団の構成要素ほ、1,2,…,Ⅳの数であらわされているのであるから 1,2,……,Ⅳのすべての数が1/Ⅳの確率をもってあらわれるコレクティフが構成
されていることを意味する。このコレクティフを
(P)β1,β2,酌,
とする。いま問題となっている調査項目に対して個体β慮のもつ標識はズggであ るから、(P)に対応する標識の系列
(Ⅹ)為1,Ⅹβわズβ8,
をつくる。(P)はコレクティフであるから、(ズ)もまたコレクティフである。
(ズ)における期待値をもとめれば、
jお1−ト為2」−・・・+盈銅
且(g)=J如
犯一⇒−Cく)
〝
=Ⅹ1f,(1)+Ⅹ2タ(2)一トt・十‰P(Ⅳ)
OLIVE 香川大学学術情報リポジトリ
26(708)
=ズ1【卜g霊+・‥」一‰
ズ1+ズヨ+川+芽Ⅳ
Ⅳ = 8
をうる。このg(Ⅹ)を母集団における期待イ直という。上にしめされたように、
母集団期待値凝、調査対象における標識の算術平均に等しい。
我々の知ろうとするのほ、調査対象における量であり、標本の統計量と直接
関係のあるのほ、後にしめすように、母集団の期待値である。そこで、母集団 期待値が、調査対象におけるもとめるものと一致するように、母集団を構成し
なければならない。母集団は、調査対象の各個休が抽出される確率を定めるこ とによって構成されるものであり、同じ調査対象に対しても、抽出確率のあた えかたによって、いろいろな母集団を構成することができる。本稿で論じて いる等確率の母集団以外にも、母集団期待値が、調査対象における平均と一致 するような母集団な構成することができることほいうまでもない。
つぎに、標本を摘出する操作なのべるのであるが、母集団のコレクティフほ 前にのべたように、
(P)β1,β2,郎,β4,β5,
となっている。これからまづ勘を部分系列(∬1)の第1項、伽を部分系列(∬2)の 第1項、 、‰を部分系列(g柁)の第1項とする。
つぎに、†gl,β‰‥=‥ ,βJ・∝なかに、少なくとも2つの相等しいものがあ って、相異なる要真の個数が犯より小さいときにほ、β叫1を(耳叫1)の第1項と
する。さらに、(gl,β2,・‥,β,あフβ柁+1)の相異なる要素の個数が、 〃より小さい ときに鱒、β叫2を宵7ムl・2の第1項とする。このようにつづけるならば、(P)は
Ⅳ佃の要素がすべて、確率りⅣをもつコレクティフであり、ク官<Ⅳであるから、
/
無限個の∫について、(β1,β2,・‥,β抽‡がプ7より少ない相異なる要素をもつと いうことはおこらず、ある∫(∫==0,1,2,・・‥・)について、(β1,β2,‥・ ,β叫ざ)
が相輿なる頑固の要素からなる状態に達する。このとき、β′叶叶1を(∬1)の第2
項、♂叫叶2を(垢)の第2墳、 、g摘+細aを(仔,る)の第2項とする。つづいて、
(709)27
前と同じように、(♂輌+1,β叫叶2,‥∴‥,β叫叶乃)の相異なる要素の個数が紹より 小さいときにほ、鋸咄叶叫1を(茸叫1)の要素とする。というように前と同じ方法 をくりかえして行く。
上のような、部分列の構成法ほ、第ダ項がある部分列(茸ノ)にふくまれるかど うかを、第オー1項までの知識をもちいて決定しているのであるから、1つの 選択行為である。したがって、各(∬豆)ほ各要素の確率が、もとの系列(P)と同
じ1/Ⅳであるところのコレクティフである。さらに、・(∬名)ほすべて独立であ る。
上にのべたような構成法によって、
(∬1) gl,録+2,β9乃十2,β8鋼十4,β如十4,β6乃+4,……・・…・
(鞄) 払 β乃+3,g餌+3,e3乃+6,β如+6,β6乃+5,・・
(穐) β紹,β触+1,β紬+1,β如+3,β6殉+8,gG銅+3,・・
(j㍍+1)β乃+1,
g8殉+2,(垢+2) β紬+3,
がえられたとする。これを
(gl)βi,β去,βま,e呈,β孟,β去,
(鞄)β箸,β三,β冨,β呈,β…,β言,
(j㍍)β芋,β芸・β冨,略,紹,絹,
(鶴+1)β冒十1, β琶十1,
(鶴・2)
β+2
,
とかく。これから、系列
(51)(g壬,β≡,‥ペ,牢1),(β主,β笠,‥■β笥,),(g墓,g≡,・‥β紺B,β朽・…‥
をつくる。この系列(51)の各項ほ、標識1,2,……,Ⅳの相異なる犯個からなる順
OLIVE 香川大学学術情報リポジトリ
28(710)
列である。この順列の順序を無視して、如何なる標識からなりたっているかだ 桝こ着目すれば、これは(51)に対して混合行為をはどすこととなる。このよう にして、(51)から(52)をつくれば、
(S2)〈α壬,α去,…,α左〉,i〟芋,α冨,…α≡),iα苧・α…,…,α莞),
をうる。
(Sl)の各項にふくまれる(P)の項β富の数ほ、有界でほないが、(P)から(51)
をつくるとき注意したように,有限であるから、(51)ほ無限系列である。した がって、(島)も計た無限系列である。(S2)がコレクティフであることをしめす ためには、まづ、各標本の相対度数の極限が存在することをしめさなければな らない。この極限値ほ、(52)がコレクティフであることがしめされたならば、
確率とよばれるものであるから、簡単のために、ほじめから確率とよんでおく こととする。(53)における各標本の確率を論ずるために、一般性を失しなうこ となく、1,2,‥,プZの〝個の標識からなる標本について考える。(島)における 標本(1,2,……,わほ、(51)において(P)の項β¢の数が、〃個であるもの(〔1,
2,……,紹〕クaであらわす),乃+1個であるもの(〔1,2,……,77〕姉1であらわす)
ク7+2個であるもの(〔1,2,……,クZ〕榊2であらわす), ‥‥… ,というように わけることができる。
〔1,2,‥・,ク‡〕ク。の樅率をもとめる。これほ、(51)においてほ、1,2,‥…・,〝の〝!
個の順列としてあらわれている。いま(51)の最初のれ項にふくまれる順列(1,
2,‥・‥・,〟)の個数を∽(l,2,……,形)とする。(Ⅳ1),(上ら), ,(片クa)
ほいづれも、(P)から選択行為によってつくられたものであり、またそのつ くり方からわかるように独立であるから、
J抽ク可1,2,二竺L=Jわ乃 一竺L(吐。J言明¶聖⊥竺⊥……JZ∽ 竺当塑
∽→∞ ㈹ (茸1) ∽ (梅)プチ2 (∬閃)∽
=ア(1)・P(2)・・・・ ア(〝)
がなりたつ0ただし、〜競ほ系列(打ヱ)での極限をあらわし、∽電(烏)ほ(茸 )
(711)29
の最初の別項にふくまれる標識点の個数をあらわすものとする。
したがって、
P(〔1,2,…,乃〕乃)=∑P(αいα2,・‥,α乃)
〝!
脾
ここで、∑ほ、1,2,……,〝の乃個からなるすべての順列についての和をあらわ す。
〔1,2,‥‥・・,〝〕叫1の確率をもとめる。α1,α2,・t…・,α乃ほそれぞれ1,′2,……,邦 の相異なる数をあわすものとすれば、〔1,2,‥,ブ7〕叫1ほ(51)においてほ順 列、(α1,α1,α2,……,αナa),(α1,α2,α1,・・・,α銅),‥・‥等となっている。これ ほ、第2項が第1項と相等しい順列(勘,α1,α2,……,α柁),第3項が、第1項ま たほ、第2項と相等しい順列(α1,α望,ガ,α3……,α乃), ・ ,第プ7項が、第
1項から第(乃−1)項までのいずれかの項と相等しい順列(恥α2,‥・,α乃_1,ガ,α7。)
にわけることができる。
いま(恥α1,α2,・‥シα犯)の1つである(1,1,2,・・…,乃)について(51)におけ る確率をもとめる。
を研(1,1,2,……,〝)とし、(1,1,2,……,プ‡−1)の個数を∽(1,1,2,‥,
乃−1)とする。(茸1),(∬2), ‥ ,(斤クa)のおのおのの要素について、
g才=1,β号=1,βぎ=2,…‥㌧ 甘利町1
がなりたつ番号£についてほ、(好子)のつくり方からわかるように、(私+1)
の要素がかならず存在する。またこのような番号才をもつ(∬叫1)の要素は、
** (吼+1)の部分系列である。これを(鶴+1)であらわす。(j㍍+1)は容易
にわかるように、(P)から選択行為によってえられたものであるから、1つ のコレクティフであり、各標識のもつ確率ほ(P)におけると同じ1/Ⅳである。
* *
(軋+1)の最初の∽(1,1,2,…,プ7−−1)項にふくまれる標識77の個数を∽叫1(プ官)と
*
する。〝ク叫1(犯)ほ容易にわかるように、(51)の最初の∽項のなかで、
β才=1,βデ=1,♂.㌘=2,……,βま石=〝−1,β牢Jl=〝
OLIVE 香川大学学術情報リポジトリ
30(712)
を満足するものの個数であるから、
研禅ク止1(花)=椚(1,1,2,・‥,〝)
したがって、
P(1,1,2,‥=‥,招)
∽(1,1,2,‥▲,紹) 〝7(1,1,2, 二・_ど二:ユし./加 酢㌔+1(乃)
= gZ,乃 = 〟わz _
〃7→∞
弼 椚→∞刑(1,1,2,…,〃一1)
=P(1)・P(1)。・・・P(〝−1)。P(〝)
1
〝7→CO 〝プ
1 一ご十1
をうる。
(勘,α1,α2,■ ‥,αね)という型の順列の個数ほ 花・1・(〃←−1)……‥ 2・1=〝!
したがって、
ズP(α1,α1,・t・,α紹)=孟r
をうる。
以下同様にして、
(α1,α2,ガ,α3,……,α,a)の塑の順列の個数ほ
紹・〃−1・2●邦−2●・ ‥ 2.1= 2.プ2!
(α1,α2,鶴,ガ,……,α殉)の型の順列の個数ほ
〝・〃−1●〃−2.3●犯㌧−3……‥2.1= 3.〝!
したがって、
P(〔1,2,……,〝〕か1)==ヱ f(α】.α1,……,αれ)+g∵P(α1,α2,∬,……,α,る)
+……+ヱ∴P(α1,α2,……,∬,α乃)
1 =一節才一〈乃!+2紹!+3紹!+……+(兜【1)叫
搾!
脾+1
乃!
 ̄ 脾+1
(1+2+3+・…‥+(紹−1))
7J−1
● ∫ 古
式=1
亭j
(713)31
をうる。
〔1,2,……,搾〕叫Zの標本ほ、 (51)においてほ、ズおよびッをそれより前の芋i のいづれかと相等しい数をあらわすものとすれば、(仇,α1,β1,αg,……,β殉),
(勘 葛の型の順列とし
てあらわれている。このおのおのの順列が(51)において、確率1/押汗2をも つことは前と同じようにしめすことができる。
(α1,勘,α1,α2,‥・=∵イ玩)の型の順列の個数ほ 乃・1・1・(搾一1)‥・ ・2・1=搾!
(勘,ガ,α2,ツ,α3,……,α免)の型の脹列の個数は
〝・1・(刀トー1)・2。・(〝−2)‥ ‥
・2・1=1・2・狸!(α1,ガ,α望,α3,γ,‥・=・,αクあ)の型の順列の個数は
〃.1.搾一2.搾−3.3●‥‥‥●2.1=1・3●〃!
(α1,α2,∬,ツ,α3,…… ,α柁)の型の順列の個数ほ
形.〝一1.2.2.乃一2..・02.1= 2.2りプ!
(α1,α2,∬,α3,ク,……,αク3)の型の順列の個数は
〝.邦−1.2.雅一2.3.・・.2.1=2.3・兜!
(α1,鞄,・t・,α渦_1,∬,ヅ,(玩)の型の順列の個数ほ
〝・〝−1……‥ 2・(乃−1)・(〝−1)・1=(〝一1)・(〃−1)。タブ!
したがって、
P(〔1,2,…‥・,〝〕銅十2)
==ヱ ア(α1,(H,α1,αコ,……,α乃トト∫P(α1,∬,α2,グ,αB,……,αタ石)+‥‥‥
+∫P(α1,α2,‥‥=,∬,ツ,α乃)
一 云 〈1+1・2+……+日日)+2■コート2・3十…‥・+2・(〝−1〉
+……+(邦−1)・(光一1))
1 閃一1銅一1
\
=g2−ト千.ざ小城・ . 宜=1 −1==2〉す1
OLIVE 香川大学学術情報リポジトリ
32(714)
同様にして、
鞘1,2,…・・・F〝〕ク汁B)=云
クa−1 クる一1 オ3十∫ ∑ gl才22flそ2キそ1
拘−1
+ ∫ ブ1ヱ2Z3
官3〉72〉£1
ア(〔1,2,…‥㌧乃〕かた)
〝!
Ⅹノ叶「
ク石 ̄1
紹−1クa−1∫ 才た」∫ ∫ オ1才2た−1+‥・‥・
拝1
+
搾1す2キfl
和一1
ご
7た〉‥・〉′2〉ヂ1
〜1f2…・‥グた)
をうる。
以上のことから、(S2)におけるi,2,3,………,〃からなる標本のもつ確率 P(王,2,‥・,わをもとめることができる。すなわち、
C(⊃
P(1,2,……,光)=g P(〔1,2,…‥・,〝〕殉り)
j=0
し㌫+㌫(賢二fト造㌻(訂〜2
+意㌃使古ゎ+等1′1頼+・ 虞2≠オ
1
閃−1
+ ご
子2≠官1 ダ1f2)
殉−1
∑
」_
き喜一f3‥・fたノ
g ′1〜2た ̄1+……+
虞た>…>官2>〜1
1+才+
=意〈(芸)(
ク葛−・1
∫f2 + ヱ グ1f2)+…
ilく官2
+駿㌦舘凧+
をうるが、(‥・…)の中の級数は、
1+++‥…
1・+ト‥
m−1
∑ Zlブ9わ ̄1+……+
ま1く富2
犯−1
z z
す1ぐ2く…く㌔=fl古里…ヰト〉
(光一1)個の無限級数
1+等壬+一堕宗じト‥
\
(715)33 の乗積級数であるから、
P〈1,2,…‥・,搾〉
憲+掌ト)
=意(1+忘+去+……)(1+是+蒜+1‥(1十
〝!1 1 1
 ̄河こ●i●‥1一一
犯!
.Ⅳ一10.Ⅳ一2。……
・.Ⅳ一〝十1をうる。
以上によって、(S2)において、1つの標本のもつ確率ほり(君)であること
○がしめされた。
つぎに、(52)から任意の選択行為によって部分系列をつくる場合について 考える。(52)古と関する選択行為ほ(S望)の第1項から第才一一1項まセの知識
によって、第£項を部分系列にとり入れるかどうかを決定するものである。し たがって、このようにして得られる部分系列は、(P)に対して、ある選択を 行い、その遜択系列について、(P)から(51)および(52)をつくったのと 同じ方法を適用してつくった標本の系列と一致する。そこで、この部分系列に おいても、各標本ほ(52)におけるものと相等しい確率をもつことが上と同じ ようにして、証明することができる。このようにして、標本の系列(52)はコ レクティフであることがわかる。
5 推定の方法
前節において、各要素がすべて等しい抽出確率をもつ母集団から、模本の系 列をつくりだす方法をのへ、このようにしてつくられた標本の系列において、
おの畢のの標本の出現する確率ほすべて1/(雷)であることをしめした0標本に ふくまれるおのおのの個体ほ、いま問題にしている譜査項目に対してそれぞれ の反応をしめすほづであるが、この反応をあらわす標識ほ、標識ズの定め方か
らわかるように、(52)の第盲項の・標本について ズ〃…,Ⅹα豊,・‥・,Ⅹαた
となっている。これを
OLIVE 香川大学学術情報リポジトリ
34(716)
∬至,∬芸,=…,∬た
とあらわす。このように、おのおの標本ほ、それぞれ対応する標識の組をもっ ているが、この標識の組によって、2つの関数
轟,か‥・,璃) く盲(∬i,か‥t,∬喜)
を定義する。この旦を下の信頼限界、妄を上の信頼限界とよび、標本からの推
定を、母集団期待値芳ほ、阜と妄の間にある、というように行う。このとき区 間(旦,妄)を信頼区間とよぶ。このように行うならば、標本のあらわれ方によ って、標識の組(∬至粛‥・・・,∬孟)ほいろいろ異なったものとなるので、母集団 期待値が宣と盲の問にふくまれる場合と、ふくまれない場合が生ずる。すなわ ち、母集団期待値音ほ盲とざの問にあるという命題ほ、真であるときもあるし、
偽であるときもあることとなる。そこで、(53)のおのおのの標本について、
この命題が兵であるかどうかをみる。この命題が兵であるとき、すなわち、
ぎ(∬壬,か…・琉)≦芳≦盲(如雲・…
・璃)がなりたつときにほ、標識1を、この命題が偽であるとき、すなわち、
貫く旦(∬至,棺=…・ズ孟)
またほ、
盲(ガ壬,か‥・,需)く芽
となノているときほ、標識0をあたえるならば、(52)から、1,0の系列、た とえば、
(C)1,1,1,0,1,1,1,1,0,0,1,・
をうる。1この系列もま.た、容易にわかるように、コレクティフである。との系 列において1のあらわれる確率、すなわち、母集団期待値ほ、標本について定 義●した関数ざと盲の間にある、という命題が兵である確率を推定の信頼度とい
う。信頼度をαであらわせば
P(1)=P〈g≦:ズ≦g)=α
(717)35
となっている。
平均値について、普通にもちいられる方法ほ、各標本について、標本平均虎 を、
−そ ∬空巾汁・・十戒 ∫ =  ̄ ■
,富
J
と定義することによっ七、(S2)から、標本平均虎名の系列
(〟) ̄嘉,盲2,妄3,
をつくる。(〃)ほコレクティフであり、おのおのの標本のあらわれる確率ほ
/(雷)であることがしめされているから、どの標本論の書物にもしめされてい るように、
且(妄)=且(g)、=芽 となり、元の分散ほ
如)=芋
がなりたつ、た挺し、♂2は母集団分散をあらわす。これをもちいて、上、下の 限界
ざ=嘉一良一歪甘
こ・ 、
をつくれば二信頼度αほ
∧r−〃.一ご
Ⅳ−1〝
α=専一ゐイ雷雲≦夏≦完+鬼イ憲∃憲
となる。このαの値ほ、々の周数であって、たとえばチェビレェフの不等式に よれば、
点 J砦葺憲〉≧1一去
′・い、ざ 雲≦Ⅹ尋+
がなりたつ。チ云ビレェフの不等式ほ、如何なる確率分布についでももちいら れる辛いう長所・をもつものではあるが、あまり能率のよいものでほない0そこ
でよく問題になる平均値の推定の場合についてほ信敏度を評価する不等式がい ろいろ工吏されている。
OLIVE 香川大学学術情報リポジトリ
36(718)
以上のように、標本からの推定ほ、信頼区間と、信頼度によってなされるの であるが、実際に調査が行われるのほ、1つの標本だ桝こついてである。すなわ ち、(52)の系列の第1項の標本だ桝こついて調査が行われるのである。した がって、この標本の調査の結果からつくられた信頼区間に、母集団期値芽ほ、
ふくまれているか、ふくまれていないかいずれかである。しかしながら、その いずれであるかほ、母集団期待値がわかっていない以上判別することほできな
い。すなわち、結論の真偽ほ不明である。しかしながら同じ調査を、標本をと
りかえて、すなわち、(52)の第2項の標本、第3項の標本というように、つ
ぎつぎと、調査して、その結果から信頼区間をつくり、母集団期待値君ほ、こ の信頼区間にふくまれているというように結論を下して行くならば、正しい結
論を下している確率ほ信頼度であるαに等しいということが保障されている。
.こういう意味で、標本調査に信頼するのである。以上のように、標本調査にお いてほ、1つの標本について、結果の真偽ほわからないが、同じことをくりか えすならば、正しい結論を下している確率が信頼度αとしてあたえられてい る。そこで、信頼度ほ大きいことが望ましい。しかしながら、信頼壕を大き
くするためにほ、信頼区間を大きくしなければならない。ところが、信頼区間 ほ、結果に対してつけられる巾なのであるから、これがあまり大きくてほ結果 の意味がなくなってしまう。そこで信頼度としてほ、95%あるいほ99.7%とい う値が慣用されているのである。
本稿でのべたのほ単純ランダム・サンプリングであり 、標本抽出の方法ほ、
これ以外に、層別抽出法、多段抽出法、率統抽出法等があるが、これによって異 なるものほ標本平均の分散の型であって、その他の考え方は全く同じである。
4 標本抽出の実際・乱数表
以上によって、標本謂李の理論をのべたのであるが、以下にこの理論が実際 の方法とどのように関係しているかをのべる。標本の抽出によくもちいられる
ものに乱数表がある。乱数表のつくり方にほいろいろあるけれども、矩形乱数
表とよばれるものほ、一般に、00,01,・・,99の100個の2桁の数がおのおの
.(719)−37
ソ1。。の確率であらわれるコレクティフとしてあつかいうる数列である。コレク
ティフほ勿論理論的な概念であって、現実につくりだせるものでほないけれど も、実際への適用において。コレクティフと考えうるものをつくりだすことは
できる。これが乱数表なのである。したがって、乱数表に対してほ、コレクテ ィフについてゆるされる操作、選択、混合、分割、結合の4つの操作ほ適用し うるものである。
いま例えば、630人の人からできている調査対象に、おのおのの人が等しい 確率1/630で抽出されるような母集団を構成し、10人からなる標本を抽出するこ
ととする。まづ調査対象のおのおのの人に1番から630番までの番号をつける。
つぎに、1,2,・‥,630のおのおのの数がすべて1/63。の確率をもつような系列を つくることがてきれば、母集団が構成されたことになるのであるが、このため に乱数表を利用する。乱数表ほ
2507790769 7293 884464 9370707031 3992778101 06 6192 27 733 4722326818 2640321002 62 07 57 97 46 474373 6870 7976584099 3767509757 2715723524 6015764107
10 99088931 3168847112 9002921149 22450107 06 2813367257 4615 9495 83 2500795608 7328751805 6957441918 8420901054 281219UO30 2268053912
380426 7107 9847 0326 51 16 69545172 28 86 64 30 37 0439645280 97 64 57 42 45 7912 874223 0415032620 52 03 51 56 27 196635 3287 734513 5977
0930009282 9278161432 7046 98 5108 6305789661 8045989321 440397 0834 19 00 84 79 91 2428083244 8155 318898 6440 431527 4614829430 12 07273726 312876 6133
46 79 097386 89 87580191 2834914377 2246416721 93 37494729 52897373 86 3417555172 1724 7373 79 01 30 54 00 60
8203424062 0695344508
2161633876 0358856854 48215351416293894219 8776685188 5340830368 9321061262 3358606154 9777541715 3414088691
882250肌09 64229177715232636589 6581118373 908987■5851 8768280047 8086()13792 3425838390 33486149511835805364
6092345799 3462963157 8253226704 0762925849 8586676702 7087611580 3351546679 9842545015 3307896844 6382453471 1472880602 930866222015886081315655520615 7699947868 6031300693 5667912638 7975760970 6230283033 5501319095
OLIVE 香川大学学術情報リポジトリ
38(720)
というようなものであ。いま総数ほ630であるから、この乱数表を3桁によんで
239120970
3 6 6 9 7 0 5 9 4 4 7 5 7
2 16
2 3 8 3 2
9 5 1 2 4 7
3 1
という数列であると考える。このように考えるのほ,つぎにのべることを基礎 としているのである。すなわち、もとの数列を、奇数列と偶数列にわけて
(私)31,46,89,28……,76,09,‥‥‥
(月2)28ゝ79,87,34…・・,61,73,・
の2つの数列をつくる。これほ選択を行うことである。つぎに偶数列(屈2)に ついてほ、左側の数だけをよむ、すなわち、(月2)から
(忍2′)2,7,8,3,・・,6,7,・
をつくる。これほ、たとえば、20,21,・・,29の10個の数字をすべて、2とす ることであって、混合を行うことである。したがって、(点2′)においては、お のおのの数の出現する確率ほすべて1/10である。つぎに、(私)と・(忍2′)を結 合すれほ、
(点3)(312),(467),(898), ,(766),(097),
をうるこの(屈3)では、000,001,・,999の1000個の数が1/1000の確率であら われる。これが丁度、前にのべた乱数表を3桁によんで得られる数列である。
つぎに、000および、630より大きい数をすてて、001,002……,630の630個 の数からなる系列
(虎3′)312,467,283,・・,097,・
をつくる。これほ分割行為であるから、(屈3′)においてたとえば312をうる確 率P3′(312)をもとめれば
昂(312)
アリ(312)=