統計値の信頼度-香川大学学術情報リポジトリ

47 

Loading.... (view fulltext now)

Loading....

Loading....

Loading....

Loading....

全文

(1)

近東二般現象の研究に於て其等の理論的方面の研究のみならす質謹的即嘗際の統計による研究がいよく盛に

なりつゝあり。之即其の現象の節々の観察に於ては甚だしく不規則であるが、極めて多数のものを一節の集困と

して親祭する所謂大量親祭に依れぼ此起に山定の規則正しい法則が後見せられる寄が歴々あり、之に依つて其の

理論的研究の経典が寛際的に慣値づけられるのみならす、之等の統計による結果から其の理論的研究が叫静進め

威計借の倍増度 目 次 説

第一 線

第 二 誤 差 接 則 第 主 正 規 曲 線 第 四 確率誤差、倍粗度

第一 線

統計値の信頼度

発 第 簡 第 五 大 七 八 説 算術卒均の標準誤差 槙準備業及び相関係数の標準誤墓 中位数の梯準誤差 標本朝敵の賓鹸方法

時 重

二ニニニ

(2)

られるのである。 併L乍ら嘗際統計調査に菖り極めて多徽の試料は集め得すして其の内の比較的少数の試料を集め、.それを叫蔚 の板木︵S。ヨP訂︶として、それ些就いて観察した結凝で満足するより仕方がないのである。此の場合前者の極め て多数の試料のことを標本観察の母域︵P。号▲纂。コ︶と云ふ。而して此の標本を抽出するに雷り常該調査の目的に 副ふやうに冊i四釆かだけ合理的豊ハ等の標本を構成する試料を選接せぜるべからす。併し資際に於て斯やうにA量 的に標本を抽出することは極めて困難とする麗にして、あらゆか方面に渉り調査研究を轟さゞるべからす。 ︳ 昔々は此魔に最も合理的に棟本が抽出されたるものとLて﹂此の少数試料による模本より観察せる平均値、療 準偏差及び相関係数等の統計値が果して幾何の信頻を琶き得るやを考察せんとす、るのである。此の信頼度 ︵R。t訂b≡ぞ︶の研究結果は現今の統計畢の大家たる倫敦大軍のカ7ル・ピ′ィァスン︵KariPears。コ︶教授及び同教授 指導の下に彼の門下生等の求妙たものである。筆者も曾て同教授の研究窒に敬て中位数及び国分位数並に共等に 関する種々の統計値に封する研究を馬したり。 本稿に於ては山般の読者に理解し易からしむる馬め信頼度の研究の賓際上極めて翼要なる部分のみを出来る‖だ け初等的に詮述する番に努め高遠なる数理的理論の詮朋は避け一なりゾ 上述の信頼度を述べる前に其の準備として終業法則及び正規敵終に就いて稔明する必要がある、次に其の概略 ▼ を述べよう。 高聡高等商染轟校開校十周年記念論文賃 二三四

(3)

第二 誤 差 法 則

前述のやうに少数の試料より成る療本から得られる統計値の償揖慶は其の棟木観察の統計値と其の母城より得 らるペき其の統計値の眞の値との差を考へることに膵著するのである、それには褐逸のガウス︵CaユF−㌢−Cト G呂SSlヨ∼−00眉の興へた次の誤差法則︵トawO巾E㌢r︶なるものがある。 ガウスの誤差法則 此の法則を述べる前に先づ扱差なるものに就いて並べて置く必要があ告それには次の二桁ありて即或値を賛 騎観測するときに其の計算の換り、数字の読み違払等の過失による誤差及び観測者の癖、観測神城固有の誤差等 のやうなものを系統的誤差と云ひ、之等の誤差は其等の原因を充分調奄する専に依って訂正するを得べし。併し 乍ら其の他の秤々の小なる原因の鼎錯綜し合へる原因による誤差、之を偶然的誤差と云ふっ之は到底訂正するを 得ざるものである。か1る偶然的誤差に就いてガウスは次の三つの恨定の下に即 ︵こ絶封倍の相等しい二つの誤差の起る横倉は相等しい。 ︵二︶小なる誤差は大なる誤差よりも起り易い。 ︵三︶極端に犬なる誤差は起らない。 と云ふこちの恨定の下に、∬なる誤差の生すべき確率γの値は 統計値の信頼度 二三五

(4)

但しヵは観測値に依り定まる常数にして、どは自然封数の威として川ひられる二、七一八⋮⋮なる儒教である。 之に依って表されることを敬見したのである。此の詮明は高等数理に依る確率論より得られるものにして本稿の 目的にあらざる故に此庭では其の澄明は省くこと1する。 次に若しNを充分大なる観測組数とするとき∬の誤差の生すべき回数′は

ヽ=芝営轟偲=且㌍妻

なる式から得られるのである。之は確率論に於ける期望金額の算定法から出て来るのである。 此の観測挨差の基礎論を述べたのは彿蘭四の大数聾者ラプラス︵三彗号sde﹁旦aceL藁這∼︼00l︶Jにして次いで ガウスが上述の誤差公式を教見したのである。 次に此の誤差法則に基く正規曲線に就いて略述しょう。

第三 正盟 曲 線

︶ −正規曲線の意薫 ︵ 統計に於て各階教の数盤に射する分類結某を度数と云ひ、其等の度数列を度数分布と云ひ、それを固にて表す に其の階級の数量を攣数として横軸にとが、それに封する各度数を其の函数として縦軸にとつて高かれた曲線を 電撃尚等商業拳校開校十周年記念論文集 山︶

こ二〓ハ ′、■

(5)

度数曲線と云ふ。 此の度数分布に於て度数の敢も多い箇朗の欒恩を中心として他の度数が其の前後に均等に減少し、之を岡示す れぼ鎌形妖を馬す度数分布を正規分布と云ひ、例へぼ徴兵検寮の批丁が約一、六〇米の人数が最も多く其の他は 其の前後に二様に減少しiE規分布を為すが如きものである。 剛般の度数分布に於て其の算術平均値から観測値迄の菜を偏差と云ひ、此の偏差の平方の平均の平方根を標準 偏差︵Staコdarddeくiatぎ︶と云ふ。棲輩偏差は誤差の方面から梗準誤差とも唱へられる。 仙般の度数分布に於て其の棟準偏差の小なるもの梓其の度数分布が平均値の周囲に多く密集して居る事を示す ものである。伐つで棟準偏差は模本観察の信頼度の測定の要素を為すのである。 標準偏差は斯の如く度数分布の散布の度合を示すのみならす、踵々の分布状態を残す統計の比較研究に於て婁 数、度数、其の他統計値の測定の軍使として重要なるものである。 上述の各偏差を有する各度数の分布状態が正規分布を残すものは萌適の誤差法則に常て朕まるのである。即度 数分布の算術平均からの偏差計石とし其の梗準偏差をげ︵シグマと云ふ希臓文字︶とすれぼ、其の偏差に封する 度数は其の分布が正規分布を馬すならば

昔㍑紺q・車︵⋮ご

一 にて表される尊がケトレー︵L巧﹂・Pue墜2ニ讃爪−.︼00遥︺の尊兄したものにして、之が問示せられる曲線を正規曲 統計佃の信柁度 二三七

(6)

高聡高等薗染痘校開校十周年記念論文集 二≡入 線︵NOrヨ監Cu﹁くe︶或は後見老の名を用ひケトレー曲線と云ひ、現今の統計方法論の研究に於ける正規分布論の 基礎を成し勉めて重粟なるものであるっケトレーは白耳義の偉大なる敷革卦にして且天文単著たり、叉敢命現象 の研究にも非常なる貢献を属したり、彼は鵬七蔵にして数単の教師を勤め、二凶歳にして早くもR。蓬碧a倉∃y の合点たり、一八二三年より数衝年巴里に曹癒し数拳をフーリエ︵F。ur替︶に確率論をフプラスハ﹁蔓ace︶に畢び、 此の方面に多数の論文を畿表せりと云ふ、資に統計拳の父と云っても差支へない人である。 上述の正規曲線は二項級数の展開の各項よりなる度数分布所謂二項分布より得られるものである。依つて正規 曲線を導き出す前に此の二項分布に就いて述べよう。 〓■項分布 若し二つの貨幣を投げるときは、二つ共表が出るか、二つ共塞が出るか、或性叫方が表が出て他の叫方が塞が 出るかの何れかである。 今Hを以つて表を示し、Tを以つて姦を示し糾、拘を以って二つの貨幣を笹別すれば次の如き結兼となるこ とが簡期されるであらう。 ︵l︶−︵虻︶ T︶、叫ノ ︵l︶−︵N︶ 一.■ 〓 〓、T ︵こ︶ ︵e =﹂一=

(7)

之は一括Lて次の如く表される。 T∽+∽T柏H十∽TH皿+琵∽=へT十嵩︺∽ 此の最後の式に於て糾へぼ二項目の係数3些こつの貨幣の内側つが表が出る数で、それ些二筋の内∵二間とる組 合せの数に等しいのである。 〓仮に0、1、2、3⋮︰・n笹薮が出る度数は.︵T十H︶nの二項式を展粥した各項の係数に等しいのである。 次に例へば二つの貨簡を百回投げて二つ共裏の出る回数、山方が塞が出て他方が衣の‖る回数及び二つ共表の 出る回数を前例を用ひて求めよう。 ︵イ︶繭方共裏が出る確率は 之は仙指して次の如く表される。 TギNTH十H柏=︵T十H︶柏 次に三つの貨簡を投げるときは向様にして次の如く預期せられるのである。 統計偲の信糖度 T.T− ハー︶︸ ︵e︸ ︵∽︶ T ○︶、 T﹀ T︺ H﹀ ︵M︶、︵∽︶ T︶ H ﹁ 〓一 T−T ︵C−︵N︶● ︵e

T−H“H

〓↓、﹁一〓 〓一〓・一J ︵C−︵柏︶−︵∽︶ H−呈一H

(8)

︵ユニ方が基が出て他の一方が釆の出る確率は ︼ い∵・ ︵ハ︶南方共衷が出る確率は 一

・X=十

ゆ ︵上述の各屠合の度数は前例から得られる︶ 之即二項式︵車+車︶沌の展開による各項にて表はされる。即 ︵車十車︶㌦車+﹂﹁一十車 依って百回投げた内で 警共慧望度慧−○。×車‖度して、妄が遁が出て讐が表の出る霊はー。。×車=苦して、雲

共表の川る度数空言×=

試である。即

旦NトX十︶ど≡車+Ⅰ蓋×車エ00祈車=N∽・警N∽

の各項で表はされるのである。 一般に述べればpを其の事象の起る確率とし、qを起らない確率とするときn皆の澗立寄像︵ニッ以上の事象 ● 高松高等商業聾校開校十周年記念論文発 *=ト A 二四〇

(9)

N︵p+q︶㌔Nq︼・十誉pq−T√2庸忘−チb考−ず⋮⋮+Npロ

あ右避の各項で表されるのである。

今上式の左逸をら肯にて表すときは

苛qn十雲n・.十裾pざ〒ご丁⋮⋮+pn

之が表はされる曲線を二項分布曲線と云ふ。次に之を度数分布表にて示し、其の平均値及び梗準偏差を求めれ

熟泣出、て回津 陶 輝

に於て其の内の任意の血つの尊象の起る確率が他の事象の起る起らぬに完く影響されない場合に其等の事象を猫 立寄象と云ふ︶のN回の試みに於て0、1、2、3⋮:⋮㌧n国威功する度数は Z︵p十q︶。 の展開式の各項即 鴇 ○ − N 統計値の億枚度 .、 q。 3pqn⊥ 憬れ⋮㌔七ギ丁拍 Nヱn−−︶pギT嶋 n︵コ・−−︶鴇qn■柑. 二四−

(10)

度数の絶和は ト十.か+か十⋮⋮⋮+トーー♪、=Nり︵p+q︶n=− gはシグマと云ひ総和を表す略記放である。 算術平均;は 8.=・中︵.ぎヰゎが†⋮⋮+哲n︶=♪甘

棲準偏差♂は

㌔=中震︵字引︶。=中曳cドN舛中♪甘ヰ引地り中薫 り=♪甘岬−捌柏 コ ‥・・・‥・● 高奄高等商業拳校閲校十周年記念論文集 =np︵q〒−十∵†−−︶pqn■沌+ =np忘+p︶n⊥=np n︵n−−︶︵n− トロ‥‥‥.‥ P へF−こへn−匝︶ n︹n−︼︶︵n− ︵−︶ ー.柏 トロ ‥・・・‥・ ご pギ.ごT⋮⋮・︰・+p冒−︸ ぎ︵n−︼︶︵n﹂3 ︼.N コ ○=●…● 芦 ︵市﹁Z=−什﹁簿︶ 二四二 p∽q冒00

(11)

右の表の詮明を附言せんに、八箇の貨幣空虚に投げて塞が一つも出ずして表のみ出た度数は空二回の内一

度あり、叉塞が﹁筒出て残り七筒が表の出た度数は五一二回の内一穴庶ありて之等を表すものである。

右の結果各度数を球論上の度数と比較すれば

m長車+車︶仇=∽艮︵車︶伽十∞︵車︶加十串︵車︶ギ:ト・︶

昌A士︵£+牒雇主苫登茂ま王︶

=N十−?工試+l︼N十︸会十−−N十∽の十−の†N けnp宍q十p︶冒.十︵守†こp︵q十p︶n・−柏︸上″ぜ√−首q q和くコpq ︵N︶ 之即二項分布に於ける梗準偏差を輿へる公式である? ︶ 三 唱論上と蜜駄上の〓項分布の比較 ︵ 筆者は次に八街の堂銭銅貨を空二回投げて各国に於て其の出た度数を賛助して次の結果を得莞

甚 の 数 0 1 ‰ 3 4 5 6 7 8

統計値の倍増度 度 数 =り3p︵qn⊥十N︵−−∼−︶pqn−ごム 1 16 61 ‖7 133 106 57 20 ︵n−1︶︵n−N︶ ︼.N

1㌫

pギよ十⋮⋮こ・+3pn⊥︸1−ぜ柑

(12)

高松高等商業拳校開校十周年試食論文集 此の理論上の結果と先の茸験上の結果とが如何に類似するかを知るであらう。 更に其の算術平均及び槙嘩偏差の理論上及び賀験上の倍を求め比較すれぼ 次に普段上の算術平均及び標準偏差を求めんに。 理論上の算術平均 ︵︼︶曽Ⅷ 削=握=00×−†Ⅰ−瞳 理論上の梗準偏差 ︵N︶沸せヾl q=く到=く ″J 。16 は351親53。34。捕8一 1 1 銅1一 0 1 2 0 1 6 0 9 1 ウ︼ ウ︼ 2 O 1 2 3 4 −D 6 けー 8 00× ㌣×ふ 1 3 1 9 1 4 0 2 2 5 =ミ叫りー・全盲 ;=÷一箪=詣=聖竺 =1レ句聖二 512 −−・ガ ♂七=■レ⊥ユ Ⅳ (3・986)2=1・395

(13)

\′.

四 正 規 曲 線

︵ 上述の二項分布即︵p十q︶nの展開式の各項よりなる分布から前述のケトレーの正規曲線をスターリング ’ ︵S≡ぎ巴の公式を用ひて初等的に誘導しょう。 今二項分布の度敏の最大値せムとしてそれを仇にて表し一般の度数をγにて表せぼ 二項分布の山般項 pn−り

引縄ぷ

に於て土項分布の算術平均−−pに判する度数が最大であるから、上式に於て 、、‖〓て と置けぼ二項分布の境大慶教仇を得べし、即

苛N針pn。qnP

二項分布の劇般項は其の算術平均を基準にとれぼ 此の式の右達にスターリングの公式即ガが大なるとき \・・・\ ∵・岬 ﹁汀 統計値の信頬度 璧=N ㌧ ︵np十ユ⋮︵nqlエ , へnp︶ぺnq︶− 盲p十e叩盲q−エー p苫.ぷn号鞘 閏 β こ四五

(14)

が成立すると云へる式︵此のスクーリングの公式の詮明は省く︶を用ひるときは

圭=−\︵・+吐要子吐l旦

・・・宮e鎮

=÷p+て中音e︵︸十離し÷qよ+王宮e†色

此の式の右凌を封敬級数に依って展開すれば

=÷p十羊車︶︵轟−断+ニ⊥÷q去+車︶T中−恥句!::・

上式の第三項以下の項はnを大にするとき省略しても芸文へ無きを以って ﹂﹁=\も\旨pq+︵p−q︶怠npβ 璧① ・・・誓=遠宅.豊羞︵−†那誓十・≒:︶ 然るに‰の頓にスターりシグの公式を適用するときは ぎ=Z 高松高等商典拳校開校十周年記念論文集

も =苧▲ヰ叫窃

︵np︶スnS仰 nh nnェ\ギm\隠別号p焉q pn︼ぶn。

十⋮⋮

、岨Q・nq\抑制 二四六

(15)

匡 −t ︰Jごj 正規分布に於ては pけq一npqり㌔ なるを以って上武に之等の値を代入し且右遼第二項以下を省略すれぼ / ・・∵ ∴ご ㌧ニ. を得ぺし之即ケトレーの正規曲線の公式である0

第四 確 率 誤 差

此の確率誤差︵苧Obaヱ2ErrOr︶︵或は蓋然誤差︶に就いて諭する前に前述.の正規曲線の性質を荷少しく調べる必 要がある。上記のiE規曲線の算式何に於て此の曲線とガ軸との問に固まれた敢積を考へて見るに、標準偏差を単 位として即 恒=−.穣一‖衰、 qq とし、此の〆の代りに渾にガと記せぼ、∬軸の左端からガ迄の同機を軋とするときは 統計値の倍顆庶 二四七

(16)

○綿

此のぉの種々の倍に封する‰の倍がKaユPearsOコ︸↓ab−es FOrS︷atis芳iaコSaコd B川○ヨetriciaコSに表されて居る。

共の仙部分を記せば 此の正規曲線忙於て縦軸の方に度数をとつてあるから∬のαから∂迄の問の両横は其の罷問の度数の総和を表 すものである。但し其の場合2\qりーとしてゐる。 此の表に依るときは鴇が−−と+−との問にある度数即それは標準偏差qを軍位として居る故に劇般に挨差㌶ 積分記紀た依れば‰の値は ㌔‖=

︼、・、立−:.、\ .︰一〓〓、 0500(10 0り69146 0.84】34 0.93319 0.97725 0リ99379 099865 4.OOい99997 戚 二四人

(17)

がーqと+qとの問にある度数は仝慣の NXハ.澄−∽料−I∽︶=畏Nヾ武 である。佃綴喜がー曾と+Nqとの問にある度数は仝慣の NXへ●篭べN∽I・∽︶−−∽示・会衰 である。叉鋳差がー曾と十曾との問にある度数は全館の NX二岩垂拭−●∽︶=∽p詔浜 である。 上述の事柄から榎本親祭に於て誤差がき曾と+曾との範囲内に殆んど全部あるべきであるから若し吾人の 測定値の鋳差の絶刑砥が其の標準偏差の二侶よりも人なるときは其の測定値は不正確なるものとせられるのであ る〇 一般に誤差の分布が茫規曲線を馬すものと看撤して其の中央の前後に誤差の今度教Nの五〇〆を含む構問の 年分を確率誤差或は蓋然挟差と云ひ其の笛問は棟準誤差を単位として○、六七四五である。之を積分記耽で表せぼ 之を満足するガの値は○∴ハ七閃五である。此の誇明は此魔では省く。 統計値の信頼度 .﹁ 1 一 −ユ\J汀. ・: ∴・・ 二四九

(18)

之は標準誤差を単位とせる故に鵬般に確率誤差P.Eは P・E=?票会q ︵e 即 裔償肇泄=〇・の讃∽×落億常軌 例 我闘批丁身長︵昭和八年内閻統計年鑑︶の度数分布に於ける確率鋲差の應用を述べよう。 我国批丁身長(昭和7年度) 高松高等蘭染拳校開校十周年記念論文集

島、 り人数ナ ノお ノ玩2

光 来閑 1.375−1い400 −9 6 −・ 54 486 】.400・−1。4三…5 8 9 72 576 】.425−1.450 7 23 161 1127 1450−1い475 6 61 366 2Ⅰ96 1.475一重.500 5 148 740 3700 11500・−】.525 4 327 130S 5232 】525−】.550 3 fi91 1773 5319 1.550帥1.575 2 850 170(J 3400 1.575⊥】−.600 1.600−・1625 olユ073 −7215 1625−1.650 】 870 870 870 1650一−・】.675 2 593 1186 2372 1.875−・ユ.700 3 331 993 2979 1.700−1.725 4 164 65(; 2(;42 1725一亡1.750 5 6墾 320 l(;00 1.750−1.775 6 23 138 828 1775−1.800 7 6 42 294 1.800−1.825 8 2 】28 計

闇 +4221 34772

(19)

∵−−■−一∴∵主︰≡ l=≡∵

爵倒袈淑 〇.莞芯×○品や指=●○∽ゆー米 ㌧.−.彗ロー∽X O∽浮︼1−.あ∽溶.−.豊?†∽×.〇∽讐=−●ロ可米 ■ 此の両者の間に我国壮丁数 のー∞NXO∽¢可=のーの∽> 此の人数だけ含まる筈である。而Lて賓際には上まから ソニコ“、′ ︼.コこ∵・⊥.↓ =11⊥・ご ﹁な∴バ 二三、′

−・嵩⊥・ヨ一宏×値N

聖∽∞00ゆ> 仝慣に封する割合 ∽∞∞¢小のー∞N=?¢∽∽ となりて少しく理論上の結果と相違するも寛際上の推定には之で十分なるべし。 統計値の借照度 渦巻南.−・巴NTふ墾=−・空NT害−NT−・言辞

(20)

信 頼 度

〓仮に算術平均、標準偏差及び中位数等の梗本観察の施訂値の信頼度は、共等の標本観察倍量ハの眞値の差を 以つて表すべきであるが、其の眞値は到底求め得ざる故に梗本税察他の標準誤差或は確率誤差を以つてまし、普 適確率綴差を用ひるのである。二砺に斯くの如き信粉塵を表す確率誤莞或は標準誤差︶の数値の小なるもの程信 頼度の大なるを意味するので漆る。 前蓮の寄から抽出標本より得られる程々の統計値の信煤塵は共等の棟準誤差さえ求掛れぼそれに○、六七四声 を来すれば確率誤差が得られ従って共等の信頼度を測定し得るを以て次に算術平均、標準偏差、相関係数及び中 位数等の擦準誤差を求むる紺野式を誘導しよう。

薦玉 算術畢均ノ標準誤差

松本親祭の罪術平均の棟準誤差を求めるには党づ度数の棟準誤差及び二つの度数わ間の相関々係薮見なければ ならない。 ︶ 一度敦の榛準偏差 ︵ ゝ一\ご\︺:こ︰・.r を観察すべき度数分布より 高松高等滞米袋校開校十周年記念論文集

(21)

之等の度数の絶和はNであるから さ十b+か十⋮⋮⋮︰iわ=N ∵死に同債件に依つて作られる各N箇︵Nは極めて大なる数︶の模本ありとす、然るときムの倍は標本から梗本 に移るに従ひ欒ずる、依って之等のムの値は二つの度数分布を形成する。次に此のムの梗準偏差の平方の朔望 倍を観察値のムの項で表さんとするのである。 此の問題を略ぐために其廃に作られる任意の一つの観察室つの試みであるとす、而して∠番目の級聞に箇 鬼のものが落ちる事を其の目的の朝察が得られる畢に成功したとする。 今ptを一つの試みに封して成功の確率とし qt=−−ptを失敗の確率とする。然るとき∼番目の疲問に節々のものが得られる確率ptを有するN箇の試みの 祖に於て、前述の二項分布の関係式聞によりカの挺準偏差の平方は理論的に 阜㌃衰ptqt!−Np∴−−pt︶ にて輿へられるのである。統計では通例軌の正確なる値は求められないがNが相常に大なるときはptの代りに ゝ\宅を以て置き携えてもよい。 口. 艮 統計値の信埼度

(22)

之即度数の擦準偏差の公式である。 息〓つの級間に於ける底面間の相関々係 今さを以ってN箇の模本を作るときの′級問の度数の理論的値︵或は其の朔望値︶とし其の観察偲ぶよりの偏 差を貿とす、即 \・.﹁÷︹.− 次に 然るに

高松高等商業拳校開校十周年試食論文集

p笥ゝ\NJ q什−−−−ゝ\N

ホ=N中︵T車︶

b、十b、十決+⋮:︰: +わ√女 ...掌十宗十紫十:⋮⋮こふわ−10 、, さ+b十b十︰⋮⋮・−∼N−−!抽 ・.・へさ、十掌︶土b、+宗︶十⋮⋮+︹計、+柴.∵汁2 =丈丁車︶ こ五四

(23)

なる公式で表される事はよく知られてる番である。 次に此の式を少しく攣形せんに 本に於て 今宗と宗\との軋の相踊表が多︿の標本から得られたとする。然るとき空√が一定である行に於ける各棟 に夫々度数朔望値に比例して一票が按分されるものとして芸文へない。 之に櫨って吾人の梗本がZ級聞に於て簡明以上に宅叶を輿へたものとすれぼ﹂其の分だけ他の級間の度数群 一票=宗+宗十⋮⋮⋮+繋.−十む㍗−十・⋮⋮・+琶。 である、、此の等式の左通に於ける度数の数量は仙定借蛋に封して宗の平均値が 一票×Zpt、\萎−Zpt︶=−票pて\︵−−pオ︶ なるやうな割合で右近の項に分布されて居る、之が其の行Ⅶ於ける貿、の平均値である。 仙般に二つの攣歎ありて其の各平均値からの各偏重言、yのN箇の封の相銅係数rはカアル・ビイイアスン氏 に依つて 統計借の倍糖度 ︵貯︺ ﹁=.−.レ.−、.−. L巧 9:ざ 二五五

(24)

次に私行の狗平均値を克とする、然るときは上武よ少

、・∴レー∴− ∵、∵1・∵一\rう−≠−・

ムとんの問の相紺係数に此の関係式を適用する事に依つて

、鳶毒、=中叛繋ぎ=中上−草庵絹・︶

‖−

端㌔︵掌︶柏=−錘 =﹂両叩Np己−pt︶=−ぞもt、 L梅松高等商染拳校閲校十周年記念論文集 ㌔………‥・ぷ ぷ β 詫 苛 ロ・‥,‥‥…買、箪.軍.還 (ゼ 、、 ぎ︰⋮︰︰︰︰︰ ぎk 欝、、⋮⋮︰︰︰︰・欝掃 欝、、⋮︰⋮⋮⋮・欝阿 ●‘ 欝、、 ⋮⋮⋮⋮⋮璧PF 二玉六

(25)

=−2 ︵空 之即二つの級問に於ける度数問の相閲係数である。 ヽノ 三 算術平均の榛準誤差 ︵

次に止蓮の度数の擦準偏差及び二つの変数間の相関係数を用ひて算術率均誤差を求めよう。算術平均這は

・、・=∴レ主 ∵/、㌣∴.エ﹁

此の術超を自乗し平均する番に依って

2不霊音義中︵墨・・■指事中︵宗革

N柑。冊−丼畳鳶+Nh.芸、、貸学 ハ巧 =Nhぷpヰ.︵−−p㌦−NN叫竃t、p幸 写重り無常てLぷ荒−中㌘t㌔ptpt、 8 −−h.鳥pt−♪βpt︶拍=添−矧拍−=㌔ ∴統計値の倍粗度 q 、叫= ■ / ︵可︶ こ五七

(26)

二五入 高松高等蘭染畢校開校十周年記念論文賃 之が算術平均の嘩準挨差の公式である。但しNは松本甲に含む掴慣数正して〃は根本の梗準鹿妻である。依 って算術平均の信頼度の測定に用ひられる確率誤差は

彗苛普遍違背芸芸¶軒

︵望 之に依って梗本観察の算術平均をMとすれぼ其の眉値は其の松本中に含む憫鰹数Nのとき

≡一=≡−、∵干ニヨ︰∴/

の両者の間にあるとして差支へない、換言すれぼ擦本中の仰倍数Nの信模し得る算術平均値の範園は上記の問に あるのである。 例 或療の事業に於ける労働者紙数三馬人ありて其の内の抽出標本労働者二百五十人の平均貿銀二型l手鏡にし て、其の擦礫偏差二十八鏡なりとすれぼ、其の平均賃銀の信頼度を表すペき確率綴喜及び信頼し得る右二百五十 人の平均債銀何程なるや。

轟 償 滞 納

読流﹁巻か増虚構落 一望

箱六 標準偏差及び相聞係数の標準誤差

〇.相月 〇・警告×㍉凱刊=冨山厨 N回∽○鮎=什 j騒N陶 N匝N∞隠∞陶∼N睡巴鯵N緬

(27)

︼一対 悪魔 きー= 衆望一項分布に於ては 七山‖q柏‖コPq 統計値の信頼度 棟準偏差は統計に於て廠めて豊野な要素である事は眈に述べたが、其の信頼度を決すべき其の松準誤差を求め よう。併し之を諭する前に能率︵ヨ。meコt︶に就いて述べて置く必要がある。 能 率 ︵ 前述のやうに梗準偏差は響貰の静術平均からの偏差の自乗の平均から求めたのセあつた、其の場合の偏差の自 乗の平均を二次の能率と云ふのである。 仙般に響濫の算術平均からの偏差のn乗の平均をn次の能率と云ふ。 盛∵蓄∴欄・廊−・1=勘

一対譜儲

〓洋 語儲 \T∴∴。・、1. 七−‖ ぺ÷−㍉︶= ぺ﹁㍉−㌣ 屠 舅 =○ 二五九

(28)

なる事は既に述べしが同様にして 盲=コpq︵p−q︶ さ=3pq︷ト+父n−N︶pq︸ なる事が詮明せらる。 更に次の記耽即ち p=蕊\鼠甘︵p−q︶ヾnpq 詳=宗\七=∽十庄・ n七q 此のA、昆に依って度数分布の状態が決定せられるのである。著しiE規分布を成すときは p−−q−ゃい?訴=∽● 能率は叫八九三年にカアルピイアスン教授が始めて唱へたるものにして統計史上極めて注目さるべきものにし て同氏笹沢の統計嘩論は此の能率から出聾して細成されて居ると云っても差支へない位である。 ⊃榛準偏差の榛準誤差 ′■\ 前述の二次の能率から

樫抵

忘= 高松高等商菓登校開校十周年記念論文集

(29)

=・∴レ.こ∵、さ二\︻1、−に・㌣て∵1・、・ニ ハレ︺∵■・・さ、十∵.ミ\1\∵−号︷レ︺.−て1こ

・∵†∴レ.‡\1、・、. 此の丙連の自乗の平均を求むれぼ トレーニざh・∴レ一・、二.一/ニ・、1\∴十ハレ∴ミ七−モー一三\−−÷

欠本†中︶︵ギ宇㌻中蟹ギ昔∵澄

− !

車︹山一中ざ阜⊥書中︶ダ!号+N叫車*︵ギ貸手針︶岬︶︺

、∴=∴﹁、†\こ 七柑 然るに \∵・、㌦ であるから爾遼を碩介する寄に依って 統計値の信粗度 忘+む忘= ∵、.−ご∼、.−︰−・・、二こ・ 彗 〓六一

(30)

然るに

常意=㌔

を代入すれば や ㌔ =折本︵訴∼ニ

妄‖弘志甘

栗し正規分布を成すならば 、八・∴い 之を上式に代入すれぼ正規分布に於ける標準偏差の標準誤差は

、てノ

高松高等商染畢校開校十周年記念論文籍 匂忘=官許 ・・‖中山一膏︶㌦封中レ.吾ヒl ︼ q=軒か‖軒車︵詮1拳 に 一.・。 − q い ー 落選罰泄\詔億欝泄=落潮ヽ蒲償読晒׶酬判 蒜︶ 二六一山

(31)

依って度数分布が正常分布を成す場合の其の標準偏差の確率誤差は

甘酢×普、慧震

慧悪\悪罵‖。・計

︶ 三 相関係数の標準偏差 ︵ 相朗係数7は次式にて表される。 ︼ ∴.=・㌻−÷=∵1㌧一 、 ノ 今次のやうな記紀によれば p、t1−=車ぶs、農学pttl−−右一転㌔、︵㌔−聖ぎト号 之を乗積能率︵p−Oductヨ○ヨeコt︶と云ふ。 此の記既に依れぼ相関係数は 爾退勤数をとり碩分すれば 、・■p、−1て⊥十‖こl\三 関疫の自棄を平均すれば 統計値の信晦度 、.‖h﹂ 守官 署、〓 ノ■l・・、て∵てて一∴− .1J p、l−−p、岩p、声 ︼ N p、号・p、㌢旭 音㌦つ ユ︶、忘 p、琵Ip、2.

(32)

!1車︵pr与吉、−p、ヨp、ミ︶

之を上式いに代入すれば

丸日生矩︵p呈≡針︵p亀よ︶+針︵p。1p㌍

、′︼、′.一 −1・−∫ユpぎーp=pnOT⊥1︵p−1pも01っ;ヰ pごq鴇 puq電

−1︼︼

] 句中M至。=可中

p、㌔+車

p、+

− 1 ′■:ノ、ノ . ■ 一 1一、ノ、 ノ /8 一 一 計中望p毒苫︶・烈叫車M︵ぎぎ子中軋㌣㍗誓p毒馬三︶

然るに

車M︵ぎ専u、て︶=車︷M︵㌢釘\N︶ギl・、彗十M︵ぎぎて\冤︶莞這、且

車︷Mポ︵丁球︶品.ミ彗、−M嘩群雲宗且

然るに 高松高等商業拳校閲校十周年記念論文集

中︷p覧㍗十p法\畢苦十︵もき更−pゝ−−苧pl旨1卓立

p詣=中将琶︵㌔−射︶ざsl驚 .∵二∵−⊥ゾ∵こ q餞q聖 ニ六四

(33)

︵軍−ミ.−−︵欝1掛+計−斗㌔り︵軍−粁︶ご⊥ぎー驚+空軍−邑人欝−ミ 而して回押紙︵−e∽reSSi〇芝山完︶が直線を成すものとして

㌧・・ユ‖・、∴∵可・

之に依って

一−\∴け㌧ご一ニ÷㌧1・・i∵、∴∵‡エ

=中誓泰号与十㌔誉帥巧l旬柑

〃︷︵丁邑十璧ヤ拍子言よし十慧学芸

然るに分布が回鐸線の周りに二様︵hOヨ。S。。計s芳l君ar︶であれぼ

島q・=㌔声

然るとき

p誌\誉昔丁もエー忘†蟄

㌔=中M㌔、︵㌔−針㌔︵欝1巴 持 ト ︷レ.・こ丁、・、÷・・㌧

統計値の信椅度

二六五

(34)

である。 例︵こ 或種の葛柴に於ける潜働常総敬三萬人ありて、其の内の抽出標本労働者二百五十人の平均賃鋏式臥蓼拾

ハ什鵜烏γ訃蛋十翫1ヱ

若し分布がiE規分布を成すならば も19=∽:謳=∽ 依って其の場合の相関係数の標準誤差は q㍉ 〓∽︶ 従って正規分布を威すときの相関係数の確率誤差は 之等を佃を前式=いに代入すれは

鳥‖車︹γ子中︵鞘雪塾+車︷γ㌔+車︵8苦衷丁壇︵も柏+態︺

高撃閲等商量襲校開校十周年記念論文鼻 ‖=べ、拍車叛ミ㌔−母=、q㌔慧 ﹁.・、︰∵\・ p−−=ご㌔㌔ ー■も ニュココ ー′へ ︵こ“ ︵蒜︶ 二六六

(35)

ノ銀にして、其の棟準偏菱就拾八銭なりと云ふ、其の擦準偏差の信頼度を表すべき確率誤羞及び共の場合の信頼 し得る標準偏差の範閣を求めよ。 ≠習慣蔀洒J荊蓬﹁哉か欝圃 ○叩g汁〇・〇〇00封〇・貸付∼〇・N0000囲 例︵〓︶ 我が団の訂明治九年重昭和五年に於ける五十嵐年間の米産額と米憤︵却蛍︶憤格指数︵明治元年を岬00と す︶ の相闘係数はC、八〇五である。此の相関係数の信頼度を表すべき確率誤差及び此の場合の倍額し得る相 関係数の範園を求めよ。但し其の棟木箇敷瓦五である。.

第七 中位数の槙準誤差

前述の算術平均、棟準偏差及び相関係数等の統計値は能率の曲数として輿へられる場合にして換言すれば欒敬 の連糖由敬であつた場合であるが次に黙らざる中位数︵中央値と云ふ︶︵ヨed訂コ︶の梗準誤差を考へよう。 典へられた度数分布の中位数墾はそれに依って其の席数合計が二等分される欒数の放電である。 為義諒潜0邪法﹁遥か嘗固 〇・00○∽什〇・〇∽沌○=〇・ヨ∽∼〇・票り 統計偶の信曙度 憎=声q=①.のべ料∽× P‖ ]F、、=〇.のべ限∽× \隠×M芸 \J訓 ーー〇.00○惣 ?N00 ︰=0100∞適 =〇.〇∽NO ぬV 、 こ六七

(36)

高松高等滞米畢校開校十周年記念論文集 二六八 昏々は此麗で璧=ヽ︵ヱなる連続函数にて表される度数分布の母域より抽出せるN筒の個濃数を含む棟木の中 位数の分布の標準誤差を求めんとす。 今N筒の仰鰭数を含む標本の母域の理論的中位数Mが存窄するとす。然るとき中位数の定義に依って欒数が Mの右或は左に落ちる確率は1すである、斯くして母域より抽出せるN蔚の偶倍数を含む標本に於てMの右の 数は →\ であるとす即棟木の中位敬∽はMから むh亡=む、\、 の距離にあるとする。 尚yが距離賢に封する∬の値に封燈する度数の倍であるとすれぼ高次の棟小部分に於て ㌧、㌻㌧・、、 と留いてもよい、依って ㍉...=、、 璧 丙滋を白水して平均すれば

(37)

︶ −Nが奇数なる場合 ︵ Nが奇数であれぼ建数を大いさの順序に放べるとき其尿中の〓鮎が中位数である。

害誉i・N琵=冨畠A

である。 ︶ 〓 Nが偶数の場合 ′l\ 統計値の信粗放

今若し母域の度数分布が正規分布を成すならば

.:・■二こ■/∵。ノ∵

中位数に於けるγの値は

、、∵、−H・︰

・∵・■。∵∴/ ∵/﹁∴ ■∴≡∴/

従って棟本中に奇数簡の個濃数Nを含む場合の中位数の確率誤差は

声=空音Npq竜=串吏

\..功l qぎ‖ 二こ︶ 二ンし 二六九

(38)

こ七〇 高率机等商業畢校閲校十周年記念論文臨 松本中に含む梱鰻数Nが偶数であれば、其の攣数を大いさの順序に並べるとき、其の眞中の二鮎の算術率均を 中値数とするのである。 今一般にS彗㌔を母城及び其の標本のガから上限迄の度数としM、Nを母域及び其の標本の度数紙和とすれば ・=㌧/㌢﹂㌣・・ .ク =、、\+e、、一 次にG︵ヱを考ふる度数分布に於ける確率虚数とすれば 但し∂は度数分布の上限界値である。此の両滋を役分すれば 、∵=−/√、二こ㌣・ ・∴レ‡∴∵∴/.レ.√、二\〓、ざ. コ﹁− ・小釦−−q㍗\熱=N綽︵γ軸︶\汽 ヽ、 、、=..、、、、 ・

・・・㌔ほ轟音︵−料︶=軋朴ミ史γ蜜

㌔=N

、⋮

√、−︵1㌻ヾ

(39)

・戸車N㍉賢

次に中書β革の借を求めんに

、∵\=・・㌣■√、二\ニ/㌧−、ざ㌧− 、J.⋮−、ご㌧、.﹁

中ぷ覧箪藁軍℃妄衰

・・

おるに ㍉・り、∵㌧シ・.−、、..︶

∵車窓ミ㌔︶=車ぷ㌔︶ギ車レ.ぎぞ㌻旦ヂ︶

卦i†蜃8射︵針十か.︶

=射ら−専︶

∴一−三︰∴∴−二−/

=木村︵−射︶針

統計値の信粕度

(40)

・ ー

車史史γ盤軒+恕†纏前+鼻†弦針︸

此の特別の場合として中位数郡は モ∼‖‖・十︵β十旦 とすれば 車=車︵手車︶︶好け車︵−+車︶ と温き得て上式は 高松高等商染畢校開校十周年記念論文集 而して やβ十&拘留+厨 なるを以って此の爾蓮を自乗し平均すれぼ

声量㍉車︵声+薄十車窓βl㌢︸

q㍉

師直ミ1車

但しN計の値は ヽ 甲軒︷車下車︶車︵l・車︶+車︵−+車︶車︵γ車︶+菜γ車︶中︵11む︶ ︵−ご 二七〓

(41)

車︵丁㌔五車︵子中︶

から計算されるものにして此の㌔は前述の正規曲線の18∼わ迄の両横にして衣に掲げられてあるのであ る○ 之即Nが偶数の場合の中位数の棟準誤差である。 例 標本中に食む佃鰭敏五〇の場合の中位数の標準挨差及び確率扶養を上記公式に依つて求めよ N=∽○とすれば 車︵−+㌔︶il車︵ご車︶ 即Q=?ONに封するZ、pの低は 表から N計=〇.∽ゆ00あーのゆ 訓∫扁平モー中‖誹×−・賀− q

・ “⋮

確率誤差は 。・禦ごふX−・買−か‖・00ヨ糾 統計値の信鳩脆 二七三

(42)

第入 標本観察の賓験方法

抽出模本の算術平均、擦準偏差、相闘係数及び中位数等の信頼度測定に用ひられる標準誤差に就いての理論的

結果は上述の如くなるが、之等の棟準綴喜のみならず山般に標本観察の程々の統計値の珊論的研究結果は共等の

株本中に含む仰腰数Nが極めて大なる場合忙適用されるものにして、然らざるときは近似数を異へるものであ

る。蜜際には標本中に食む佃鰹数を無限大にするを得す、然らば如何程の例数を探れば比ハの値に近づくやを試み

る資際的方法を研究せざるべからす。

之に勤して梶木は骸子を操るか或はカードを引く等の人工的試みを行ひしがそれは極めて多くの同数を試みざ

るべからす、且其等の人工的試み夫自身に不完全なる原因む包含し、其の得たる結英に信頼を濃く・に幾多の疑問

を有するのである。.因つて一九二七年ビイアスン教授は彼の門下生のチベット氏をして二軍訟別の下に於て模本

中に含む任意の憫醍敏の分布を賛助し得ぺき方法を案出せしめた。

それは骸チャカードの代りに数字を用ること∼ト国民統計の材料から約囚二六〇〇偶の数字を探りそれから 高埜向等何基畢校閲校十周年記念論文集 之に依ってNが奇数の場合の中位数の標準隈差及び砲率誤差

−、∴三.。

に比紋してNが奇数偶数共に同じ之等の極限値に近づくを知るのである。 二.七四

(43)

四警づゝ顔合せた列数字よりなる売女作製しそれは非常た多くの方法で完く自由勝手な手段を癒し雷も怠

りと云ふ。此の表は↓ractsfOrnOヨP亡すsXく・Ra邑○ヨS当2=遥コuヨb2rSちーaコ愚by﹁エ・Cl音−tに出版せら れあり、此の表を用ひる所謂模本方法︵RaコdOヨSa∃号?ヨ2−ト○苧に依るので之が資験方法として現今に於て最

も優れ居るものと信ずるのである。

次豊ハの具髄的設明の焉に調査資料の母域の度数分布が正規法則に碓ふものとして其の棟木親祭の統計値の葦

鹸方法を述べよう。

前述の慮規曲線の暫碩が既に求められ居る故に母域の度数絶和室○、000とするとき概準偏差Jを欒数の 単位とし其の曲線の欒化を2qの間隔できざめば次の表の如くなる。 上表では度数を曲線の左端から計算して○から九九九九迄として同問の中央値がよ・さから+加.還とつたの 統計値の倍短慮 嗣 十 +・+・l ・……く⊃ ⊂〉 (=〉 ⊂〉…● N J 0 0 Ul (JI ひ( (ンl 溺 轟昂 ヾ−■■ し㌢j蓉 (n ひ ロl トlゝ ・1‥、芝 電 忘 芸・‥・二∩ 8落 一丁 ¢) くD l・一 執8 −● 嗣 溺 冴 …‥岩 諾 岩‥・…‥=・ トー 、J 〔カ 執 茄 i詞 溺 ‥、‥P ィ⊂〉 く⊃…‥. 上¢ トJ く〉 ㊦ 浄 両 むI む■l A 吋嗣 く○ ミ0 く⊃ の q⊃ r …‥

,溺 淋冴

∼i卜‥・…‥‥ こrIく71(J‘ く○ ひl−一 ●● ● ● 丹 ●■ ヰ8 漁 曹浮 こ七五 、ノぴ

(44)

であるが若し度数の計算を中央から計算するものとし次の測定尺を作製する。︵但し2qを欒数の単位とす︶ 次に棟本中に含む梱照扱が一〇の婁昔を緑って見るに前述のチベット氏家から叫○佃づ1の数列を取出しそれ が九八〇劇 −○∵九八内の数であれば○、○に入れ鮎を打ち○叫九九 − 〇五九許の内の数であれば〇二に入 れ鮎を打ち此のやうにして 叫○偶の鮎列を得て斯くの如き鮎列を五首乃革二千個とりて之等の各斯列の算術平均或は中位数をとるとき共等 の五首乃至叫千の度数を有する度数分度を得るのである、之等の分布の標準誤差を計算するとき求むる算術平均 高松高等商染畢校閲校十周年記念論文集 職 潜︵河西8せ港南︶ −川沌 −り︼ ○ +﹂ +り陀 こ七六

(45)

或は中位数の梗準挨差を得るのである。 次に例として≡旦を攣数の単位として棟木中に含む岬鰭教が仙○の場合の中紙数を叫干何と.するときの度数 分布をチベット氏の榛東淡に伐り作成すれぼ 之から中位数の標準誤差は qヾ芦−−小岩ご¢ ︵置﹁2q押倒帝什ヰ︶ 次に此の場合の中位数の梗準誤差と算術平均の棟準誤差との比を求めれぼ 棟木中ノ憫倍数10 統計値の信槻度 、∵、、/1 の︺Aり×〇.−q ∽. q\\.司 ‖.r−組¢ひ ニ七七

(46)

二七八 高松高等商幾畢校開校十周年記念論文箆 此のやうにして得られる中位数の棟準誤差と堺術平均の標準誤差の比に悶し棟木中忙含む程々の何倍数に封す る上述の模本法に依る筆者の得たる賓験伯及び前述の公式に依る理論的倍極限値︶を掲げれば次の表の如七。 中位数の標準誤差と算術平均の棟準誤差の比 之等の内棟木中の桐鰹敬が∽ゝりこ○−−∽﹀眉の場合の賃駄倍は山千筒の標本数に依り他の∽。﹀会﹀の場合の 蜜翰佑は五首筒の標本数に伐ったものである。 之に依って梗本中の憫鰻数が奇数箇であれぼ非常に早く極限値に近づき約欄膿数十瓦以上であれば極限値と大 書なく若し其の偶作数が偶数箇であつても約仰倍数三十以上であれば其の極限値の値と大差ない専を知るのであ る0 岡筆者は曾てピイアスン教授の研究嚢在留中に中椎数、閏分件数及び雨四分梅助問の距離等に関する密教分布 の興味ある一般理論的研究及び其の嘗験的研究を残したるも此庭では省き後の横倉に述べよう。 l

T

∵ . ● −

(47)

本稿はカアルピイァスン教授の講義を参考とした外次の寄を参考としたものである。

︵ご R訂叶Nヨa冨eヨa︷芹a−Stat狂藷s

︵Nし nzuberロie stat藍isnheコ訂rsnhuコ甥ヨethOdeコ

︵u︶ ﹁OV迂aコm HO︼︷N︵law Stat訂−ins.

統計値の倍紹度

Updating...

参照

Updating...

関連した話題 :