• 検索結果がありません。

( 28 ) ( ) ( ) 0 This note is c 2016, 2017 by Setsuo Taniguchi. It may be used for personal or classroom purposes, but not for commercial purp

N/A
N/A
Protected

Academic year: 2021

シェア "( 28 ) ( ) ( ) 0 This note is c 2016, 2017 by Setsuo Taniguchi. It may be used for personal or classroom purposes, but not for commercial purp"

Copied!
37
0
0

読み込み中.... (全文を見る)

全文

(1)

ビジネス統計学

(

平成

28

年度後期

)

講義用ノート

谷 口 説 男

(

九州大学 基幹教育院

)

(

平成

28

9

22

日版

)

0This note is c⃝2016, 2017 by Setsuo Taniguchi. It may be used for personal or classroom purposes, but not for commercial purposes.

(2)
(3)

i

はじめに

統計学の歴史 (http://www.stat.go.jp/teacher/c2epi1.htm から) • データの収集

“国勢調査”=国の実情を知る…徴兵,徴税,福祉

statistics (英)⇐ statistik (独) ⇐ status (ラテン=国家・状態) 歴史は古い…古代エジプト,ローマ帝国 ※ IBM はもとは国勢調査用紙を作ってた. • データから規則性を見出す アマゾン,顧客管理,… ICT の発展で非常に扱いやすくなった ♢ ハレー (1956-1742):死亡記録から死亡年齢を解析.終身年金価格決定に 寄与. ♢ ナイチンゲール (1820-1910):戦死者・傷病者のデータ解析により,治療・ 衛生状況が死因であることを見出す (見やすい円グラフ). • 確率的事象をとらえる 自然科学,工学,耐久検査,品質管理, 数理統計学 (データ) = (真の値) + (誤差) ♢ ドゥ・モワブル (年金論→保険数理) ♢ ベルヌーイ (天然痘の罹病率,死亡率→数理疫学) ♢ オイラー,ラプラス (フランスの人口推計) この講義では…

エクセルを使って実際に計算をしてみます.PC 必携です.

必要な資料は http://www.artsci.kyushu-u.ac.jp/se2otngc/

(4)

CONTENTS ii

Contents

1 データを伝える 1 1.1 特徴を語る量 . . . 1 1.2 やってみよう . . . 1 1.3 特徴を語ってもデータを語らない . . . 2 1.4 標本分散 (sample variance) . . . 3 1.5 ヒストグラム . . . 3 2 確率論速習 4 2.1 確率変数 . . . 4 2.2 離散型確率変数,連続型確率変数 . . . 4 2.3 期待値 . . . 6 2.4 分散 . . . 8 3 大数の法則 9 3.1 独立なコピー . . . 9 3.2 大数の法則 . . . 10 4 中心極限定理 11 4.1 はじめに . . . 11 4.2 正規分布 . . . 11 4.3 中心極限定理 . . . 12 5 信頼区間–比率 14 5.1 比率 . . . 14 5.2 比率の最小値の保証 . . . 14 5.3 比率の最大値の保証 . . . 15 5.4 もう少し先へ . . . 16 6 相関係数 17 6.1 散布図 . . . 17 6.2 相関係数 . . . 17 6.3 相関係数と散布図 . . . 18 7 単回帰分析 19 7.1 単回帰分析 . . . 19 7.2 回帰分析の応用 . . . 21 8 差はあるのか?—平均の差の検定 25 8.1 検定の考え方 . . . 25 8.2 モデルの導入 . . . 25 9 差はあるのか?—独立性の検定 30 9.1 サンドイッチの嗜好 . . . 30 9.2 ピアソンの χ2(カイ二乗) 独立性検定 . . . . 31 9.3 適合度検定 . . . 32

(5)

1 データを伝える 1

1.

データを伝える

イベントに集まった人の年齢の一覧表: 17 19 21 20 19 19 21 20 20 21 19 21 19 18 20 20 19 19 20 21 21 21 20 19 19 18 21 19 19 21 20 21 20 19 21 20 19 21 19 20 21 20 20 21 20 21 21 20 18 20 20 20 19 22 22 20 21 20 20 19 21 20 22 19 21 19 22 20 20 20 21 20 19 20 19 20 20 20 18 21 18 21 20 19 20 20 20 22 19 19 22 20 18 19 18 21 21 19 22 19 この表をどう説明するか? 1.1. 特徴を語る量 1.1.1. 最大値 一番大きい値 1.1.2. 最小値 一番小さい値 1.1.3. 平均値 データの総和 データの個数 1.1.4. 中央値 小さい順に並べ直した時の「中央」の値 ※ データが奇数個⇒ (データの個数) + 1 2 番目 ※ データが偶数個⇒ データの個数 2 番目と データの個数 2 + 1 番目の平均 1.2. やってみよう データは 95,78,85,56,69,89,87,72,80 1.2.1. まずは手で 並べ替えておくと早い 1.2.2. エクセルで (a) データの個数:COUNT

(6)

1 データを伝える 2

(b) 最大値:(i) [データ]–[並べ替え],(ii) MAX (c) 最小値:(i) [データ]–[並べ替え],(ii) MIN (d) 平均値:(i)SUM,(ii) AVERAGE

(e) 中央値:(i) [データ]–[並べ替え],(ii) MEDIAN

1.2.3. 上の一覧表だと? 1.3. 特徴を語ってもデータを語らない 1.3.1. 最大値が同じ 1.3.2. 最小値が同じ 1.3.3. 平均値が同じ 1.3.4. 中央値が同じ 1.3.5. 最大値と最小値が同じ 1.3.6. 平均値と中央値が同じ 1.3.7. 最大値と最小値と中央値が同じ 1.3.8. 最大値と最小値と平均値が同じ 1.3.9. 最大値と最小値と平均値と中央値が同じ

(7)

1 データを伝える 3 1.4. 標本分散 (sample variance) 1.4.1. ばらつき具合を見る (ボラティリティ,日経 225 オプション) 1.4.2. ( (データ)− 平均値)2の総和 データ数 1.4.3. 前回の 95,78,85,56,69,89,87,72,80 だと? 前回の一覧表だと? (a) データ⇒平均値⇒ (データ)-平均値⇒二乗⇒総和⇒データ数で割る (b) VAR.P 【注意】エクセルには分散 (variance) にちなむ関数がいくつかある. VAR.P は標本分散を計算するが,VAR.S は「不偏分散」を計算する. 不偏分散は,分母が『(データ数) −1』となっている.その名の通り 不偏分散は「不偏推定」と呼ばれる統計手法と相性がよい.標本分散 は「最尤推定」と呼ばれる統計手法と相性が良い. 1.4.4. 平均と標準偏差が同じ? (85,95),(58,64,66,72) 1.5. ヒストグラム データは, 65 73 88 76 83 94 84 77 85 76 85 82 74 78 63 81 69 97 96 74 1.5.1. 度数分布表 60 点台 3 70 点台 7 80 点台 7 90 点台 3 1.5.2. 表を描いてみよう  COUNTIF 1.5.3. ヒストグラムを描いてみよう  [挿入] − [グラフ] −棒グラフ 1.5.4. こちらも 65,66,93,77,79,94,95,98,85,66,84,82,68,75,63,83,65, 93,95,74

(8)

2 確率論速習 4

2.

確率論速習

2.1. 確率変数 2.1.1. 違うものですか? ・1 枚のコインを投げて「裏,表」を見る ・赤玉,白玉 10 個ずつが入った袋から玉を抜き出し「赤,白」を見る ・サイコロを投げて出目が「奇数,偶数」を見る 「目くらまし」から無駄なベールをはぎ取る ♢ 二種類のものを代表するのは「0,1」⇔「数字」 2.1.2. 確率変数 X: a と一致するという事象{X = a} a より小さいという事象{X ≦ a}   の確率    P(X = a) P(X ≦ a)   が確定! 2.1.3. 【例】 (a) サイコロの出た目 X; P(X = i) = 16 (i = 1, , . . . , 6) (b) コインを 5 枚投げたとき表が出た枚数 X; ○●○○● P(X = i) =5Ci (1 2 )5 (i = 0, . . . , 5) (c) 鉛筆を回し y 軸となす角度 X; P(X≦ a) = a (0≦ a ≦ 2π) 2.1.4. なんで確率変数? (a) (データ)=(真の値) + “誤差” (b) “誤差” をどう扱う? ⇒ 値の様子の確からしさは分かる (c) 「確からしさは分かる」=モデルを立てて議論する最小の前提 2.2. 離散型確率変数,連続型確率変数 2.2.1. 離散型確率変数 P(X = ai) = pi (i = 1, . . . , n) となっているとき,離散型変数という. 2.2.2. 【例】 (a) 公平なコイン投げ 表のとき X = 0,裏のとき X = 1 と書くことにすれば,P(X = 0) = P(X = 1) = 12である.

(9)

2 確率論速習 5 (b) 公平なサイコロ投げ 出目を X とすれば,P(X = 1) = P(X = 2) = P(X = 3) = P(X = 4) = P(X = 5) = P(X = 6) =16 (c) 表が 2 倍出やすいコイン投げ P(X = 0) = 2 3, P(X = 1) = 1 3 2.2.3. 連続型確率変数 P(X≦ a) =a −∞ f (x)dx となっているとき,連続型確率変数という. ※世の中は連続型確率変数に満ち満ちている…株価,支持率,… a −∞ f (x)dx? (a) 積分 (1) グラフ y = f (x) の囲む面積a b f (x)dx = 緑の領域の面積 計算方法:幅の狭い長方形で近似する nk=1 f ((a−b)kn )×a− b n n→∞ −→a b f (x)dx (b) 積分 (2)b → ∞a b f (x)dxb−→→∞a −∞ f (x)dx

(10)

2 確率論速習 6 (c) b→ ∞?どんどん大きくしても有限で止まる? アキレスと亀 • 100m 差を開けて同時にスタートする. • アキレスが亀のいた場所に着くと必ず亀は少し前にいる. • よって,アキレスは亀に追いつけない. • アキレスは秒速 1m,亀は秒速 1cm とする. • アキレスが亀のいた場所にたどり着くのに 100 秒かかる.この間 に亀は 1cm/秒×100 秒=10cm=1m 先に進んでいる. • この 1m を進むのにアキレスは 1 秒かかる.この間に亀は 1cm/秒 ×1 秒=1cm=0.01m 進んでいる. • この 0.01m を進むのにアキレスは 0.01 秒かかる.この間に亀は 1cm/秒×0.01 秒=1cm=0.0001m 進んでいる. • これらを繰り返すと,アキレスが亀のいた場所にたどり着くため の時間はどんどん短くなって, 1 秒,0.01 秒,0.0001 秒,0.000001 秒,… と減っていく.これらの和は 1 → 1.01 → 1.0101 → 1.010101 →… とどんどん「01」が増えていく少数になる.これは実は 100 99 となる. 2.3. 期待値 2.3.1. 期待値 E[X]; (1) P(X = ai) = pi (i = 1, . . . , n) となっているとき (離散型) E[X] = ni=1 aipi. (2) P(X≦ a) =−∞a f (x)dx となっているとき (連続型) E[X] = −∞ xf (x)dx. 2.3.2. 【例】(1) 6 ∑ i=1 1 6 = 7 2

(11)

2 確率論速習 7 (2) 5 ∑ i=0 5Ci 1 32 = 1 32 ( 0× 1 + 1 × 5 + 2 × 10 + 3 × 10 + 4 × 5 + 5 × 1 = 5 2 (3) ∫ −∞ x 1 1[0,2π]dx = π ※ F (a) = 0 (a < 0),= a (0≦ a ≦ 2π),= 1 (a > 2π). 2.3.3. 宝くじ X=賞金額とすると,E[X] は期待賞金額. オータムジャンボ宝くじ(2014 年 9 月 19 日∼10 月 10 日);発売数 13 ユ ニット(1 ユニット=10 万枚× 100 組=10,00 万枚) 期待賞金? (やってみよう) 2.3.4. Quiz (a) コイン 4 枚を投げる.表を向いた枚数が偶数ならば,枚数× 100 円を 貰えるゲームがある.ゲームへの参加費をいくらにすれば胴元は損を しないか? (b) 上のゲームのプレーヤーの利益の期待値はいくらか?

(12)

2 確率論速習 8 前回の Quiz 表が 2 枚出る確率は4C2 (1 2 )4 = 6× 1 16 = 3 8 であり,4 枚出る確率は 4C4 (1 2 )4 = 1× 1 16 = 1 16 である. ○○●●,○●○●,○●●○,●●○○,●○●○,●○○● (端が表,あと一つどこに表が出るか?端が裏,あと一つどこに裏が出るか?) 2 枚もしくは 4 枚表がでないときの賞金は 0 円で,その確率は残りの 13 8 1 6 = 9 16 となる.(※ 0 枚も偶数で賞金が出そうだが,賞金は 0 円!) よって,期待賞金 E[X] は E[X] = 0× 9 16+ 200× 3 8+ 400× 1 16 = 75 + 25 = 100 である. 2.4. 分散 2.4.1. 分散 V(X) = E[(X− E[X])2] ※ (X− E[X])2は「確率変数 X と期待値 E[X] の距離の 2 乗」であるから, 分散は「ばらつき度合い」を表している. ※ ばらついている=基点からの距離が 0 でないものがたくさんある. ※ ばらついていない例として,いつでも 1 の目しか出ないサイコロを考え よう.このとき,さいころの目を表す確率変数 X に対し,P(X = 1) = 1, P(X = i) = 0 (i = 2, . . . , 6) となる.したがって, E[X] = 1× 1 + 6 ∑ i=2 i× 0 = 1, V(X) = (1− 1)2× 1 + 6 ∑ i=2 (i− 1)2× 0 = 0. すなわち,V(X) = 0 である. 2.4.2. 【例】 コイン投げを実現する確率変数は,X(表) = 1,X(裏) = 0 である. 「表が出る確率が p である」ということは,P(X = 1) = p と表現できる. この X の期待値と分散は E[X] = 1× p + 0 × (1 − p) = p, V(X) = (1− p)2× p + (0 − p)2× (1 − p) = p(1 − p) となる.

(13)

3 大数の法則 9

3.

大数の法則

3.1. 独立なコピー

3.1.1. 独立

(a) 事象 A, B が独立:P(A∩ B) = P(A)P(B)

(b) 事象 A, B, C が独立:A, B が独立,B, C が独立,かつ C, A が独立で, さらに P(A∩ B ∩ C) = P(A)P(B)P(C)

(c) 事象 A1, . . . , Anが独立:任意の (n− 1) 個が独立で,さらに

P(A1∩ · · · ∩ An) = P(A1)× · · · × P(An)

(d) 確率変数 X, Y が独立:{X ≦ a}, {Y ≦ b} が独立. (e) 確率変数 X, Y, Z が独立:{X ≦ a}, {Y ≦ b}, {Z ≦ c} が独立. (f) 確率変数 X1, . . . , Xnが独立:{X1≦ a1}, . . . , {Xn≦ an} が独立. 3.1.2. X の独立なコピー X1, X2, . . . X1, X2, . . . は独立で, P(X = a) = P(X1= a) = P(X2= a) = . . . P(X≦ a) = P(X1≦ a) = P(X2≦ a) = . . . (すべての a) となること. 3.1.3. 【例】サイコロ投げの出た目を X とする.このサイコロを繰り返し投げる. 1 回目に出た目を X1,2 回目に出た目を X2,…とする.X1, X2, . . . は X の独立なコピーである. 3.1.4. いかさまサイコロ サイコロを 2 回投げる.2 回目の目は 1 回目の目と同じ 目となる確率が他の目の 2 倍であると仮定する.1 回目に出た目を X,2 回 目に出た目を Y とすると,この X, Y は独立ではない. 上の例では独立性の暗黙の約束がある. 3.1.5. 危険な曲がり角 (for whom?): (a) 『A, B が独立,B, C が独立⇒ A, C は独立』は嘘 例えば,トランプを引いて模様 (スーツ) を観る. A ={♢, ♡},B = {♢, ♠},C = {♠, ♣} (b) 『A, B が独立,B, C が独立,A, C は独立⇒ A, B, C は独立』は嘘 再びトランプ.A ={♢, ♡},B = {♢, ♠},C = {♠, ♡} (c) 発想を変えて i. 『X, Y が独立,Y, Z が独立⇒ X, Z は独立』は正しい? ii. 『X, Y が独立,Y, Z が独立,Z, X が独立⇒ X, Y, Z は独立』は正 しい?

(14)

3 大数の法則 10 3.2. 大数の法則 3.2.1. 大数の法則 X1, X2, . . . が X の独立なコピーならば,確率 1 で,n が十分 大きければ X1+· · · + Xn n ≒ E[X] となる. 3.2.2. 【例】 表が出る確率が 0.7 のコインを n 回投げる. X1= { 1 (1 回目は表) 0 (1 回目は裏), X2= { 1 (2 回目は表) 0 (2 回目は裏), . . . とする. 1 回目 2 回目    · · ·      (n − 1) 回目 n 回目 1 0 . . . 0 0 ♠ X1+· · · + Xn=n 回で表が出た回数 X1+· · · + Xn n =n 回で表が出る頻度 ♠ n が大きければ,「n 回で表が出る頻度≒ 0.7」(E[X] = 0.7) 3.2.3. 公平なコイン 公平なコイン,すなわち,表が出る確率,裏が出る確率が それぞれ1 2のコイン.(E[X] = 1 2) ♠ 「2 回に 1 回表が出る」は× ♠「1 万回に 5 千回表が出る」は○ ♢ 「公平」というふれ込みのコインを 5 千回投げたら,2989 回表が出た. 公平ですか?…たぶん怪しい. では,もし,表が出たのは 2,548 回だったら? 3.2.4. 顧客の嗜好調査 顧客 1,000 人に新商品を買いたいかどうかアンケート調査 をした.700 人が Yes.『顧客=コイン』『表が出る=購入する』と見做すと, 「7 割がた,購入する」と説明できる!! 3.2.5. 保険金の平均支払金額 『自動車保険での総支払額/支払件数』が平均支払 金となる.しかしこれは,単純な平均値ではなく,大数の法則に保証され た支払金額の「推定値」である. (支払額)=(真の支払額)+(揺らぎ) (揺らぎ)=確率変数,期待値は 0 のはず (なぜ?) 支払額の総和 支払件数 = (真の支払額) + 揺らぎの総和 支払件数

(15)

4 中心極限定理 11

4.

中心極限定理

4.1. はじめに 4.1.1. 大数の法則の弱点 顧客の満足度調査をした.満足したと答えた人が,100 人中 94 人いた.もう少し詳しい調査では,1,000 人中 936 人が満足したと 回答した. 大数の法則では,94% = 94 100,93.6% = 936 1000 のどちらも≒ E[X] (期待値 の近似値) である. では,どちらを採用するのか?企業的には 94%,しかし… 4.2. 正規分布 4.2.1. 正規分布 g(x; µ, σ) = 1 2πσ2e −(x−µ)2 2σ2 とおく. P(X≦ a) =a −∞ g(x; µ, σ)dx となるとき,確率変数 X は平均 µ,分散 σ2 の正規分布にしたがうという (記号 X∼ N(µ, σ2)). 4.2.2. 身近な ex 年利 x で預金.年 n 回の利息 (複利).1 年後には ( 1 +x n )nn→ ∞ とする (連続複利) と ex エクセルで試してみよう! (EXP(x) との比較) x 1 0.1 0.3 4 exp(x) 1 5 .. . 100,000,000

(16)

4 中心極限定理 12 4.2.3. Quiz エクセルで y = g(x; µ, σ2) のグラフを描いてみよう. g(x; µ, σ2) を計算する方法は二つ.A1 = µ, B1 = σ, C1 = x とする. (a) 自分で数式を書く. (1/SQRT(2∗PI()∗$B$1^2))∗EXP(−(C1−$A$1)^2/(2∗$B$1^2)) ($A$1 は絶対座標) (b) エクセル関数 NORM.DIST(a,µ,σ,False) を使う.

NORM.DIST(C1, $A$1, $B$1, False)

※注 1.σ2ではなく,σ (偏差) を使う. ※注 2.『True』は「積分を計算します」が「False」. グラフは「散布図」を(おすすめを参考に). 4.2.4. Quiz エクセルでa −∞ g(x; µ, σ)dx を求めてみよう. エクセル関数 NORM.DIST(a,µ,σ,True) を使う ※注 1.『True』は「積分を計算します」が「True」. 4.2.5. 標準化 X ∼ N(µ, σ2) ならば,X− µ σ ∼ N(0, 1) (∵) 簡単な変数変換です… P ( X− µ σ ≦ a ) = P(X≦ µ + σa) =µ+σa −∞ 1 2πσ2e −(x−µ)2 2σ2 dx = ∫ a −∞ 1 2πe −y2 2 dy ( y =x− µ σ ) . 4.2.6. 再生性 X1, X2, . . . を X ∼ N(µ, σ2) の独立なコピーとする.このとき, X1+· · · + Xn− nµ σ√n ∼ N(0, 1) である. 証明は略します,それなりの微積分の力が必要なので. 4.3. 中心極限定理 4.3.1. 中心極限定理 (1) E[X] = µ, V(X) = σ2とし,X 1, X2, . . . は X の独立な コピーとする.このとき,十分大きな n に対し, X1+· · · + Xn− nµ σ√n ∼ N(0, 1) と見なしてよい. 4.3.2. 記号 Φ(a) =a −∞ 1 2πe −x2 2 dx とおく.

(17)

4 中心極限定理 13 4.3.3. 中心極限定理 (2) 上と同じ設定で,十分大きな n に対し,つぎが成り立つ. P ( X1+· · · + Xn− nµ σ√n ≦ a ) ≒ Φ(a) (4.1) P ( X1+· · · + Xn− nµ σ√n ≧ −a ) ≒ Φ(a) (4.2) X1+· · · + Xn− nµ σ√n ≧ −a は (−X1) +· · · + (−Xn)− n(−µ) σ√n ≦ a 書き直 せるから,(4.2) は (4.1) を−X に適用したものである. 4.3.4. 中心極限定理 (3) 上の分子分母を n で割り,算術平均 Xn= X1+· · · + Xn n を使って書き直す.すると, P ( Xn− n ≦ µ ) ≒ Φ(a) (4.3) P ( Xn+ n ≧ µ ) ≒ Φ(a) (4.4) となる. 4.3.5. y = Φ(x) のグラフ 0, 0.2, 0.4, . . . , 5.8, 6, 6.2 (0.2 刻み) の値の計算をしてグ ラフを描こう.

(a) エクセル関数 NORM.DIST(x, 0, 1,TRUE) (b) エクセル関数 NORM.S.DIST(x,TRUE) 4.3.6. Φ(x) = 0.99 となる x は? エクセル関数 NORM.S.INV(x) (a) 上の計算値の逆を求めてみよう.0, 0.2, . . . , 6.2 は再現される? (b) z = 0, 0.6, 0.7, 0.8, 0.9, 0.95, 0.99, 0.995, 0.999, 0.9995, 0.9999 に対する Φ(x) = z となる x を求めよう.

Φ(-a)=1-Φ(a)

(18)

5 信頼区間–比率 14

5.

信頼区間–比率

中心極限定理は「どのように使える」のだろうか?それを実例に当たりながらみ ていこう. 5.1. 比率 5.1.1. コイン投げ 例 1.4.2 により,「表が出る確率が p である」コインに対しては, E[X] = p, V(X) = p(1− p) である.「X = 1」は「表が出る」,「X = 0」は 「裏が出る」を表していた. このコインを n 回投げる.i 回目に表が出ることを「Xi= 1」,裏が出るこ とを「Xi= 0」と表す.X1, X2, . . . は X の独立なコピーである. 5.1.2. コイン投げの算術平均 X1+· · · + Xnは,n 回投げたときに表が出た回数と なる.したがって,算術平均 Xn= X1+· · · + Xn n 表が出る比率を与える. 5.1.3. 比率と中心極限定理 (4.3),(4.4) により, P ( Xn− ap(1− p) n ≦ p ) ≒ Φ(a) P ( Xn+ ap(1− p) n ≧ p ) ≒ Φ(a) となる. p(1− p) ≦ 1 4 なので,これより, P ( Xn− a 2√n ≦ p ) ≒ Φ(a) (5.1) P ( Xn+ a 2√n ≧ p ) ≒ Φ(a) (5.2) となる. 5.2. 比率の最小値の保証 5.2.1. 設定視点を変えて表が出る確率 p が未知なコインを考える.このコインを n 回投げて表,裏を記録する.すると表が出た比率 Xnが分かる. (5.1) により,   「p は Xn− a 2√nより大きい」 ということが確率 Φ(a) の確からしさで主張できる. たとえば, Φ(2.326) = 0.99

(19)

5 信頼区間–比率 15 である.よって,   『コインの表が出る確率 p は Xn− 2.326 2√n より大きい』 ということが,99%の確からしさでいえる. 5.2.2. アンケートでの最低保証 アンケートに戻る. (a) 100 人中 94 人が Yes のとき,全体を推測する. 94 100 2.326 2100 ≒ 0.824 であるから,   Yes という人が,少なくとも 82.4%いる ということが,99%の確からしさでいえる. (b) 1,000 人中 940 人が Yes のときはどうだろうか? このときは, 940 1000 2.326 21000 ≒ 0.903 であるから,   Yes という人が,少なくとも 90.3%いる ということが,99%の確からしさでいえる. (c) 10,000 人中 9,400 人が Yes のときはどうだろうか? このときは, 9400 10000 2.326 210000 ≒ 0.928 であるから,   Yes という人が,少なくとも 92.8%いる ということが,99%の確からしさでいえる. 5.3. 比率の最大値の保証 5.3.1. 比率の最大値 (5.2) により,   「p は Xn+ a 2√nより小さい」 ということが確率 Φ(a) の確からしさで主張できる. Φ(2.326) = 0.99 により,   『コインの表が出る確率 p は Xn+ 2.326 2√n より小さい』 ということが,99%の確からしさでいえる. 5.3.2. アンケートでの最大保証 アンケートに戻る. (a) 100 人中 48 人が Yes のとき,全体を推測する. 48 100 + 2.326 2100 ≒ 0.596

(20)

5 信頼区間–比率 16 であるから,   Yes という人が,高々59.6%しかいない ということが,99%の確からしさでいえる. (b) 1,000 人中 480 人が Yes のときはどうだろうか? このときは, 480 1000+ 2.326 21000 ≒ 0.517 であるから,   Yes という人が,高々51.7%しかいない ということが,99%の確からしさでいえる. (c) 10,000 人中 4,800 人が Yes のときはどうだろうか? このときは, 4800 10000 + 2.326 210000 ≒ 0.491 であるから,   Yes という人が,高々49.1%しかいない ということが,99%の確からしさでいえる. 5.4. もう少し先へ 5.4.1. 確からしさを変えてみたら 上の二つを 95%,90%のときに確かめてみよう. 5.4.2. 前の問題 「公平」というふれ込みのコインを 1 万回投げたら,5,400 回表が出た.公 平ですか?では,もし,表が出たのは 5,150 回だったら? ♠ 5,400 回のときは 5400 10000 2.326 210000 ≒ 0.528 5400 10000 + 2.326 210000 ≒ 0.552 だから,98%(なぜ 99%ではない?) の確からしさで表が出る確率は 0.528 以 上,0.552 以下. ♠ 5,150 回のときは 5150 10000 2.326 210000 ≒ 0.503 5150 10000 + 2.326 210000 ≒ 0.527 だから,98%(なぜ 99%ではない?) の確からしさで表が出る確率は 0.503 以 上,0.527 以下.やはり公平とはいえない. ♠ もし,5,050 回ならば 5050 10000 2.326 210000 ≒ 0.493 5050 10000 + 2.326 210000 ≒ 0.517 だから,98%(なぜ 99%ではない?) の確からしさで表が出る確率は 0.493 以 上,0.517 以下.これなら「公平」らしい.

(21)

6 相関係数 17

6.

相関係数

6.1. 散布図 6.1.1. データ 最高気温 平均気温 最低気温 アイスクリーム売上げ 1 月 9.9 6.6 3.5 780 2 月 11.1 7.4 4.1 950 3 月 14.4 10.4 6.7 1280 4 月 19.5 15.1 11.2 1255 5 月 23.7 19.4 15.6 1290 6 月 26.9 23 19.9 1650 7 月 30.9 27.2 24.3 2000 8 月 32.1 28.1 25 2430 9 月 28.3 24.4 21.3 1200 10 月 23.4 19.2 15.4 1150 11 月 17.8 13.8 10.2 1210 12 月 12.6 8.9 5.6 1045 6.1.2. 気温を横軸に売り上げを縦軸にしてプロットしよう. ♠ エクセルの散布図を使う 6.2. 相関係数 6.2.1. X1, . . . , Xnの分散 SX SX = 1 n ni=1 (Xi− Xn)2. ただし,Xn= X1+· · · + Xn n6.2.2. X1, . . . , Xnと Y1, . . . , Ynの共分散 SXY SXY = 1 n ni=1 (Xi− Xn)(Yi− Yn). 6.2.3. X1, . . . , Xnと Y1, . . . , Ynの相関係数 rXY rXY = SXY SX SY 6.2.4. SXX = SX 6.2.5. (a) X1= Y1, . . . , Xn= Ynならば,rXY = 1. (b) Y1=−X1, . . . , Yn=−Xnならば,rXY =−1

(22)

6 相関係数 18 (c) Yi= aXi+ b ならば,rXY = { 1 (a > 0) −1 (a < 0). 6.2.6. X と Y に強い相関があっても rXY = 1 とはならない. 例 X1, . . . , X10, Y1, . . . , Y10, Yi= Xi4のとき X 9 8 7 10 13 Y 6561 4096 2401 10000 28561 X 11 9 8 12 9 Y 14641 6561 4096 20736 6561 rXY = 0.972 ♠ エクセルで確かめてみよう! 6.2.7. 気温とアイスクリーム売上げの相関係数 最高気温 0.980,平均気温 0.974,最低気温 0.958 ♠ エクセルで確かめてみよう 6.3. 相関係数と散布図 相関係数と散布図の関係を次のデータで見てみよう 系列 1 系列 2 系列 3 21 47.1 86.8 111.3 68 106.6 62.4 38.7 54 89 36.3 29 10 26.4 103.9 28.9 47 143.8 57.2 72.5 78 177.5 37.9 34 53 155.5 76.5 78.2 46 81.7 35.4 43.9 14 30.8 108.5 3.4 34 116.4 67.7 7.2 12 34.7 137 48.2 72 167.3 8.5 109 78 138.3 26.3 30.9 29 48.2 115.7 81 59 102.7 40.1 58.5 17 44.3 121.5 114.3 89 211.5 7.7 60.5 57 87 15.5 74.7 63 95.6 72.5 67 27 73.1 85 82.5

(23)

7 単回帰分析 19

7.

単回帰分析

7.1. 単回帰分析 7.1.1. 問題 平均気温とアイスクリームの売り上げの関係をより詳しく説明した い.たとえば,気温 20 度ならどの程度アイスクリームは売れるのか? 平均気温 アイスクリーム売上げ 6.6 780 7.4 950 10.4 1280 15.1 1255 19.4 1290 23 1650 27.2 2000 28.1 2430 24.4 1200 19.2 1150 13.8 1210 8.9 1045 7.1.2. アイディア 散布図に上手に直線 y = ax + b を引いて x = 20 を代入する! a, b はどう求める? 7.1.3. 回帰直線 (x1, y1), . . . , (xn, yn) をデータとする. x = x1+· · · + xn n , y = y1+· · · + yn n , Sxy= ni=1 (xi− x)(yi− y), Sxx= ni=1 (xi− x)2, ba = Sxy Sxx , bb = y − bax

(24)

7 単回帰分析 20 とおくと,a =ba,b = bb が求める a, b である. 直線 y =bax + bb を回帰直線と呼ぶ. 7.1.4. 理由 (1):最小二乗法 Q(a, b) = ni=1 {yi− (axi+ b)}2 (残差) を 最小にする.つぎの事実を使って変形していく:(通常の統計の教科書に書 いてある「偏微分」を使う説明は難しい) Sxx= ∑ i {x2 i − 2xxi+ (x)2} =i x2i − 2nx2+ nx2=∑ i x2i − nx2, Sxy= ∑ i {xiyi− xyi− yxi+ xy} =i

xiyi− nxy − nxy + nxy

=∑ i xiyi− nx y, Syy = ∑ i yi2− ny. 変形は,つぎの通り: ∑ i {yi− (axi+ b)}2= ∑ i (yi− axi− b)2 =∑ i {y2 i + x 2 ia 2+ b2− 2x iyia + 2xiab− 2yib} = nb2+ 2n(xa− y)b +(∑ i x2i ) a2− 2(∑ i xiyi ) a +i y2i

= n{b + (xa − y)}2− n(xa − y)2+(∑

i x2i ) a2− 2(∑ i xiyi ) a +i yi2 = n{b + (xa − y)}2+(∑ i x2i − nx2 ) a2 − 2(∑ i xiyi− nx y ) a +i y2i − ny 2 = n{b + (xa − y)}2+ Sxxa2− 2Sxya + Syy = n{b + (xa − y)}2+ Sxx ( a−Sxy Sxx )2 −S 2 xy Sxx + Syy. 二つの (· · · )2の項が 0 となるときが最小である.

(25)

7 単回帰分析 21 7.1.5. 理由 (2):統計量 Y = ax + b + Z (Z∼ N(0, σ2)) という確率変数を考える.(データにエラー がくっついている!) Yi= axi+ b + Ziとし,Ziは Z の独立なコピーだとする. ba = SxY Sxx bb = Y − bax とおく.ba,bb は (a) 不偏推定量; E[ba] = a, E[bb] = b (b) 最尤推定量;   尤度関数 L(a, b) =√ 1 2πσ2nexp ( 1 2 ni=1 (yi− (a + bxi))2 ) を最大にする a, b. ※ ∑n i=1 (yi− (a + bxi))2を最小にすることなので,最小二乗法に帰着! (c) 最小分散線形不偏推定量; ea = ni=1 ciYi, eb = ni=1 diYi とすると

V(ea) ≧ V(ba), V(eb) ≧ V(bb). 7.1.6. エクセルで a, b を求める 1) 実際に Sxx, Sxyを計算してみる.(手間がかかる) 2) エクセルの関数をつかう SLOPE,INTERCEPT 3) グラフに直線を引く! 7.1.7. 最高気温でやってみよう 7.2. 回帰分析の応用 7.2.1. トレンド分析 損保会社の累積支払保険金の増加の様子 (トレンド) を線形回帰する. 1 2 3 4 5 6 7 8 9 10 117 208 335 433 538 701 803 857 966 1176 ○ 回帰直線 y = 113.4545x− 10.6 ○ 11 年目の累積支払保険金:1237.4   ○ 11 年目に支払うであろう金額:1237.4− 1176 = 61.4

(26)

7 単回帰分析 22 ○ やってみよう 1 2 3 4 5 6 7 8 9 10 239 476 719 953 1259 1500 1528 1673 2235 2375 7.2.2. ロジスティック回帰 (もどき) 市場での占有率は,技術進展を繰り返せばどんどん上がるが当然 100%を超 えない; ○ y = 1 1 + eax+bという形 (ロジスティック) をしている. ※ 一般のロジスティック回帰では分子は 1 でなく未知の K となっており, これを求めることも問題となる. ○ このデータは次の通り:

(27)

7 単回帰分析 23 1 2 3 4 5 0.006425725 0.011929039 0.013588838 0.031338532 0.040913811 6 7 8 9 10 0.05212115 0.080896291 0.135832283 0.15159588 0.237454253 11 12 13 14 15 0.297813165 0.341376055 0.520958623 0.545791293 0.627789932 16 17 18 19 20 0.719939233 0.802076416 0.859232933 0.908140584 0.942957833 21 22 23 24 25 0.950664594 0.965184638 0.979148139 0.986842793 0.992209042 26 27 28 29 30 0.992894015 0.996895595 0.997354583 0.998558411 0.998587263 ○ z = ln(1 y − 1 ) と変形し,z = ax + b という回帰曲線を求める. ※ ln x は x = ezとなる z を表す.エクセルでは LN を用いる. ※ エクセルで LOG は log10のこと. ○ a = 0.404, b = 5.291 となる.よって,ロジスティック回帰曲線は y = 1 1 + e−0.404x+5.291 となる. ○ やってみよう 1 2 3 4 5 0.064790694 0.090423841 0.111418814 0.142571342 0.211331758 6 7 8 9 10 0.288737166 0.355482215 0.368020098 0.533691118 0.589594203 11 12 13 14 15 0.606063121 0.753918853 0.824012705 0.857759485 0.891809752 16 17 18 19 20 0.923783022 0.892751872 0.938201537 0.97154412 0.981719392 7.2.3. 多項式回帰 過去 10 年間の累積支払保険金の半年ごとの額は次のようになっていた. 0.5 1 1.5 2 2.5 3 3.5 5.06 6.23 8.65 13.32 17.98 23.13 30.19 4 4.5 5 5.5 6 6.5 7 36.47 50.27 59.37 73.24 86.27 101.47 103.06 7.5 8 8.5 9 9.5 10 125.92 139.58 160.08 184.41 192.1 225.37 グラフに書いてみると

(28)

7 単回帰分析 24 データは 2 次関数的に増加していっているように見える.あてはまる回帰 曲線は y = ax2+ b のような 2 次関数かもしれない. ※ 一般の多項式関数での近似は多重回帰分析が必要になる. ○ z = x2を導入し,y = az + b となる回帰直線を求める. ○ a = 2.16, b = 4.56 であり,y = 2.16x2+ 4.56 が求める回帰曲線となる. ○ やってみよう 1 2 3 4 5 6 7 7.24 22.85 47.88 82.42 132.77 185.15 256.24 8 9 10 11 12 13 14 324.32 410.69 521.63 618.1 757.69 888.11 1024.46 15 16 17 18 19 20 1137.92 1283.49 1460.3 1654.67 1844.63 2091.71 7.2.4. その他の関係 (a) y = bxa → ln y = ln b + a ln x (b) y = b exp(ax) → ln y = ln b + ax (c) y = b + a ln x (d) y = x bx + a → 1 y = b + a 1 x (e) y = 1 ax + b → 1 y = ax + b (f) y = a + b x (g) y = exp(a + bx) 1 + exp(a + bx) → ロジスティック (もどき)

(29)

8 差はあるのか?—平均の差の検定 25

8.

差はあるのか?—平均の差の検定

8.1. 検定の考え方 8.1.1. 問題 • 2 種類の工程で X 工程,Y 工程で製品を作る. • Y 工程の方が経費が掛かる. • X 工程で 100 個,Y 工程で 80 個試作してみた. • X 工程で作った製品の平均寿命は 1 万時間,Y 工程で作った製品の平 均寿命は 1 万 1 千時間であった. もし,この 1 万時間と 1 万 1 千時間に「差がない」と言えるならば,Y 工 程を採用できる. 8.1.2. アプローチ (a) “平均の差は 0 という仮定” をおく. (b) 確からしさ 95%で考えることにする. (c) |“平均の差” から作られる量 | ≦ a となる確からしさが 95%となる a を見つける. (d) | 平均の差 11000 − 10000 = 1000 から作られる量 | > a ⇒ 5%しか起きないことが起きている ⇒ 仮定が間違っている ⇒ 「差はある」 ※ 背理法もどき 8.1.3. 統計学の言葉では (a) 帰無仮説 H0 (b) 有意水準 α;確からしさ 1− α で考える (c) どのようなモデルを考えるかによる (d) 帰無仮説を棄却する 8.2. モデルの導入 8.2.1. モデル X 工程の試作品の個々の寿命 X1, . . . , X100,Y 工程の試作品の個々 の寿命 Y1, . . . , Y80は Xi= (真の寿命) + (誤差)i= µX+ ei Yj= (真の寿命) + (誤差)j= µY + Ej となっている. さらに,e1, . . . , e100, E1, . . . , E80は独立で∼ N(0, σ2). 8.2.2. 正規分布にかかわる事実

(30)

8 差はあるのか?—平均の差の検定 26 (a) U ∼ N(µU, σU2),V ∼ N(µV, σV2) 独立 ⇒ U + V ∼ N(µU+ µV, σ2U+ σ 2 V) (b) W ∼ N(µ, σ2) ⇒ aW ∼ N(aµ, a2σ2), W − µ σ ∼ N(0, 1) (c) Z1, . . . , Zn (独立,∼ N(µ, σ2)) ⇒ Zn= Z1+· · · + Zn n ∼ N ( µ,σ 2 n ) 8.2.3. X 工程,Y 工程ならば X100∼ N ( µX, σ2 100 ) , Y80∼ N ( µY, σ2 80 ) X100− Y80∼ N ( µX− µY, σ2 ( 1 100+ 1 80 )) . (a) 帰無仮説『H0;µX= µY』の下では X100− Y80∼ N ( 0, σ2 ( 1 100+ 1 80 )) ∴ X100− Y80 σ2 ( 1 100 + 1 80 ) ∼ N(0, 1) [標準正規分布にかかわる事実] Z∼ N(0, 1) のとき, P(|Z| ≦ a) = Φ(a) − Φ(−a) = 2Φ(a) − 1

ただし Φ(a) =a −∞ 1 2πe −x2 2 dx. (b) 有意水準 α に対する a は, 1− α = 2Φ(a) − 1 を解いて, Φ(a) = 1−α 2 ( a = NORM.S.INV(1−α2) ) 有意水準 5%=0.05 ならば,a = NORM.S.INV(0.975) = 1.96 である. よって, X100− Y80 √ σ2 ( 1 100+ 1 80 ) ≦ 1.96 が 95%の確からしさで起きる. (d) σ2は?

(31)

8 差はあるのか?—平均の差の検定 27 既知とすれば,たとえば,σ2= 100 であれば, X100− Y80 √ 100 ( 1 100+ 1 80 ) ≦ 1.96 が 95%の確からしさで起きる. 実際のデータでは X100− Y80= 1000 であるから,(左辺) = 666.7 となり, 1.96 よりはるかに大きい. よって帰無仮説は棄却される=平均寿命は異なる. 8.2.4. 一般に (σ2が既知のとき) • X 群の標本数は nX,標本平均は X. • Y 群の標本数は nY,標本平均は Y • 帰無仮説 H0;X 群と Y 群の『真の平均値』は同じ • 有意水準を α を決める X− Yσ2 ( 1 nX + 1 nY ) > NORM.S.INV(1−α2) ならば,帰無仮説を棄却する(= X 群と Y 群の平均値は同じでない). 8.2.5. 有意水準=危険率 有意水準 0.05(5%) で棄却するということは,5%しか起きないことが起き ているので,帰無仮説は正しくないとすることである.したがって,『5%の 誤り』を内包している. 8.2.6. やってみよう nA XA nB YB α σ2 | · · · | NORM.S.INV 棄却 100 220 200 219.6 0.05 1 100 220 200 219.6 0.1 1 100 220 200 219.6 0.01 1 100 220 200 219.7 0.05 1 100 220 200 219.7 0.1 1 100 220 200 219.7 0.01 1 100 220 200 219.76 0.05 1 100 220 200 219.76 0.1 1 100 220 200 219.76 0.01 1 絶対値は ABS(x)

(32)

8 差はあるのか?—平均の差の検定 28 8.2.7. σ2が未知の場合 • X 群の標本数は nX,標本平均は X. • Y 群の標本数は nY,標本平均は Y • 帰無仮説 H0;A 群と B 群の真の平均値は同じ • 有意水準を α を決める tX,Y = X− YSXX+ SY Y nX+ nY − 2 ( 1 nX + 1 nY ) とおく.ただし, SXX = nXi=1 (Xi− X)2= X の標本分散× nX SY Y = nYj=1 (Yj− Y )2= Y の標本分散× nY. • もし |tX,Y| > T.INV.2T(α, nX+ nY − 2) ならば,帰無仮説を棄却する(= X 群と Y 群の平均値は同じでない). 8.2.8. What’s behind! — t-分布 (a) 重要な事実:帰無仮説の下で tX,Y は自由度 nX+ nY − 2 の t-分布に 従う. (b) W が自由度 n の t-分布に従うとは, P(W≦ a) =a −∞ 1 n B(n2,12) 1 (1 +x2 n) n+1 2 dx = Tn(a) ただし, B(a, b) = ∫ 1 0 xa−1(1− x)b−1dx. グラフにしてみると (c) ならば,考え方は前と同じ.

P(|tX,Y| ≦ a) = TnX+nY−2(a)−TnX+nY−2(−a) = 2TnX+nY−2(a)−1 から, 1− α = 2TnX+nY−2(a)− 1 を解けばよい.この解 a はエクセルの関数を用いて次のように求めら れる; a = T.INV(1−α 2, nX+ nY − 2) = T.INV.2T(α, nX+ nY − 2).

(33)

8 差はあるのか?—平均の差の検定 29 8.2.9. 例題 有意水準 0.01, 0.05, 0.1 X; 581, 700, 597, 534, 596, 582, 538, 588, 581, 539 Y; 543, 510, 580, 520, 506, 550 8.2.10. やってみよう 有意水準 0.01, 0.05, 0.1 X; 53, 59, 51, 58, 57, 55, 53, 56, 54, 51, 54, 60 Y; 58, 57, 58, 60, 58, 56, 58, 57, 56, 55

(34)

9 差はあるのか?—独立性の検定 30

9.

差はあるのか?—独立性の検定

9.1. サンドイッチの嗜好 9.1.1. 問題 男性,女性に好きなサンドイッチを選んでもらった結果次のようになった. 性別による嗜好の差があるといえるだろうか? 卵サンド カツサンド 野菜サンド ハムサンド 男性 20 32 24 28 女性 28 18 30 20 ※このような表をクロス集計表という. 9.1.2. 安直に 棒グラフを書いて比べてみる. 9.1.3. もう少し説得力を • 調査を受けた人は 200 人 (男性 104 人,女性 96 人) ∴ 男性の割合は104 200,女性の割合は 96 200 • 卵,カツ,野菜,ハムが好きな人はそれぞれ 48,50,54,48 人 ∴ 卵,カツ,野菜,ハムが好きな人の割合はそれぞれ 48 200, 50 200, 54 200, 48 200 • もし『男女に嗜好の差がない』のなら,男性で卵サンドが好きな人は 200×104 200× 48 200 = 24.96 (下図)

(35)

9 差はあるのか?—独立性の検定 31 • このときの差 24.96 − 20 = 4.96 が『嗜好に差がない』という仮定と のズレである.したがって,このような差の二乗の総和が “小さい” な ら,『嗜好に差がない』という仮定を認められる. 9.2. ピアソンの χ2(カイ二乗) 独立性検定 9.2.1. 一般の場合 • M 種類のグループ A1, . . . , AM について,N 種類の性質 B1, . . . , BN へのグループによる相関の違いがあるかどうかを調べる. • n 個のサンプルデータをクロス集計表に整理する. B1 B2   · · ·    BN A1 S11 S12 S1N .. . AM SM 1 SM 2 SM N pi= Si1+· · · + SiN n , qj= S1j+· · · + SM j n χ2= Mi=1 Nj=1 (Sij− npiqj)2 npipj とおく. ※ クロス集計表に小計セルと pi, qjセルを作るとよい. B1 B2   · · ·    BNpi A1 S11 S12 S1N S1A p1 .. . AM SM 1 SM 2 SM N SMA pMSB 1 SB2 SNB qj q1 q2 qN • 有意水準を α に対し, χ2> CHISQ.INV(1− α, (M − 1)(N − 1)) ならば,確率 α でしか起きない事象が起きている. ⇒ 棄却 =グループ間に性質 B の差はある. 9.2.2. サンドイッチでは M = 2,N = 4 である.クロス集計表を作って計算すると χ2 = 6.94 と なる.    CHISQ.INV(0.9, 3) = 6.25,

(36)

9 差はあるのか?—独立性の検定 32    CHISQ.INV(0.95, 3) = 7.81,    CHISQ.INV(0.99, 3) = 11.3487 であるから,有意水準 0.1 ならば棄却されるが,有意水準 0.05,0.01 では 棄却されない. 9.2.3. What’s behind!—カイ二乗分布 (a) 帰無仮説 A1, . . . , AM と B1, . . . , BN は独立である.(グループ間に性 質 B の差はない). (b) n が大きければ,χ2は自由度 (M− 1)(N − 1) のカイ二乗分布に従う (c) 自由度 k のカイ二乗分布 P(χ2≦ a) =a 0 1 2kΓ(k2) xk−22 e− x2 2 dx. ただし, Γ(y) = 0 xy−1e−xdx. ※ グラフを描いてみよう (d) 有意水準 α に対し,a = CHISQ.INV(1− α, k) は, P(χ2≦ a) = 1 − α を満たす. 検定の枠組みに入った! 9.2.4. やってみよう 春 夏 秋 冬 10 代 25 48 33 28 30 代 35 35 27 36 50 代 40 28 43 22 9.3. 適合度検定 9.3.1. 問題 これまで卵サンド,カツサンド,野菜サンド,ハムサンドの売り上げの比は 3:2:3:2 であった.新規商品に置き換えて 1000 個を試験的に売り出したと ころ,それぞれ 280,215,314,191 個売れた.以前通りの売り上げ比だと いってよいだろうか? 9.3.2. 安直に クロス集計表を拡張して見比べてみる;

(37)

9 差はあるのか?—独立性の検定 33 卵 カツ 野菜 ハム 280 215 314 191 予想比率 0.3 0.2 0.3 0.2 予想売上 300 200 300 200 9.3.3. 統計的手法 • 性質 B1, . . . , BN の起きる割合が p1, . . . , pN となっているかどうかを 調べる. • n 個のサンプルについて,Biの起きた度数を数え上げ,クロス集計表 を作成する. B1 B2   · · ·    BN X1 X2 XN χ2= Ni=1 (Xi− npi)2 npi とおく. ※ N が大きければ,χ2は自由度 N− 1 のカイ二乗分布に従う. • 有意水準 α に対し, χ2≦ CHISQ.INV(1 − α, N − 1) ならば,帰無仮説を棄却しない!=起きる割合は p1, . . . , pNであると考 える. ※ 『棄却しない』ことが重要. ※ 推論としては弱い; 『a2= 4 とする.もし a = 2 ならば,a2= 4 である. よって,a = 2 である』という論法. 9.3.4. サンドイッチの場合 N = 4 なので自由度は 3.χ2= 3.51 で,    CHISQ.INV(0.9, 3) = 6.25    CHISQ.INV(0.95, 3) = 7.81    CHISQ.INV(0.99, 3) = 11.34 なので,すべて棄却されない. 9.3.5. やってみよう これまで卵サンド,カツサンド,野菜サンド,ハムサンド,ミックスサンド の売り上げの比は 2:1:2:2:3 であった.新規商品に置き換えて 1000 個を試験 的に売り出したところ,それぞれ 210,90,190,190,320 個売れた.以前 通りの売り上げ比だといってよいだろうか?

参照

関連したドキュメント

Zaltus SX, applied as part of a burndown program, may be used for residual weed control, as well as to assist in postemergence burndown of many weeds where field corn will be

Lumax EZ Herbicide may also be used in the culture of sweet corn, yellow popcorn, and grain sorghum but the application must be made prior to crop emergence, (i.e., preemergence)

- Parts of the foregoing machinery, apparatus or equipment Plates, cylinders and other printing components; plates, cylinders and lithographic stones, prepared for printing purposes

Depending on specific crop application directions, Verdict may be applied for residual control of germinating weed seedlings before planting (preplant) or after planting but before

This product may be used as a burndown treatment prior to planting any crop; or shortly after planting, but prior to emergence of, wheat (including durum), barley, oat,

MANGANESE X-TRA may be used to treat or prevent manganese deficiencies while providing a highly compatible source of manganese for tank mixes.. COMPATIBILITY: MANGANESE X-TRA

Without TEPCO’s permission, it is prohibited to duplicate this document, to use its contents for other purposes than original or to disclose it to third parties.. Tokyo

• Herbicides not approved for tank mixing on this Discover NG Herbicide label, or other Syngenta labeling or recommendations made by Syngenta may be applied sequentially. For