• 検索結果がありません。

平均値 平均値の差の検定 ,

N/A
N/A
Protected

Academic year: 2021

シェア "平均値 平均値の差の検定 ,"

Copied!
20
0
0

読み込み中.... (全文を見る)

全文

(1)

,

樋口さぶろお http://hig3.net

龍谷大学理工学部数理情報学科

生活の中の統計技術 L08(2018-11-19 Mon)

最終更新: Time-stamp: ”2018-11-19 Mon 10:04 JST hig”

今日の目標

Excelで平均値の区間推定ができる

統計的仮説検定の考え方を説明できる

Excelで平均値の統計的仮説検定ができる

樋口さぶろお (数理情報学科) L08平均値,平均値の差の検定 生活の中の統計技術(2018) 1 / 20

(2)

L07-Q1

Quiz解答:母比率の区間推定

A候補に投票したをX = 1,しなかったをX = 0とする.

1 標本比率はpˆ= 3550 = 0.7. 母比率p0.7と推定する.

2 Xの母分散は0.7×(10.7) = 0.21 と推定する. 母比率pの信頼係数1−α= 0.95の信頼区間は,

0.71.96×

1

50 ·0.21<p <0.7 + 1.96×

1 50·0.21 0.70.13<p <0.7 + 0.13

0.57<p <0.83

信頼係数0.95では当選ってことですね(放送用語「当選確実」で, であやまらなきゃいけない確率は0.05以下).

(3)

3 母比率pの信頼係数0.99の信頼区間は, 0.72.58×√

0.0042<p <0.7 + 2.58×√ 0.0042 0.70.17<p <0.7 + 0.17

0.53<p <0.87

信頼係数0.99 のほうが慎重な判断基準ですが,それでも当選ってこ とですね.

L07-Q2

Quiz解答:母比率の区間推定 0.61.96×

0.6·0.4

10 < p <+0.61.96×

0.6·0.4 10 . 0.3< p <0.9.

樋口さぶろお (数理情報学科) L08平均値,平均値の差の検定 生活の中の統計技術(2018) 3 / 20

(4)

ここまで来たよ

6 略解:比率の区間推定,平均値の差の区間推定

7 平均値,平均値の差の検定

Excelによる平均値の区間推定

(平均値の)統計的仮説検定

Excelによる平均値の統計的仮説検定

(5)

平均値 , 平均値の差の区間推定 I

平均値の区間推定

母集団の平均値 µの,信頼係数 1−α= 0.95,0.99 の信頼区間は, x−zα/2 s

√N < µ < x+zα/2 s

√N. x: 標本の平均値

s: 標本の標準偏差 N: 標本のサイズ

樋口さぶろお (数理情報学科) L08平均値,平均値の差の検定 生活の中の統計技術(2018) 5 / 20

(6)

平均値 , 平均値の差の区間推定 II

母平均値の差の区間推定

母集団1と母集団2の平均値の差µ1−µ2 の信頼係数1−αの信頼区間は X1−X2−zα

2

√S

N < µ1−µ2 < X1−X2+zα 2

√S N X1, X2 標本1,2の平均値

N1, N2 標本1,2のサイズ S2プールした分散 係数 zα/2 =

{

1.96 (1−α= 0.95) 2.58 (1−α= 0.99)

(7)

区間推定のイメージ

クラス全体の平均身長を,少人数の標本(サンプル)を抽出して推定した.

0 2 4 6 8 10 12 14

0 50 100 150 200 250

Team Number

Height(cm) 0.95

0.99 sample size

4 5

7 4 3

4 5 3 5 8 7 4

7

樋口さぶろお (数理情報学科) L08平均値,平均値の差の検定 生活の中の統計技術(2018) 7 / 20

(8)

チーム 標本サイズ 滋賀県

iYi 標本平均値X(cm) 不偏標本分散s2 (cm2)

1 4 2 169.5 97.7

2 5 1 165.8 5.7

3 2 2 175.0 50

4 7 4 169.7 24.9

5 4 1 167.5 21.7

6 3 2 167.7 30.3

7 4 1 161.0 62

7.5 5 2 185.0 250

8 3 1 170.0 1.0

9 5 1 175.8 35.2

10 8 3 168.8 19.6

11 7 3 165.0 39.7

12 4 1 169.5 51.0

13 7 1 168.9 171.8

(9)

ここまで黙っていたこと

ここでの説明は正確さより単純さ重視で書いてます.

母集団は,共通の分散,異なる平均値で正規分布していることを仮定 しています.

本来は,標本サイズNi は本当は自由度Ni1で考えるべきです.

本来は,標本の分散のかわりに不偏標本分散を使うべきです.

本来は,zα/2 でなく,t-分布表を見てtα/2(Ni1)を使うべきです.

=Excel は正しくやってくれる点.

樋口さぶろお (数理情報学科) L08平均値,平均値の差の検定 生活の中の統計技術(2018) 9 / 20

(10)

Excel による区間推定

準備:統計ツールを有効化 動画

ファイル>オプション>アドイン>Excelのアドイン>設定>分析ツール に チェックを入れて OKする.

平均値の信頼区間

データ >データ分析>基本統計量 >統計情報,平均の信頼区間の出力にチェック, —% 90,95などを入力 先頭行をラベルとして使用: 指定する範囲の先頭が,量の名前ならチェッ

クする,使う数値ならチェックしない.

(11)

Excel の出力と読み方

1 1

2

3 平 均 41

4 標 準 誤 差 1 . 9 1 4 8 5 4 2 1 6

5 中 央 値 ( メ ジ ア ン ) 41

6 最 頻 値 ( モ ー ド ) #N/A

7 標 準 偏 差 6 . 0 5 5 3 0 0 7 0 8

8 分 散 3 6 . 6 6 6 6 6 6 6 7

9 尖 度 −1.2

10 歪 度 0

11 範 囲 18

12 最 小 32

13 最 大 50

14 合 計 410

15 標 本 数 10

16 信 頼 区 間( 9 5 . 0 % ) 4 . 3 3 1 7 0 1 1 7 9

95%信頼区間(1−α = 0.95)は,

414.331701179< µ <41 +4.331701179.

樋口さぶろお (数理情報学科) L08平均値,平均値の差の検定 生活の中の統計技術(2018) 11 / 20

(12)

ここまで来たよ

6 略解:比率の区間推定,平均値の差の区間推定

7 平均値,平均値の差の検定

Excelによる平均値の区間推定

(平均値の)統計的仮説検定

Excelによる平均値の統計的仮説検定

(13)

統計的仮説検定とは

観測のある科学(心理学,社会学,生物学…)でいちおう合意されている, データから「異常である」ことを主張する手法.

実行する人の定義する‘正常な状態’(=帰無仮説)からの異常を,ときどき は検出できる試験紙(変色したら異常っぽい)

変色した=帰無仮説の棄却=「差があったと結論する」

変色しなかった =何もいえない =「差があったと結論する」̸=

「差がなかったと結論する」

異常なのに変色しないとこと=偽陰性=2種の過誤 異常なのに変色しない確率= β. 検出力1−β

正常なのに変色してしまうこと =偽陽性=第1種の過誤 正常なのに変色してしまう確率 =有意水準 α 信頼水準1−α α β を両方小さくするのは難しい.

方針: α の値が0.01や0.05になるように調整する. β はできる範囲で小 さくする(けど難しい)

樋口さぶろお (数理情報学科) L08平均値,平均値の差の検定 生活の中の統計技術(2018) 13 / 20

(14)

真実

帰無仮説 は真 帰無仮説 は偽 判断 帰無仮説 を棄却しない 正しい判断 第2 種の過誤 (確

βで起きる) 帰無仮説 を棄却 第1種の過誤 (

α で起きる)

正しい判断

(15)

統計的仮説検定の例

あるテストは,授業を受ける前(事前pre-)は平均点が100点満点で 50点であることがわかっているとしよう(まったく未知の知識で,

×問題だから).

ある方式の授業を受けた後(事後post-),成績があがることは確か, と主張したい.

正常状態=事後の平均点が50(正常状態としては,数値がはっきりわ かっているものを選ぶ)

異常状態=事後の平均点が50点より大きい (これを言いたい)

樋口さぶろお (数理情報学科) L08平均値,平均値の差の検定 生活の中の統計技術(2018) 15 / 20

(16)

平均値の場合の , 試験紙の仕組み

平均値の統計的仮説検定

信頼係数 1−α の信頼区間が,正常値(実行する人が設定する)にかかっ ていなければ,変色.

平均値の差の統計的仮説検定

差の信頼係数 1−α の信頼区間が,正常値0にかかっていなければ,変色.

(17)

ここまで来たよ

6 略解:比率の区間推定,平均値の差の区間推定

7 平均値,平均値の差の検定

Excelによる平均値の区間推定

(平均値の)統計的仮説検定

Excelによる平均値の統計的仮説検定

樋口さぶろお (数理情報学科) L08平均値,平均値の差の検定 生活の中の統計技術(2018) 17 / 20

(18)

Excel による平均値の統計的仮説検定

準備:統計ツールを有効化 動画

ファイル>オプション>アドイン>Excelのアドイン>設定>分析ツール に チェックを入れて OKする.

平均値の差の検定

データ >データ分析>t検定: 等分散を仮定した2標本による検定 >

仮説平均との差異: 0 (この説明の範囲では).

α: 有意水準 α= 0.05,0.01 など. 平均値の検定

データ >データ分析>t検定: 等分散を仮定した2標本による検定 >

2個目の標本には,すべて,帰無仮説の値を手で入れておく. 仮説平均との差異: 0 (このやり方では)

(19)

Excel の出力の読み方

1 t検 定: 等 分 散 を 仮 定 し た 2 標 本 に よ る 検 定

2

3 変 数1 変 数 2

4 平 均 3 4 . 6 30

5 分 散 3 5 . 8 0

6 観 測 数 5 5

7

8 プ ー ル さ れ た 分 散 1 7 . 9

9 仮 説 平 均 と の 差 異 0

10 自 由 度 8

11 t 1 . 7 1 9 1 0 0 7 1 3

12 P(T<=t ) 片 側 0 . 0 6 1 9 5 7 2 4 6

13 t 境 界 値 片 側 1 . 8 5 9 5 4 8 0 3 8

14 P(T<=t ) 両 側 0 . 1 2 3 9 1 4 4 9 2

15 t 境 界 値 両 側 2 . 3 0 6 0 0 4 1 3 5 変色判定: |t|>t境界値片側.

樋口さぶろお (数理情報学科) L08平均値,平均値の差の検定 生活の中の統計技術(2018) 19 / 20

(20)

お知らせ

来週 2018-11-26月2 休講させていただきます

補講たぶん2019-01-22火 集中補講日 期末試験計画

30ピーナッツ/科目100ピーナッツ

60

2019-01-28月 レポート計画

参照

関連したドキュメント

平均車齢(軽自動車を除く)とは、令和3年3月末現在において、わが国でナン バープレートを付けている自動車が初度登録 (注1)

平均的な消費者像の概念について、 欧州裁判所 ( EuGH ) は、 「平均的に情報を得た、 注意力と理解力を有する平均的な消費者 ( durchschnittlich informierter,

直流電圧に重畳した交流電圧では、交流電圧のみの実効値を測定する ACV-Ach ファンクショ

浮遊粒子状物質の将来濃度(年平均値)を日平均値(2%除外値)に変換した値は 0.061mg/m 3 であり、環境基準値(0.10mg/m

のうちいずれかに加入している世帯の平均加入金額であるため、平均金額の低い機関の世帯加入金額にひ

年平均濃度 SO2,Ox, NO2)、mg/m3(SPM) 年平均濃度µg/m3 (PM2.5)、×0.1ppmC

古安田層 ・炉心孔の PS 検層結果に基づく平均値 西山層 ・炉心孔の PS 検層結果に基づく平均値 椎谷層 ・炉心孔の

5日平均 10日平均 14日平均 15日平均 20日平均 30日平均 4/8〜5/12 0.152 0.163 0.089 0.055 0.005 0.096. 