第 3 回講義の項目と概要統計的手法入門 : 品質のばらつきを解析する平均と標準偏差 (P30) a) データは平均を見ただけではわからない平均が同じだからといって同一視してはいけない b) データのばらつきを示す標準偏差にも注目しよう c) 平均

(1)

1 第３回講義の項目と概要 2016.8.29 １．３統計的手法入門：品質のばらつきを解析する１．３．１平均と標準偏差（Ｐ３０）ａ）データは平均を見ただけではわからない。平均が同じだからといって、同一視してはいけない。ｂ）データのばらつきを示す「標準偏差」にも注目しよう。ｃ）平均：ＡＶＥＲＡＧＥ関数，標準偏差：ＳＴＤＥＶＰ関数とＳＴＤＥＶという関数 ①取得したデータそのものの標準偏差（ばらつき）を求める場合・・・ＳＴＤＥＶＰ関数を使用 ②母集団（まだ説明していない、たくさんのデータの集まり）から、データを抜取り、母集団の標準偏差（ばらつき）を推定する場合・・・・ＳＴＤＥＶ関数を使用する（１）データの性質・・・ヒストグラムを思い出そうａ）データは、平均値の周りにばらつくｂ）ばらつきのないデータは存在しないｃ）このことを、「データは分布する」というｄ）データは、どのようにばらつくかは分布の状態に現れる（２）この分布のあり方（分布の状態）には、いろいろある・・・・・統計学それぞれ分布の形に特徴がある。・正規分布・・・・NORMDIST（値，平均値，標準偏差，関数形式）・二項分布・・・・BINOMDIST（値，サンプル数，不良率，関数形式）・ポアソン分布・・POISSON（値，イベント数，平均，関数形式）・ｔ分布 ⇒Ｔ分布表・Ｆ分布 ⇒Ｆ分布表・ 2 x （カイ二乗）分布・・・CHISQ.DST（値，自由度，関数形式）・一様分布など（３）先週作成したヒストグラムは縦棒が６本であった。これはデータの数が５０個くらいだったことにある。

品質管理でよく使われる

検定をするときに使用する

(2)

2 （３）データ数が沢山あると、データ区間は細かくとることができるので、縦棒の本数は多くなり、１本の曲線で表すことができる。（４）ヒストグラムがデータの分布を表しているように、１本の曲線もデータの分布を表している。（５）先週のテキストＰ３７に示す正規分布がその代表的な分布曲線である。（正確には「確率分布」という） 0 2 4 6 8 10 12 14 16 18 93 96 99 102 105 108 次の級頻度データ区間

ヒストグラム

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 90 92 94 96 98 100 102 104 106 108 110

μ

(3)

3 正規分布（Ｐ３２）の性質ａ）データは平均を中心にばらつく。これを「データは分布する」という。ばらつきは分布の形で表される。分布の形として、統計学では、正規分布、二項分布、ポアソン分布、ｔ分布、Ｆ分布、χ2_{（カイ二乗）分布、一様分布をあげている。} ｂ)正規分布のことをＸ：Ｎ（μ，σ2_）と書くここで、μ：平均，σ：標準偏差のことｃ）ｆ（ｘ）＝ 2 ) ( 2 1 2 1 − x_σ−µ e σ π ・・・・変数としてμとσがあり、データが変わると形が変わる正規分布は平均がμで標準偏差がσで左右対称の釣鐘型をした分布形態であるが、正規分布の公式は、μとσの値によって形が変わるので、扱いにくい。ｄ）そこで「標準化」が行われる。Ｕ＝ σ µ − x とおくとｆ（Ｕ）＝ π 2 1 ｅ 2 2 1 u − となり、μ＝０、σ＝１となる。・・・・データがどんなに変わろうとも不変。（１）正規分布の特徴は、平均（μ）が中央にあって左右対称で、すらっとした美しい形（釣鐘型という）をしているデータのばらつきは標準偏差（σ）で示される。また、平均値と中央値と最頻値が同じという特徴もある。（２）平均値（μ）を境にして右側、左側それぞれ５０％であるこれは前回の宿題で正規確率紙の５０％のところの値を読み取ったことを意味している。正規確率紙の５０％のところの値を読みとると平均値（μ）が求められることを、正規確率紙を使って勉強した。（３）標準偏差（σ）を求めるために、正規確率紙の１５．９％の値と５０％の値の差で求めた。（４）学生１００人について身長を測定したところ、平均値（μ）＝１６８．１標準偏差（σ）＝６．９５の正規分布となることがわかったとします。このことは、Ｎ（１６８．１，６．９５2_{）と記述する。} ＮはＮｏｒｍａｌＤｉｓｔｒｉｂｕｔｉｏｎの略このことをグラフに書くと以下のようになる。

(4)

4 １５．９％は、点Ａの外側の割合である。点Ａと平均μの間は標準偏差σを示している。つまり、Ａ＝μ―σ ＝１６８．１－６．９５＝１６１．１Ｂ＝μ＋σ ＝１６８．１＋６．９５＝１７５．０６８％の人は、１６１ｃｍ～１７５ｃｍの間にあることを意味している。 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 140 145 150 155 160 165 170 175 180 185 190 195 200

f(x)

６８．２％

σ＝６．９５

１５．９％

ＡＢ μ＝１６８．１

(5)

5 １．３．４二項分布（Ｐ．４０）・ベルヌーイトライアル（ベルヌーイ試行）コインの裏と表，良品と不良品，製品の合格と不合格，・ｎ回試行して、ｘ回どちらか一方の事象が起きた確率は二項分布となる・二項確率紙を後程取り上げるが、二項分布を前提としている・ＥＸＣＥＬの関数で、ＢＩＮＯＭＤＩＳＴ（不良件数，サンプル数，不良率，関数形式）例題７，例題８（Ｐ４１）１．３．５ポアソン分布（Ｐ．４２）・ポアソン分布は二項確率紙の仲間である・きわめてまれにしか発生しない場合をポアソン分布という・ＥＸＣＥＬの関数では、ＰＯＩＳＳＯＮ（イベント数，平均，関数形式）例題９，例題１０（Ｐ４３）１．３．６母集団，標本および母平均の推定（Ｐ．４４）ａ）母集団（有限母集団と無限母集団）実務の世界では、製品のロットのことを母集団という。このロットの大きさは 1000 個くらいである。ｂ）標本（サンプル）コット全部を検査できないから、この中から 20 個とか 30 個抜き取って、知らべたり、検査する（抜取検査という）。検査したときには良品と不良品しかないから二項分布が当てはまる。この抜き取ったものを「標本」とか「サンプル」という。母集団ｃ）母平均（区間平均）母集団全体の状況（特性値）を「母平均」という。母平均は標本の平均、標本のばらつき（標本の標準偏差）を基に計算できる（Ｐ４５、表１．１）ｄ）母不良率

サンプル（標本）

不良率

(6)

6 ・標本を検査して、良品と不良品に分ける（抜取検査）ことを実務で実施する・二項確率紙を使うと、母集団に含まれる不良の割合が容易に求められる・母集団に含まれている不良の割合のことを「母不良率」という・「母不良率」の大きさによって、母集団（ロット）の合格または不合格を判定する１．３．７統計量の性質（Ｐ．４６）ａ）統計量（データ）は、母集団の平均を中心にばらつくこのことを「分布する」というｂ）したがって、母集団から抜き取った標本（サンプル）の値（観測値）は、抜取る度に変化するすなわち、「変数」であるｃ）この変数を「確率変数」というｂ）母集団から抜き取った標本（サンプル）の平均＝標本平均という。標本のばらつきを、標本分散とか標本標準偏差という。標本平均、標本分散、標本標準偏差のことを標本統計量（単に、統計量）という１．３．８統計的有意性（Ｐ．４７）ａ）有意・・・非常にわかりにくい言葉である統計学には、「よく起きる事象」と、「めったに起きない事象」がある例：学生１００人の身長を測定したとき、１６１ｃｍ～１７５ｃｍくらいの人はたくさんいるが１４７ｃｍ以下の人、１８９ｃｍ以上の人はめったにいない。どれくらいいるかとういうと、それぞれ２．５％（１００人の中で２～３人）「めったに起きない事象」のことを「有意」という・「めったに起きないほど大きい」ことを「有意に大きい」という・「めったに起きないほど小さい」ことを「有意に小さい」というｂ）正規分布を例にとると変数値（観測値）が極端に大きい確率は非常に小さい変数値（観測値）が極端に小さい確率は非常に小さい変数Ｘが正規分布をして、平均がμ、標準偏差がσであるとき

Ｘ：Ｎ（μ，σ

2

_）

と書く。ここで、Ｎ：Ｎｏｒｍａｌｄｉｓｔｒｉｂｕｔｉｏｎ（正規分布）のこと平均身長が、１６８．１ｃｍ、標準偏差が１０ｃｍの場合には

Ｘ：Ｎ（１６８．１，１０

2

_）

と書く

(7)

7 身長が、１７０ｃｍ、１６０ｃｍの人はたくさんいる。このことを「普通によく起きる確率」という。または、「有意でないことが起きる確率」ともいう。これを「信頼係数」という。１４７ｃｍ～１８９ｃｍの間のことを「信頼区間」という「めったに起きないことが起きる確率」のことを「有意水準」という「めったに起きないこと」とは、身長が１８８．９５ｃｍ以上の人、または１４７．２５ｃｍ以下の人のことをいう。通常、有意水準は５％を使用する。つまり信頼係数は９５％となる。また、有意水準には、片側と両側がある。通常は有意に小さい場合、有意に大きい場合の両方があるので、「両側有意水準」を使う。 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 140 145 150 155 160 165 170 175 180 185 190 195 200

f(x)

σ：６．９５ｃｍ信頼係数：９５％平均＝１６８．１ _{１８８．９５} １４７．２５信頼区間１４７．１ｃｍ以下の身長は「有意に小さい」その割合は２．５％１８８．９５ｃｍ以上の身長は「有意に大きい」その割合は２．５％

(8)

8 １．３．９数値の丸め（Ｐ．４７）・・・・・省略・小数点以下だらだら記述しないこと・テキストＰ４８にいろいろ書いてあるが・通常は、小数点以下１桁くらいでよい（小数点以下第２位を四捨五入する）・これを「丸め」という。