• 検索結果がありません。

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

N/A
N/A
Protected

Academic year: 2021

シェア "第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

1 第3回講義の項目と概要 2016.8.29 1.3 統計的手法入門:品質のばらつきを解析する 1.3.1 平均と標準偏差(P30) a)データは平均を見ただけではわからない。平均が同じだからといって、同一視してはいけ ない。 b)データのばらつきを示す「標準偏差」にも注目しよう。 c)平均:AVERAGE関数,標準偏差:STDEVP関数とSTDEVという関数 ①取得したデータそのものの標準偏差(ばらつき)を求める場合・・・STDEVP関数を使 用 ②母集団(まだ説明していない、たくさんのデータの集まり)から、データを抜取り、母集団 の標準偏差(ばらつき)を推定する場合・・・・STDEV関数を使用する (1)データの性質・・・ヒストグラムを思い出そう a)データは、平均値の周りにばらつく b)ばらつきのないデータは存在しない c)このことを、「データは分布する」という d)データは、どのようにばらつくかは分布の状態に現れる (2)この分布のあり方(分布の状態)には、いろいろある・・・・・統計学 それぞれ分布の形に特徴がある。 ・正規分布・・・・NORMDIST(値,平均値,標準偏差,関数形式) ・二項分布・・・・BINOMDIST(値,サンプル数,不良率,関数形式) ・ポアソン分布・・POISSON(値,イベント数,平均,関数形式) ・t分布 ⇒T分布表 ・F分布 ⇒F分布表 ・ 2 x (カイ二乗)分布・・・CHISQ.DST(値,自由度,関数形式) ・一様分布 など (3)先週作成したヒストグラムは縦棒が6本であった。 これはデータの数が50個くらいだったことにある。

品質管理でよく使われる

検定をするときに使用する

(2)

2 (3)データ数が沢山あると、データ区間は細かくとることができるので、縦棒の本数 は多くなり、1本の曲線で表すことができる。 (4)ヒストグラムがデータの分布を表しているように、1本の曲線もデータの分布を 表している。 (5)先週のテキストP37に示す正規分布がその代表的な分布曲線である。 (正確には「確率分布」という) 0 2 4 6 8 10 12 14 16 18 93 96 99 102 105 108 次の級 頻 度 データ区間

ヒストグラム

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 90 92 94 96 98 100 102 104 106 108 110

μ

(3)

3 正規分布(P32)の性質 a)データは平均を中心にばらつく。これを「データは分布する」という。 ばらつきは分布の形で表される。分布の形として、統計学では、正規分布、二項分布、ポ アソン分布、t分布、F分布、χ2(カイ二乗)分布、一様分布をあげている。 b)正規分布のことをX:N(μ,σ2)と書く ここで、μ:平均,σ:標準偏差のこと c)f(x)= 2 ) ( 2 1 2 1 − xσ−µ e σ π ・・・・変数としてμとσがあり、データが変わると形が変わる 正規分布は平均がμで標準偏差がσで左右対称の釣鐘型をした分布形態であるが、正 規分布の公式は、μとσの値によって形が変わるので、扱いにくい。 d)そこで「標準化」が行われる。 U= σ µ − x とおくと f(U)= π 2 1 e 2 2 1 u − となり、μ=0、σ=1となる。・・・・データがどんなに変わろうとも不変。 (1)正規分布の特徴は、平均(μ)が中央にあって左右対称で、 すらっとした美しい形(釣鐘型という)をしている データのばらつきは標準偏差(σ)で示される。 また、平均値と中央値と最頻値が同じという特徴もある。 (2)平均値(μ)を境にして右側、左側それぞれ50%である これは前回の宿題で正規確率紙の50%のところの値を読み取ったことを 意味している。正規確率紙の50%のところの値を読みとると平均値(μ)が求め られることを、正規確率紙を使って勉強した。 (3)標準偏差(σ)を求めるために、正規確率紙の15.9%の値と50%の値の差 で求めた。 (4)学生100人について身長を測定したところ、平均値(μ)=168.1 標準偏差(σ)=6.95 の正規分布となることがわかったとします。 このことは、N(168.1,6.952 )と記述する。 NはNormal Distributionの略 このことをグラフに書くと以下のようになる。

(4)

4 15.9%は、点Aの外側の割合である。 点Aと平均μの間は標準偏差σを示している。 つまり、 A=μ―σ =168.1-6.95 =161.1 B=μ+σ =168.1+6.95 =175.0 68%の人は、161cm~175cmの間にあることを意味している。 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 140 145 150 155 160 165 170 175 180 185 190 195 200

f(x)

68.2%

σ=6.95

15.9%

15.9%

A B μ=168.1

(5)

5 1.3.4 二項分布(P.40) ・ベルヌーイトライアル(ベルヌーイ試行) コインの裏と表,良品と不良品,製品の合格と不合格, ・n回試行して、x回どちらか一方の事象が起きた確率は二項分布となる ・二項確率紙を後程取り上げるが、二項分布を前提としている ・EXCELの関数で、BINOMDIST(不良件数,サンプル数,不良率,関数形式) 例題7,例題8(P41) 1.3.5 ポアソン分布(P.42) ・ポアソン分布は二項確率紙の仲間である ・きわめてまれにしか発生しない場合をポアソン分布という ・EXCELの関数では、POISSON(イベント数,平均,関数形式) 例題9,例題10(P43) 1.3.6 母集団,標本および母平均の推定(P.44) a)母集団(有限母集団と無限母集団) 実務の世界では、製品のロットのことを母集団という。このロットの大きさは 1000 個くらいで ある。 b)標本(サンプル) コット全部を検査できないから、この中から 20 個とか 30 個抜き取って、知らべたり、検査す る(抜取検査という)。 検査したときには良品と不良品しかないから二項分布が当てはまる。 この抜き取ったものを「標本」とか「サンプル」という。 母集団 c)母平均(区間平均) 母集団全体の状況(特性値)を「母平均」という。母平均は標本の平均、標本のばらつき (標本の標準偏差)を基に計算できる(P45、表1.1) d)母不良率

サンプル(標本)

不良率

(6)

6 ・標本を検査して、良品と不良品に分ける(抜取検査)ことを実務で実施する ・二項確率紙を使うと、母集団に含まれる不良の割合が容易に求められる ・母集団に含まれている不良の割合のことを「母不良率」という ・「母不良率」の大きさによって、母集団(ロット)の合格または不合格を判定する 1.3.7 統計量の性質(P.46) a)統計量(データ)は、母集団の平均を中心にばらつく このことを「分布する」という b)したがって、母集団から抜き取った標本(サンプル)の値(観測値)は、抜取る度に変化す る すなわち、「変数」である c)この変数を「確率変数」という b)母集団から抜き取った標本(サンプル)の平均=標本平均という。 標本のばらつきを、標本分散とか標本標準偏差という。 標本平均、標本分散、標本標準偏差のことを標本統計量(単に、統計量)という 1.3.8 統計的有意性(P.47) a)有意・・・非常にわかりにくい言葉である 統計学には、「よく起きる事象」と、「めったに起きない事象」がある 例:学生100人の身長を測定したとき、161cm~175cmくらいの人はたくさんいるが 147cm以下の人、189cm以上の人はめったにいない。 どれくらいいるかとういうと、それぞれ2.5%(100人の中で2~3人) 「めったに起きない事象」のことを「有意」という ・「めったに起きないほど大きい」ことを 「有意に大きい」という ・「めったに起きないほど小さい」ことを 「有意に小さい」という b)正規分布を例にとると 変数値(観測値)が極端に大きい確率は非常に小さい 変数値(観測値)が極端に小さい確率は非常に小さい 変数Xが正規分布をして、平均がμ、標準偏差がσであるとき

X:N(μ,σ

2

と書く。ここで、N:Normal distribution(正規分布)のこと 平均身長が、168.1cm、標準偏差が10cmの場合には

X:N(168.1,10

2

と書く

(7)

7 身長が、170cm、160cmの人はたくさんいる。このことを「普通によく起きる確率」という。 または、「有意でないことが起きる確率」ともいう。これを「信頼係数」という。 147cm~189cmの間のことを「信頼区間」という 「めったに起きないことが起きる確率」のことを「有意水準」という 「めったに起きないこと」とは、身長が188.95cm以上の人、または147.25cm以下の人のこ とをいう。 通常、有意水準は5%を使用する。つまり信頼係数は95%となる。 また、有意水準には、片側と両側がある。通常は有意に小さい場合、有意に大きい場合の両方 があるので、「両側有意水準」を使う。 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 140 145 150 155 160 165 170 175 180 185 190 195 200

f(x)

σ:6.95cm 信頼係数:95% 平均=168.1 188.95 147.25 信頼区間 147.1cm以下の身長は 「有意に小さい」 その割合は2.5% 188.95cm以上の身長は 「有意に大きい」 その割合は2.5%

(8)

8 1.3.9 数値の丸め(P.47)・・・・・省略 ・小数点以下だらだら記述しないこと ・テキストP48にいろいろ書いてあるが ・通常は、小数点以下1桁くらいでよい(小数点以下第2位を四捨五入する) ・これを「丸め」という。

参照

関連したドキュメント

 医薬品医療機器等法(以下「法」という。)第 14 条第1項に規定する医薬品

平均車齢(軽自動車を除く)とは、令和3年3月末現在において、わが国でナン バープレートを付けている自動車が初度登録 (注1)

目標を、子どもと教師のオリエンテーションでいくつかの文節に分け」、学習課題としている。例

平均的な消費者像の概念について、 欧州裁判所 ( EuGH ) は、 「平均的に情報を得た、 注意力と理解力を有する平均的な消費者 ( durchschnittlich informierter,

さらに, 会計監査人が独立の立場を保持し, かつ, 適正な監査を実施してい るかを監視及び検証するとともに,

基準の電力は,原則として次のいずれかを基準として決定するも

この点について結果︵法益︶標準説は一致した見解を示している︒

スペイン中高年女性の平均時間は 8.4 時間(標準偏差 0.7)、イタリア中高年女性は 8.3 時間(標準偏差