拡張不確かさを算出しよう 拡張不確かさを算出しよう
包含係数 k を“ 95 % ”になるようにちゃんと計算する
べきという意見がある。“ 95 % ”の意味するところは t
分布の区間推定説明したが、実際の不確かさ評価
においては単純な t 分布で済みそうな話はほとんど
ない。それではどのように計算されるのであろうか ?
その計算ために用いられているのはかなり大胆な近
似法ー Welch-Satterthwaite 近似である。
有効自由度を用いた区間推定
ある液体の体積
v
を、5
回反復測定し、測定 データ{100.0, 100.3, 99.9, 99.7, 100.1 cm 3 }
を得た。この体積計は校正を受け、そのずれは調整 されている。校正値
v 0
の95 %
信頼区間は±
0.88 cm 3
であり、信頼区間は自由度11
のt
分布から求められた。この液体の体積が、
5
回反復の平均から100.0 cm 3
と報告されるとき、その95 %
信W elch -S atterthwaite 近似による区間推定
W elch -S atterthwaite 近似による区間推定
W elch -S atterthwaite 近似による区間推定 W elch -S atterthwaite 近似による区間推定
3
1
2 0 . 1 000 cm 1
1 1
1
n
k
k
k v v
n v n
n s v
s v
u
体積測定の平均値の不確かさは、
0 3 0 . 040 cm 3
20 . 2
cm 088
. 0
% 5
11
自由度 のt
分布 点の大きさv U u
体積計の校正値
v 0
の不確かさは、不確かさ要因は繰返しと温度の不確かさのみである。 2
つの要因の標準不確かさを以下のように求める。
W elch -S atterthwaite 近似による区間推定 W elch -S atterthwaite 近似による区間推定
なお、体積の平均値
— v
も校正値v 0
も体積測定への感度は1
である。体積の標準不確かさは
3
3 2 3 2
0 2 2
2 2
cm 0.1077
cm 0.04
cm 1000
. 0
0
c u v c u v v
u v v
これも実験分散である。しかし、単独の正規分布から取られ た値ではないので、
t
分布と直接関連づけることはできない。これを克服するために、近似的に関連づけようとするのが、
Welch-Satterthwaite
近似である。Welch-Satterthwaite の近似
独立な
m
個の不確かさ成分u 1 (y)
、u 2 (y)
、…
、u m (y)
があり、そ れぞれの自由度( =
実験回数– 1)
を 1
、 2
、… 、 m
とすると、測定結果
(y, u c (y))
は以下の式で計算される自由度 eff
のt
分布 に近似できる。
m 4
2 4 2 1
4 1 eff
4
y u
y u
y u
y
u c m
この
eff
を有効自由度と呼ぶ。感度係数
c 1
、…
、c m
を用いて
m
i i
i i
c y c u x
u
1 4 4
eff 4
とも書ける。有効自由度
有効自由度
W elch -S atterthwaite 近似による区間推定 W elch -S atterthwaite 近似による区間推定
例に当てはめると、
11 cm 0.04 1
5
cm 1000 .
0 cm
077 1
.
0 3 4 3 4
eff
3 4
33 .
eff 5
−2.52 95 % 2.52
数式の上では、自由度が整数でない
t
分布も生成可能である。この図は 自由度5.33のt
分布。非整数の eff
が 定義の上で、おかしいと思うなら、自 由度5
のt
分布を用いてもよいだろう。仮説① = 「本当の体積は 99.75 cm 3 である。」
仮説② = 「本当の体積は 100.25 cm 3 である。 」
95 % 信頼区間の幅は± 2.52 × u(v) ~ 0.25 cm 3
両方が有意水準 5 % で棄却され、 95 % 信頼区 間は「 99.75 cm 3 から 100.25 cm 3 」で与えられ る!
W elch -S atterthwaite 近似による区間推定
W elch -S atterthwaite 近似による区間推定
W elch -S atterthwaite 近似の背景 W elch -S atterthwaite 近似の背景
Welch-Satterthwaite 近似の背景には実験分散は先の 正規分布から得られた不偏分散の分布に従うと「近似」
することにある。さて、分散の分布の分散を考えると、
u 2 (s 2 ) = 2 4 / で与えられるから、
y u y u y
u c 2 1 2 2 2
y ~ u c (y)
、 1 ~ u 1 (y)…
2 4 2 1
4 1 4
2 2
2
y
両辺の分散を取る。
2 4 2 1
4 1 4
c
y u
y u
y
u
自由度 = 実験回数 – 1
の定義は不十分で、もっと複雑な検討が必要である。また、
B
タイ プの標準不確かさに対応できていないのは明らかである。その妥 当性はともかく、実用上は、Welch-Satterthwaite
を用いるために、以下の自由度の決定方法を用いる場合がほとんどである。
A
タイプ評価した不確かさの場合B
タイプ評価で校正証明書に有効自由度の記載がある場合 自由度=
実験回数– 1
自由度
=
校正証明書に記載の有効自由度B
タイプ評価でそれ以外の場合 自由度= ∞
(無限大)回帰で求めたパラメータなど ではこうではないが、多くの場 合はこれで問題ない。
他の方法もある。
(GUM
付属 書G.4.2) 次ページ自由度
自由度
もしも、 B タイプで評価された不確かさの成分が正規分 布に従うならば、自由度 B に対して、 u 2 (s 2 ) = 2 4 / B が 成立することから以下のように定めることもある。
自由度 自由度
2
B 2
1
x u u
x
u
標準偏差
s
について考えると、モデル式s = (s 2 ) 1/2
から、
B 2 1 4
2 2
2 2
2 2 2 1 2
2
~ 1 2
4 1
s
s s
s u d
s s d
u
もちろん、元が正規分布でないときにはなんの根拠もないし、標準不確か つまり、標準不確か さが標準的にどのく らい不確かかという 値を入れる。
拡張不確かさ 拡張不確かさ
0
0 4 0 4
eff 4
y u u v
u
v v
c
4 4
eff
2 4
2 0 . 05774
4 1 . 0 05774
. 0 1
. 0
eff ~ 7.11
で、包含係数k = t U (7.11, 0.95) = 2.36
として、 2 . 36 0 . 1155 cm 3 0 . 27 cm 3
ku v
U c
例 ある液体の体積
v
を、5
回反復測定し、測定データ{100.0,
100.3, 99.9, 99.7, 100.1 cm 3 }
を得た。この体積計の表示の誤差 は0.1 cm 3
を超えないと知られている。この液体の体積が、5
回反 復の平均から100.0 cm 3
と報告されるとき、95 %
信頼区間を求 めよ。表示の標準不確かさ
0.1/√3 = 0.05774 cm 3
の自由度を v 0
= ∞(
無限大)
として、Welch-Satterthwaite 近似は複数の不確かさ要 因がある場合に用いることができる近似的な区 間推定方法である。
実験分散は正規分布からの不偏分散の分布と は直接関係ないので、数学的根拠は不十分だ が、慎重な判断をしたいときには、よく使われて いる方法である。
個人的には、正規分布とみなして、有意水準を小さくすることで信頼区間を大 きくする方が、同じように慎重な判断をするのにも、理論的な整合性は高いよう に思う。特に「この範囲に真の値が入っていないと即クレームがつく」というよう
拡張不確かさのまとめ
拡張不確かさのまとめ
おわりに
この資料では、「 95 % 信頼区間とは何か?」と「有効 自由度とは何か?」に力を割いて説明した。ともにわ かりにくい概念の上に立ち、しかも有効自由度はそ の根拠が曖昧なものであるとは言えるが、その性質 をよく理解すれば、特にどの試験を何回実験したら、
望む精度が得られるのか ? という検討においては、実 用上役に立つ指標であろう。
おわりに
おわりに
参考資料
(Excel での計算方法、分布表 )
Excel で検定 Excel で検定
t
分布のパーセント点は以下の式で求めることができる。= TINV(両側パーセント, 自由度)
例えば、自由度9のt
分布の上側95 %信頼区間は、= TINV(0.10, 9) = 1.83
から求めることができる。
また、TINV関数は非整数の自由度には使えないので、Welch-Satterthwaite近似を用いた場合には、以下の式を使うことがある。
= SQRT(自由度/BETAINV(両側パーセント,自由度/2,1/2)-自由度)
正規分布のパーセント点は以下の式で求めることができる。= NORMINV(
下側パーセント,
平均,
標準偏差)
正規分布表 正規分布表
0 1 2 3 4 5 6 7 8 9
0.001 3.0902 3.0618 3.0357 3.0115 2.9889 2.9677 2.9478 2.929 2.9112 2.8943 0.002 2.8782 2.8627 2.848 2.8338 2.8202 2.807 2.7944 2.7822 2.7703 2.7589 0.003 2.7478 2.737 2.7266 2.7164 2.7065 2.6968 2.6874 2.6783 2.6693 2.6606 0.004 2.6521 2.6437 2.6356 2.6276 2.6197 2.6121 2.6045 2.5972 2.5899 2.5828 0.005 2.5758 2.569 2.5622 2.5556 2.5491 2.5427 2.5364 2.5302 2.5241 2.5181 0.006 2.5121 2.5063 2.5006 2.4949 2.4893 2.4838 2.4783 2.473 2.4677 2.4624 0.007 2.4573 2.4522 2.4471 2.4422 2.4372 2.4324 2.4276 2.4228 2.4181 2.4135 0.008 2.4089 2.4044 2.3999 2.3954 2.3911 2.3867 2.3824 2.3781 2.3739 2.3698 0.009 2.3656 2.3615 2.3575 2.3535 2.3495 2.3455 2.3416 2.3378 2.3339 2.3301 0.01 2.3263 2.2904 2.2571 2.2262 2.1973 2.1701 2.1444 2.1201 2.0969 2.0749 0.02 2.0537 2.0335 2.0141 1.9954 1.9774 1.96 1.9431 1.9268 1.911 1.8957 0.03 1.8808 1.8663 1.8522 1.8384 1.825 1.8119 1.7991 1.7866 1.7744 1.7624 0.04 1.7507 1.7392 1.7279 1.7169 1.706 1.6954 1.6849 1.6747 1.6646 1.6546 0.05 1.6449 1.6352 1.6258 1.6164 1.6072 1.5982 1.5893 1.5805 1.5718 1.5632 0.06 1.5548 1.5464 1.5382 1.5301 1.522 1.5141 1.5063 1.4985 1.4909 1.4833 0.07 1.4758 1.4684 1.4611 1.4538 1.4466 1.4395 1.4325 1.4255 1.4187 1.4118 0.08 1.4051 1.3984 1.3917 1.3852 1.3787 1.3722 1.3658 1.3595 1.3532 1.3469 0.09 1.3408 1.3346 1.3285 1.3225 1.3165 1.3106 1.3047 1.2988 1.293 1.2873 0.1 1.2816 1.2265 1.175 1.1264 1.0803 1.0364 0.9945 0.9542 0.9154 0.8779 0.2 0.8416 0.8064 0.7722 0.7388 0.7063 0.6745 0.6433 0.6128 0.5828 0.5534 0.3 0.5244 0.4959 0.4677 0.4399 0.4125 0.3853 0.3585 0.3319 0.3055 0.2793 0.4 0.2533 0.2275 0.2019 0.1764 0.151 0.1257 0.1004 0.0753 0.0502 0.0251
0.5 0
確 率 p の 最 終 桁 の 前 ま で
確率pの最終桁
0 1 2 3 4 5 6 7 8 9
0.001 3.2905 3.2636 3.2389 3.216 3.1947 3.1747 3.1559 3.1382 3.1214 3.1054 0.002 3.0902 3.0757 3.0618 3.0485 3.0357 3.0233 3.0115 3 2.9889 2.9781 0.003 2.9677 2.9576 2.9478 2.9383 2.929 2.92 2.9112 2.9027 2.8943 2.8861 0.004 2.8782 2.8704 2.8627 2.8553 2.848 2.8408 2.8338 2.8269 2.8202 2.8135 0.005 2.807 2.8006 2.7944 2.7882 2.7822 2.7762 2.7703 2.7646 2.7589 2.7533 0.006 2.7478 2.7424 2.737 2.7317 2.7266 2.7214 2.7164 2.7114 2.7065 2.7016 0.007 2.6968 2.6921 2.6874 2.6828 2.6783 2.6738 2.6693 2.6649 2.6606 2.6563 0.008 2.6521 2.6479 2.6437 2.6396 2.6356 2.6315 2.6276 2.6236 2.6197 2.6159 0.009 2.6121 2.6083 2.6045 2.6008 2.5972 2.5935 2.5899 2.5863 2.5828 2.5793 0.01 2.5758 2.5427 2.5121 2.4838 2.4573 2.4324 2.4089 2.3867 2.3656 2.3455 0.02 2.3263 2.308 2.2904 2.2734 2.2571 2.2414 2.2262 2.2115 2.1973 2.1835 0.03 2.1701 2.1571 2.1444 2.1321 2.1201 2.1084 2.0969 2.0858 2.0749 2.0642 0.04 2.0537 2.0435 2.0335 2.0237 2.0141 2.0047 1.9954 1.9863 1.9774 1.9686 0.05 1.96 1.9515 1.9431 1.9349 1.9268 1.9189 1.911 1.9033 1.8957 1.8882 0.06 1.8808 1.8735 1.8663 1.8592 1.8522 1.8453 1.8384 1.8317 1.825 1.8184 0.07 1.8119 1.8055 1.7991 1.7928 1.7866 1.7805 1.7744 1.7684 1.7624 1.7565 0.08 1.7507 1.7449 1.7392 1.7335 1.7279 1.7224 1.7169 1.7114 1.706 1.7007 0.09 1.6954 1.6901 1.6849 1.6798 1.6747 1.6696 1.6646 1.6596 1.6546 1.6497 0.1 1.6449 1.5982 1.5548 1.5141 1.4758 1.4395 1.4051 1.3722 1.3408 1.3106 0.2 1.2816 1.2536 1.2265 1.2004 1.175 1.1503 1.1264 1.1031 1.0803 1.0581 0.3 1.0364 1.0152 0.9945 0.9741 0.9542 0.9346 0.9154 0.8965 0.8779 0.8596 0.4 0.8416 0.8239 0.8064 0.7892 0.7722 0.7554 0.7388 0.7225 0.7063 0.6903 0.5 0.6745 0.6588 0.6433 0.628 0.6128 0.5978 0.5828 0.5681 0.5534 0.5388
確率pの最終桁
確 率 p の 最 終 桁 の 前 ま で
両側パーセント点 片側(上側)パーセント点