母集団と標本

(1)

3. 標本の整理 この章では母集団と標本の関係について述べる。数学的取り扱いの基礎である単純無作為抽出を議論する。標本の整理に関しては、度数分布表、分割表、ヒストグラム、度数分布多角形を取り扱う。医学などでの標本の取り方を簡単にまとめる。 3.1. 母集団と標本 多くの研究では収集されたデータそのものより、そのデータが抽出されたより大きな集団について興味を持っている。その集団を母集団(population)という。いま、100 人の学生を対象にして、体格検査をしたとき、種々の属性に関する結果の集合を標本(sample)あるいはデータ(data)といい、標本は学生全体の母集団がもつ特徴や傾向を表す。上の例での観察単位(observational unit)は学生個人であるが、動物、植物あるいは細胞組織が観察単位になることもある。標本は母集団についての情報を得るための母集団の部分集合と定義できる。医学の研究では、健常者を用いて新薬の副作用を検討する研究（第一相臨床試験）や広く特定疾患の患者を対象として新薬効果を検討する研究（第三相臨床試験）などが行われる。この場合の母集団は調査された期間および機関での健常者や患者であり、標本はそれら母集団の特徴を知るためのものである。このような研究では、母集団に関しての情報解析だけでなく、実際に新薬や治療法を適用すべき患者に関しての効果を期待している。この仮想の患者群は解析対象の母集団とは異なり、標的母集団(target population)と呼ばれる。従って、母集団とは標本を抽出し、標本がその部分集合であり、かつ実際に研究する集団である。一方、標的母集団は我々が研究結果を適用したいと思う集団である。上の第一相臨床試験では、試験を行う製薬会社や大学の健常者がボランティアで参加する場合が多く、母集団はその会社や大学内の健常者集合で、標的母集団は一般の健常者集団である。母集団に関する研究を行うために標本を用いる理由は、研究の実行可能性が大きな理由である。母集団全員を調べられれば良いが、母集団が非常に大きな場合、全数調査(census) は費用や時間の面から容易に実行できない。例えば、国勢調査では膨大な調査員と実行に際しての費用が必要である。また、調査員の事前打ち合わせ、さらに調査対象の全員から回答を得ることの難しさがある。回答拒否や訪問調査が出来ない個人がいることも考えられ、その結果は調査の精度を劣化させる原因である。標本調査は母集団の一部を用いるために、欠測が出来るだけないような調査の実施が比較的に容易である。標本に基づいて母集団に関する推測を行うが、その際の推測の精度を考慮した研究報告や意思決定を行う必要がある。 3.2. 標本抽出法と乱数

標本抽出は単純無作為抽出(simple random sampling)が基本である。単純無作為抽出は次の 2 つの条件を満たす抽出方法である。

(1)母集団内の全ての個体が等しい確率で抽出されること、 (2)ある個体の抽出が他の個体の抽出確率に影響を与えないこと

(2)

例えば、1 から 6 の自然数を書いた札を容器に入れ、その中から札を 3 回抜き取る試行を考える。サイコロを 3 回振って、出た目の札を取り出し、その度に札を容器に戻す試行（復元抽出）を行えば、この標本抽出法は単純無作為標本抽出法である。この場合は同じ札が複数回抽出される可能性がる。しかし、札を抜き取った後で、容器に戻さずに 3 回抽出する場合（非復元抽出）は条件(1)を満たすが、(2)が成立しないので、無作為抽出であるが単純無作為抽出法にならない。すなわち、1 回目の抽出では、任意の札が 1/6 で抽出されるが、 2 回目と 3 回目はそれぞれ残りの札が 1/5 と 1/4 で抽出されるからである（条件付き確率）。しかし、全ての札は同じ確率 1/6 で抽出されている(1)。この例では母集団は 1 から 6 の自然数を書いた 6 枚の札である。ここで、母集団が大きい場合、例えば地域 A の成人の集合の場合は非復元抽出による無作為抽出は単純無作為抽出の近似的方法になる。単純無作為抽出を用いる利点は、多くの数理統計学的な方法がこの標本抽出を前提に置いていて、母集団に関する推論を行うためには標本抽出が重要になる。次の表は 12 歳の男子の身長データである。このデータを母集団として 10 人を単純無作為抽出する。エクセルを用いて単純無作為抽出するために A 列と B 列にそれぞれ、関数 =ROUNDUP(12*RAND(),0) (A1,A2,…,A10) =ROUNDUP(10*RAND(),0) (B1,B2,…,B10) を設定する。関数 ROUNDUP(x,n)は実数 x を切り上げて小数第 n 位に表す関数である。この 操作で (9,9), (6,5), (7,9), (5,7), (6,5), (4,9), (12,8), (6,6), (8,10), (4,6) を得る。この自然数の組に対応する数値を表 3.1 から抽出すると 136.2, 152.7, 139.5, 140.2, 152.7, 136.2, 133.1, 148.1, 144.7, 134.7 になる。この標本は 10 人分のもので、標本サイズ(sample size)は 10 である。この集合が標本であり、対象の母集団に関する情報を含んでいるが、偶然に変動するものである。このことを十分理解して、統計解析後の解釈を行う必要がある。表 3.1 を母集団としたときの母平均(population mean)は 139.5cm である。上の方法を用いて標本の大きさ 10 の標本抽出を行い、その標本平均をグラフにした（図 3.1）。母平均を標本平均で推定する場合の変動の大きさが視覚的に理解される。実際のデータ解析では母数の推定値とその変動の大きさを示す指標（標準誤差）を合わせて、結論をまとめる必要がある。

(3)

図 3.1. 標本平均の変動問 3.1. 表 3.1 から標本サイズ 5 の標本を 10 回抽出し、その標本平均の変動を図 2.1 のようにまとめよ。表 3.1. 身長データ 1 2 3 4 5 6 7 8 9 10 1 128.1 144.4 150.3 146.2 140.6 139.7 134.1 124.3 147.9 143.0 2 143.1 142.7 126.0 125.6 127.7 154.7 142.7 141.2 133.4 131.0 3 125.4 130.3 146.3 146.8 142.7 137.6 136.9 122.7 131.8 147.7 4 135.8 134.8 139.1 139.0 132.3 134.7 138.4 136.6 136.2 141.6 5 141.0 138.4 145.1 141.4 139.9 140.6 140.2 131.0 150.4 142.7 6 144.3 136.4 134.5 132.3 152.7 148.1 139.6 138.9 136.1 135.9 7 140.3 137.3 134.6 145.2 128.2 135.9 140.2 136.6 139.5 135.7 8 139.8 129.1 141.4 139.7 136.2 138.4 138.1 132.9 142.9 144.7 9 138.8 138.3 135.3 140.6 142.2 152.1 142.4 142.7 136.2 135.0 10 154.3 147.9 141.3 143.8 138.1 139.7 127.4 146.0 155.8 141.2 11 146.4 139.4 140.8 127.7 150.7 160.3 148.5 143.5 138.9 123.1 12 126.0 150.0 143.7 156.9 133.1 142.8 136.8 133.1 144.5 142.4 次にトランプ(52 枚)からカードをスペード、クラブ、ダイヤ、ハートそれぞれから 3 枚ずつ単純無作為抽出する。A, B, C, D 列の 1, 2, 3 行にそれぞれ

標本平均の変動

130 132 134 136 138 140 142 144 146 1 2 3 4 5 6 7 8 9 10

実験回数

身長

母集団平均標本平均

(4)

=ROUNDUP(13*RAND(),0) (A1,A2,A3) =ROUNDUP(13*RAND(),0) (B1,B2,B3) =ROUNDUP(13*RAND(),0) (C1,C2,C3) =ROUNDUP(13*RAND(),0) (D1,D2,D3) を入れて乱数を発生させた。結果はスペード: 8, 10, 5; クラブ: 13, 12, 8; ダイヤ: 6, 4, 4; ハート: 7, 13, 5 であった。この場合は、カードの種類毎に単純無作為標本抽出であり、このような抽出法を層別標本抽出(stratified sampling method)という。特定の属性（男女）の誤差を排除し、層間の比較をする場合は適している。また、属性のカテゴリに対する部分母集団の大きさに大きな差がある場合は良い方法である。例えば、工学部の学生では男女の比率に著しい差がある。このとき、工学部の学生に対して標本抽出を行うと、女子学生は殆ど標本に入らない可能性がある。 3.3. 度数分布表とヒストグラム 母集団からのデータそのものでは、データの概要が把握できないので、その様相を視覚的に捕らえやすい表や図が作成される。データを整理する場合に、最初に範囲(range) R = データの最大値 ― 最小値 (3.1) を考える。表 3.1 では、R = 160.3−122.7 = 37.6 である。この範囲を参考にして、データを幾 つかの階級（クラス, class）に分けて、その度数(frequency)を集計した表を度数分布表 (frequency table)という。階級の数については、標本の大きさ n により、

n

を参考にして決定すると良いと思われる。この場合は

120 

10 .

9

であるので、階級数を 10 として度数分布表を作成する。

4

120

6 .

37 



n

R

として、122.0cm から 4cm 幅で階級を構成する。階級に入る度数をまとめた表を度数分布表（表 3.2）という。第 5 列は度数を総度数 120 で割ったもので、これを相対度数という。階級の中央値を階級値という。各階級値に度数を対応させて描いた図を度数分布多角形（図 3.2）いう。この図より分布の形状が視覚的に捉えられる。また、階級を底辺に、度数を高さにした長方形で度数分布を表したものをヒストグラムという（図 3.3）。

(5)

度数分布多角形 0 5 10 15 20 25 30 35 116 126 136 146 156 166 身長度数表 3.2. 身長データの度数分布表階級番号階級階級値度数相対度数 1 [122.0,126.0) 124.0 5 0.04 2 [126.0,130.0) 128.0 8 0.07 3 [130.0,134.0) 132.0 10 0.08 4 [134.0,138.0) 136.0 22 0.18 5 [138.0,142.0) 140.0 33 0.28 6 [142.0,146.0) 144.0 20 0.17 7 [146.0,150.0) 148.0 11 0.09 8 [150.0,154.0) 152.0 6 0.05 9 [154.0,158.0) 156.0 4 0.03 10 [158.0,162.0) 160.0 1 0.01 合計 120 1.00 図 3.2. 度数分布多角形

(6)

30 20 10 122 126 130 134 138 142 146 150 154 158 162 (cm) 身長図 3.3. ヒストグラム問 3.2. 次のデータは医学科学生に実施したある科目の試験結果である。このデータから度数分布表とヒストグラムを作成せよ。表 3.3. ある教科の試験結果 75 84 64 75 90 90 54 53 75 43 21 78 75 61 68 98 80 73 42 74 61 84 51 68 71 81 55 64 70 30 42 65 43 88 64 63 35 70 45 95 61 83 60 72 60 85 90 71 61 65 33 75 82 65 52 73 77 61 65 81 65 58 45 72 45 65 77 63 85 65 78 43 76 82 60 55 84 92 45 85 73 85 74 63 72 85 76 85 67 3.4. 統計量 統計調査および実験では母集団に関する情報を標本として得て、母集団に関する推論をすることが目的で、その推論結果は判断、意志及び行動決定に利用される。母集団分布の特徴を示す量を母数(parameter)といい、統計的推論はその母数に関する推論である。例えば、変量の平均、分散および共分散などは母数である。調査は母集団からの無作為標本を用いて行うのが基本である。また、実験では条件を管理した人工の母集団が解析の対象で、独立な実験の反復によりデータが得られる。調査および実験ではその目的が十分反映される複数の観測項目の設定が重要であり、観測での欠測値が出来るだけ尐なくなるような配慮が必要である。例えば、質問紙で項目が多過ぎる場合は回答者の負担が大変であり、欠測値や故意に不正確な回答をする場合が考えられる。従って、質問項目は簡明で、回答者の

(7)

負担を考えて、調査の目的に絞る必要がある。母集団から標本（データ）を得た場合の最初の過程は、度数分布表、分割表、ヒストグラムおよび相関図などの表や図を用いて標本を要約することである。この段階は標本の様相を視覚的に把握するために有益で、詳細な統計解析のための準備である。次の過程では基本的ないくつかの数量を用いて、標本の情報を縮約する手順をとる。 定義 3.1. 標本 X1, X2,…,Xn に対して、その関数 h(X1, X2,…,Xn)を統計量(statistic)という。こ の場合の標本 Xiはベクトルの場合も含む。次に基本的な統計量を挙げる。 (i) 標本平均 標本 X1, X2,…,Xn に対して、





n i i

X

n

X

1

(3.2) を標本平均(sample mean)という。 (ii) 標本分散(sample variane) (i)の標本と標本平均に対して













n i i

X

n

S

1 2 2

1

(3.3) を標本分散という。この統計量は









n i i

X

n

S

1 2 2 2

1

と変形できる。標本分散の正の平方根 S は標本標準偏差である。 (iii) 不偏分散(unbiased sample variance)

(i)の標本と標本平均に対して













n i i

X

n

U

1 2 2

1

(3.4) を不偏分散という。本によっては、この統計量を標本分散とするものもある。U2 _{と S}2 _の関係は 2 2

1 S

n

U





であり、標本数が大きいときは、両者は近似的に等しい。 (iv) 標本共分散 標本(X1,Y1),(X2,Y2),…,(Xn,Yn)に対して、















n i i i XY

X

Y

n

S

1

(3.5) または















n i i i XY

X

Y

n

U

1

(3.6)

(8)

800 1000 850 900 950 1000 1050 胸囲座高相関図 (x,y) を標本共分散という。標本共分散は標本分散の拡張であり、その行列 S =

_











YY YX XY XX

S

を標本分散共分散行列という。この多次元への拡張は容易である。 (v) 標本相関係数 (iv)の共分散行列に対して YY XX XY

S

r



(3.7) を標本相関係数という。この統計量は n 次元ベクトル(X1- X ___ ,X2 - X ___ ,…,Xn - X ___ )と(Y1- Y ___ ,Y2 -Y ___ ,…,Yn - Y ___ )の余弦としての意味をもつ。この統計量は −1 ≦ r ≦ 1 を満たし、等号成立は上の 2 つのベクトルが平行関係をもつときのみである。例 3.1. 次のデータの基本的統計量を求める。 表 3.4. 学生の座高 X と胸囲 Y 学生番号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 X 925 963 925 888 896 943 907 948 955 890 878 912 908 910 977 921 926 895 914 1008 Y 810 936 850 861 953 911 794 844 840 877 856 905 820 853 919 877 855 811 871 978 図 3.4. 座高 X と胸囲 Y の相関図

(9)

表 3.2 のデータを平面の打点した相関図が図 3.4 である。座高 X と胸囲 Y の相関性が視角的 に理解される。基本的な統計量は表 3.5 に与えた。論文や報告書では表 3.3 のデータの代わりに、データの概要が理解できるように表 3.5 のように要約統計量を示す場合が多い。表 3.5. データの要約統計量標本平均標本分散標本標準偏差 X 924.450 1077.524 32.826 標本相関係数 Y 871.050 2442.997 49.427 0.498 (vi) 標本メジアン（中央値） 標本{x1,x2,…,xn}を大きさの順に並べたものを x(1) ≤ x(2) ≤…≤ x(n) とする。このとき、メジアン =

 













_ 

)

(

2 )

(

1 2 2 2 1

は偶数

は奇数

n

x

n

x

n n n である。例えば標本 5, 2, 7, 5, 3, 2, 6 を大きさの順に並べると 2, 2, 3, 5, 5, 6, 7 であるから、4 番目の 5 がメジアンである。標本が 1, 5, 2, 7, 5, 3, 2, 6 のときは、4 番目が 3 で 5 番目が 5 であるから、メジアンは

4

2

5

3 

_

となる。平均とメジアンは分布の位置を表す母数である。複数の分布あるいは母集団の位置を比較する場合にはこれらが用いられる。表 3.5 はある高校での A と B クラスの数学の試験結果である。このデータの標本数は共に 45 であるので、メジアンは小さい方から 23 番目の標本値である。したがって、A と B のメジアンはそれぞれ 43 と 39 となる。また、それぞれの標本平均は 44.4 と 39.6 である。メジアンと標本平均はほぼ同じ値であり、このことから、クラス A の生徒の成績が良いように思われる。 メジアンを含めて 3 個の四分位数(quartile) Qi (i =1,2,3)が定義され、Q1は下半分の分布を 2 分割する点、Q2は分布を 2 等分し、Q3は分布の上半分を二等分する点である。従って、Q2 はメジアンになる。標本については、メジアンと同じ要領で Q1と Q3が求められる。標本 1, 5, 2, 7, 5, 3, 2, 6 のとき、標本数が 8 個であるので、小さいほうから 2 番目と 3 番目のデータを平均した数が Q1、また 6 番目と 7 番目のデータを平均したものが Q3である。従って、

(10)

5 .

5 ,

2

5₂6 3 2 2 2 1



 

_Q

Q

である。第 1 四分位と第 3 四分位の差は四分位範囲(interquartile range (IQR))と呼ばれ、外れ値 (outlier)や極端な値(extreme value)の検討に用いる。四分位範囲は IQR =

Q

₃



Q

₁ である。

Q

₁



1 .

5 

IQR

以下と

Q

₃



1 .

5 

IQR

以上の標本については、外れ値の検討対象となる。標本の共変量情報や記入ミスなどがないか見直す方が妥当である。検討の結果で妥当な理由があれば標本値の修正をし、異常値であれば削除によってデータ解析が行われる。問 3.3. 表 3.6 をそれぞれ度数分布にまとめよ。また、分散、標準偏差を計算せよ。また、第 1 四分位と第 3 四分位を求め、外れ値等の検討をせよ。表 3.6. 数学のテスト結果クラス点数 37 58 43 33 70 29 48 36 37 32 52 68 58 4 34 A 47 64 21 37 45 48 43 62 39 37 31 32 75 4 44 51 39 39 89 57 40 53 33 62 40 30 45 66 40 48 51 30 56 31 73 27 31 55 57 0 33 26 55 10 44 B 24 39 41 18 15 21 52 37 16 50 53 39 67 63 51 53 46 30 17 16 27 74 80 69 19 14 65 48 56 4 (vii) 標本歪度歪度はν3/σ 3_{で定義される。ここに} ν3 ＝E{(X-μ) 3_{}, μ = E(X)} である。平均に関して対称な分布については、この母数は 0 である。従って、正規分布では歪度は 0 である。標本歪度は













n i i

X

n

1 3 3

1 ˆ



に対して 3 3

/

ˆ S



で与えられる。

(viii) 標本尖度(sample curtosis) 尖度はν4/σ 4_{で定義される。ここに} ν4 ＝E{(X-μ)4} であり、標本尖度は













n i i

X

n

1 4 4

1 ˆ



である。正規分布の尖度は 2 である。

(11)

以上のような統計量で標本を縮約し、標本の概要を記述する方法を記述統計(descriptive statistics)という。標本歪度や尖度はデータの正規性を調べるために用いられる。 問 3.3. 次のデータは男子学生 30 人の身長 X と体重 Y のデータである。標本平均、標本分散、標本標準偏差および標本相関係数を求め、表にせよ。表 3.7. 身長と体重のデータ学生 1 2 3 4 5 6 7 8 9 10 X 164.2 177.5 169.0 172.2 171.4 169.9 168.7 172.1 169.6 166.6 Y 59.3 73.0 60.4 59.7 65.7 58.6 54.4 60.5 62.0 62.2 学生 11 12 13 14 15 16 17 18 19 20 X 168.8 171.9 171.8 174.4 172.7 174.6 172.0 166.8 163.2 164.5 Y 54.6 64.6 61.6 60.1 63.4 65.9 63.8 62.5 49.3 51.1 学生 21 22 23 24 25 26 27 28 29 30 X 174.5 169.9 175.2 171.1 166.4 158.8 168.1 173.4 156.5 180.7 Y 60.3 54.2 62.9 67.7 50.2 52.4 65.6 60.3 48.8 76.9 3.5. 多施設からの標本 医学での調査では多施設で調査し、統計解析を行う場合が多い。この際に不用意に全てのデータを合併して解析すると結論を誤る危険性がある。多施設間での調査者の技量や施設で扱う患者背景の差が混合されて、目的の治療効果や実態が解析できない場合や、時には逆の結論が導かれる可能性がある。次の分割表を考える。表 3.8. 施設１のデータ表 3.9. 施設２のデータ属性 2 属性 2 属性 1 あり (1) なし(0) 計属性 1 あり (1) なし(0) 計あり(1) 80 20 100 あり(1) 10 20 30 なし(0) 40 10 50 なし(0) 40 80 120 表 3.10. 合併データ属性 2 属性 1 あり (1) なし(0) 計あり(1) 90 40 130 なし(0) 80 90 170 施設 1, 2, および合併データに関して、属性 1 を与えたときの、属性 2（あり）の相対度数 をそれぞれ、F1(1|i), F2(1|i), FT(1|i) (i=0,1)とすると

F1(1|1) = 80/100 = 4/5, F1(1|0) = 4/5 (3.8)

(12)

FT(1|1) = 9/13, FT(1|0) = 8/17 (3.10) を得る。(3.7)と(3.8)から施設 1 と 2 では二つに関連性が認められないが、このデータを合併すると、属性 1 が 2 に影響を与えているような結論を導いてしまう危険性がある。このような誤やまった解析を避けるために、多施設や多母集団からの標本の合併は注意を要する。この場合、属性 2 についての応答には施設が関連していることになる。単純無作為標本抽出が好ましい理由は、統計解析での数学的な取り扱いがこの標本抽出法を基本としているからである。従って、通常の統計解析ではこの標本抽出法に基づくことが、後の解析を容易にする。 3.6. 統計的研究の型

3.6.1. 調査 survey, cross-sectional study

調査研究では被験者は因子、処置、結果等が同時に１回だけ観測され、複数の観測項目の観測を行っても、原因と結果（因果）の関係は分析できない（例えば表 3.2）。成人男性の患者群で喫煙の有無と慢性気管支炎の有無についての調査をした場合に、その研究からは喫煙が気管支炎の原因であるとの結論は引き出せない。調査データから言えることは属性間の関連性だけである。高い流行の疾病や暴露因子および選挙などの行動や意識調査に関する研究に適している。しかし、例 2.5 で触れたヒト T 細胞白血病ウイルス I 型のキャリアの調査では、キャリアが希薄であり、一般的な調査は適当でない。日本ではこのキャリアはおよそ 1%と推定されていて、1000 人程度の大きな調査でもキャリアとして観察される人数は僅かになる可能性が高い。献血データなどの数万人規模のデータを用いた解析を行う必要がある（表 3.11, 12）。表 3.11 と 12 は献血に基づく、HTLV-I 感染者の大規模な調査データである。年齢や性別と感染者数や比率との関連性に関する分析は、このウイルスの感染経路と感染力等を十分考慮して分析しなければならない。母子感染と男女間の性感染が主な感染経路で、男女間の感染は男性から女性への感染力が高いことが既知であるので、その知識用いた解析が必要である。表 3.11. 大分県での HTLV-I に関する血液データ（1989 年）年齢群男性女性献血者数感染者数相対度数献血者数感染者数相対度数 [15,19] 14264 191 0.0134 15977 140 0.0088 [20,29] 13426 219 0.0163 11098 136 0.0123 [30,39] 15179 446 0.0294 5079 147 0.0289 [40,49] 11863 370 0.0312 5501 221 0.0402 [50,65] 7477 298 0.0399 4356 244 0.0560 合計 62209 1524 0.0245 41017 1106 0.0270

(13)

表 3.12. 大分県での HTLV-I に関する血液データ（1999 年）年齢群男性女性献血者数感染者数相対度数献血者数感染者数相対度数 [15,19] 2813 23 0.0081 4245 21 0.0049 [20,29] 10718 73 0.0068 10470 78 0.0074 [30,39] 10365 112 0.0108 5117 46 0.0089 [40,49] 10530 194 0.0184 3950 126 0.0318 [50,65] 7610 218 0.0286 3570 136 0.0380 合計 42036 620 0.0147 27352 407 0.0148 また、このデータは時間的な感染者の推移の解析もでき、感染者が減尐傾向にあることが分かる。 3.6.2. 実験 experiment 実験研究では因子水準を設定し、その水準を実験単位に暴露させ、そして一定の時間後に結果を観測する。実験単位はヒト、動物、および細胞組織などである。因子に 2 水準を仮定する場合は処置(treatment)と対照(control)が通常考えられる。プラセボ、または標準薬（処置）が対照群に割り付けられ、新治療法との比較検討を行う。このとき、処置水準に従って、結果が異なると判断されれば処置と結果の間に因果関係が結論付けられる。例えば、一定期間、ある薬剤の異なる投与量で患者群を治療したときに、採血検査で血中成分に差が見られれば、この薬剤と血中成分量に因果関係が認められる。実験で条件や因子の水準を複数設定して、物質に関する種々の計測や人に対する観察が行われる場合も考えられる。実験研究は人工的に作られる現象の観測と解析である。実験の順序や、条件水準の割り付け方からくる偏りを排除するように実験を実行する必要がある。表 3.13. 貯蔵食品と含水量 食品含水量 Yij

Y

i A1 10 4 6 4 6.0 A2 12 10 13 7 10.5 A3 9 4 4 5 5.5 A4 14 9 10 11 11.0 A5 10 6 8 4 7.0 フィッシャーは実験計画の三原則として (1) 無作為化の原則、(2) 反復の原則、(3) 局所管理の原則を揚げている。(1)は因子水準や実験順序を実験単位（物質や人など）に割り付けるときの

(14)

原則である。(2)は条件や因子水準を与えたときの、測定誤差や散布度（分散）の推定のための原則である。また、(3)は実験を行う場の管理に関する原則である。表 3.13 は貯蔵食料品 A1,A2,…,A5の 100g に含まれる含水量(g)の検査結果である。この実験では(1)と(2)の原則を満たせばよく、このような実験を一元配置実験という。この場合の因子は食品で、貯蔵された食品それぞれから 4 袋を無作為抽出し、水分検査を行う。この実験では各食品を 4 袋取り出しているので、反復の原則を満たされている。水分検査の順番を全ての袋に関して無作為に行う必要がある。このことは、測定順序の効果を誤差にするためである。実験計画法に関する詳細は後の章で説明する。 3.6.3. 臨床試験 clinical trial 研究対象は患者であり、毒性(toxicity)および効果(efficacy)の実験研究を行う。この際に(i) 参加者から実験に参加するための同意、(ii)患者の基準や(iii)処置の修正および試験の早期終了に関する環境または条件の検討が必要になり、試験は複雑な研究になる。また、患者は個々に処置を受けるので、十分な例数確保には長い年月と他施設による試験の実施が伴う。結果評価に当たっては、患者と患者に関わる専門家や評価者に患者に割り付けられた因子水準を知らせずに試験を行う二重盲検法(double-blind trial)がとられる。この方法が必ずしも可能でない場合もある。試験は第１相(phase)から 4 相までがある。第 1 相：尐数の健常志願者に対する安全性の検討第 2 相：尐数の患者に対する安全性と有効性の検討第 3 相：多くの患者に対する標準薬と新薬との比較検討第 4 相：市販後の副作用と有効性の追跡調査（6 年後に再審査）表 3.14 は乳がん患者に対して行った第 3 相試験の患者背景データである。この試験は患者群を用いる薬剤 A と B に関する 2 群に無作為割付を行った。試験前に患者群に偏りが無いことを確認する意味でこの表は必要である。それぞれの群の患者は各薬剤を毎日決められた用量で服用する。この際に、この服用が遵守されるように管理する必要がある。この表から 2 群間の患者特性に差が無いと考えてよく、投薬試験による差は用いた薬剤によるものと考えられる。図 3.5 から 3.7 は全コレステロール、低コレステロール、および高コレステロールの治療中の推移である。図には、実験開始時点と 3 ヶ月、6 ヶ月、12 ヶ月および 24 ヶ月時点での 2 群に比較が、標本平均と標準偏差を用いて示してある。これらの図では中心の点が平均で、その上下に線分で示した幅が標準偏差である。データが正規分布の場合はこれらの線分の間にデータのおよそ 68％が入ることになる。このように、平均と標準偏差または標準誤差で示した図を平均比較図 (mean comparison chart)という。

(15)

Ｔ－ＣＨＯＬ 170 180 190 200 210 220 230 Before 3M* 6M 12M　 24M mg/dl 表 3.14. 患者背景（特徴）投与薬剤 A B 平均年齢 (年) 64 62 平均身長 (cm) 153 152 平均体重 (kg) _{53.5 55.5} BMI (median, kg/m2_{) 22.5 23.6} 腫瘍度数度数 T0 2 0 T1ab 63 63 T1b 1 0 T2a 57 58 エストロゲンレセプター度数度数正 119 114 不明 4 7 外科処置乳房切除術 58 61 乳房温存＋放射線術 43 40 乳房温存術 22 20 (A) (B) 図 3.5. 血中の全コレステロール値推移：M= month〔月〕

(16)

ＬＤＬ 80 90 100 110 120 130 140 150 Before 3M 6M 12M　 24M mg/dl ＨＤＬ 50 55 60 65 70 Before 3M 6M 12M 24M mg/dl (A) (B) 図 3.6. 血中の低コレステロール値推移：M= month〔月〕 (A) (B) 図 3.7. 血中の高コレステロール値推移：M= month〔月〕

(17)

第 4 相臨床試験は薬剤の効果や副作用についての実地での調査であり、大きな標本が要求されている。表 3.15 はある輸液の試験結果の一部であり、標本は 1483 ある。このデータの解析では、性別による薬剤効果の検討が目的である。このような大標本に基づく結果が厚生省に提出され、薬剤の市販後の安全性と効果に対しての再審査となる。表 3.15. 男女別の輸液効果著効有効やや有効無効計男 67 380 347 65 859 女 48 244 262 70 624 計 115 624 609 135 1483 3.6.4. 前向き研究 prospective study この研究では観測時間に対して、反復測定がなされる。通常は人工的な介入(treatment)は行われない。コホート研究は同一母集団に対して、反復して標本が取られ、パネル研究では同一の標本について反復測定される。パネル研究では同一の被験者や個体が対象となるので、経時的な観測で被験者が出来るだけ脱落しないような配慮が必要になる。実際の解析では脱落した被験者のデータを除いて解析されるが、脱落数があまりに多い場合の統計解析は不可能である。前節で示した乳がん患者を用いた追跡調査はパネル研究の例である。実際の解析では脱落した被験者のデータを除いて解析されるが、脱落数があまりに多い場合の統計解析は不可能である。3.6.1 節の HTLV-I データは人々の外部からの流入や外部への移動が無視できれば、同一母集団からの反復測定と見なされる。2000 年以降は献血により HTLV-I 感染が陽性の人に通知し、次回からの献血を断っている。従って、2000 年以降のデータは母集団からの無作為抽出とは考えられず、通常のデータ解析は不適当で、スクリーニングの効果を考慮したモデルを構築して解析する必要がある。 3.6.5. ケース・コントロール研究 case-control study ケース（患者）を最初に収集し、可能なリスク因子に対して時間を遡って、記録を調査する。稀な疾患（ガンなど）の場合には、通常の標本抽出を行えば、標本中にほとんど患者がいないか、または希薄であるために、解析が巧く行えない。献血データなどの大規模なものがあれば良いが、一般には解析に適する患者数を通常の標本抽出で得ることは難しい。従って、先に患者を抽出して、その共変量または因子情報を解析することで、リスク因子の分析を行うが、リスク要因を断定できない。