2016 2016 2016 2016 年年年年 11111111 月月月月 4444 日日日日 http://mcobaya.web.fc2.com/ut.htm http://mcobaya.web.fc2.com/ut.htm http://mcobaya.web.fc2.com/ut.htm http://mcobaya.web.fc2.com/ut.htm 2015 年 12 月 4 日 <[email protected]>
最尤法(さいゆうほう) maximum likelihood method 例1
例1 例1
例1::::DieldrinDieldrinDieldrinDieldrin と腫瘍発現率と腫瘍発現率と腫瘍発現率と腫瘍発現率 用量pp m ラット数 腫瘍発現 ラット数 非発現 0 156 17 139 1.25 60 11 49 2.5 58 25 33 5 60 44 16 例 例 例 例 2222 フロランシンのメダカへの影響フロランシンのメダカへの影響フロランシンのメダカへの影響 フロランシンのメダカへの影響 用量 死亡数(60 匹中) 0.8 1 1.4 2 3.3 0 3.9 1 7.5 10 11.2 47 11.8 46 14.5 60 31 60 柳川堯『環境と健康データ』共立出版 柳川 堯 (2002)『環境と健康データ―リスク評価のデータサイエン ス』共立出版 ロジット分析ではロジスティック曲線:p(x)=1/(1+e-a-bx) ロジットモデル ロジットモデル ロジットモデル ロジットモデル ではではでは現象の発生確率が変数 x の次のような関数ででは あらわされるとする。 p(x)=1/[1+exp(-a-bx)]=> 1/p(x)-1=(1-p(x))/p(x) =exp(-a-bx) loge(1-p(x)/p(x))= -a-bx loge[p(x) /(1-p(x))]= a+bx ロジット変換 ロジット変換 ロジット変換 ロジット変換 LN[p(x) /(1LN[p(x) /(1LN[p(x) /(1LN[p(x) /(1-p(x))p(x))p(x))p(x)) ]]]]は用量 x の一次関数である。し たがって、もしも、x という投与量にたいする死亡率(の推定値)p(x) が繰り返し実験繰り返し実験繰り返し実験によりわかれば、ロジット変換繰り返し実験 ロジット変換ロジット変換ロジット変換 loge[p(x) /(1-p(x))] にたいして直線の当てはめを行う方法が従来とられてきた。今でも この方法を使う教科書があるが、死亡例死亡例死亡例死亡例 0000 件もしくは全数死亡件もしくは全数死亡件もしくは全数死亡件もしくは全数死亡 (p(x)=0,p(x)=1) (p(x)=0,p(x)=1) (p(x)=0,p(x)=1) (p(x)=0,p(x)=1)のケースではロジット変換ができないという欠点がのケースではロジット変換ができないという欠点がのケースではロジット変換ができないという欠点がのケースではロジット変換ができないという欠点が ある。注意: ある。注意: ある。注意:
ある。注意:EXCELEXCELEXCELEXCELでは自然対数はでは自然対数はでは自然対数はでは自然対数は LN( )LN( )LN( )LN( )という関数という関数という関数という関数 プロビット変換 プロビット変換プロビット変換 プロビット変換 F(x)を標準正規分布の分布関数とすると、p(x) =F(a+bx)がプロビットモデル。死亡例 0 件もしくは全数死亡 ( p(x)=0,p(x)=1)のケースではプロビット変換プロビット変換プロビット変換プロビット変換 a+bx =F -1(p) が変換が定義できないことも同じ。 Excel の 関 数 で は 標 準 正 規 分 布 関 数 の 逆 関 数 は =NORMSINV(確率)とあらわし、 標準正規分布関数は=normsdist(x)と表される。 応用 応用応用 応用
1. LD50LD50LD50LD50(median lethal dose ドースと発音:50%の動物を死亡さ せる用量,化学物質の毒性の強さを表す使用としてよく使われる)の 導出 ロジットモデルでは 0.5=1/(1 + exp(–a – bx))を満たす x は exp(– a – bx)=1、すなわち a + bx=0 –a/b= LD50 によって計算する。、 フルオランシンの推定値から LD50=6.1/0.65=9.5(μg/㍑)実実実実 質的安全用量 質的安全用量質的安全用量
質的安全用量 推定(VSD) virtually safe dose VSD 慣習では 慣習では慣習では 慣習では 10-5か 10-6以下の発生確率を Acceptable Risk と仮 定する。 注意:他にもさまざまなモデル、仮定があるのでこれはVSD計算の ひとつの例 1)自然発生(死亡)率がある現象の分析自然発生(死亡)率がある現象の分析自然発生(死亡)率がある現象の分析自然発生(死亡)率がある現象の分析(説明変数が原数値)。用 量0のときの死亡率 p(0)>0 のケース 用量0のときの死亡率を p(0), 用量xのときの死亡率を p(x)と する、ネズミ 10 万頭に1頭の割合(π=10-5)で、新たな腫瘍を発 生させる量が許容量とすると、 p(x)-p(0)= 10-5 p(x)= p(0)+ 10-5 を満たす x を実質的安全量実質的安全量実質的安全量実質的安全量とよぶ。〔注意:実験でははるかの大き な量を投与している〕 ロジット変換 ロジット変換ロジット変換 ロジット変換 ロジットモデルでは 比率=1/(1+exp(-a-b*用量)) これは a+b*用量= LN(比率比率比率/(1-比率比率 比率比率比率))と変換できる。 エクセルでは、プロビット変換は=NORMSINV(比率比率比率比率) で行い、 ロジット変換では=LN(比率/(1-比率)) で行う 。 死亡率 0%,100%のところではロジット変換、プロビット変換が行え ないとう問題が起きる。
練習:横軸に用量、縦軸に死亡率の Logit 変換で散布図を描き、 直線のあてはめを行おう。傾きと切片を求める。縦軸に原数値をと ったときと比較しよう。。 1)死亡率を各用量について計算し、#NUM!や#NUM!を=NA()におき かえる。 2)横軸に用量、縦軸に死亡率の散布図をかく。 3)ロジットを計算し、横軸に用量、縦軸に死亡率、ロジットの散布 図をかく。(死亡率のグラフを削除) 注意:#DIV/0!は散布図を描くときに000の扱いになるので、セルの内0 容を削除するか欠損値を示す#N/A を入れるといい。=NA()という関 数をいれてもい。(注意:空白文字があると Excel は空白文字を0空白文字を0空白文字を0と空白文字を0 みなすので、混同が生じやすいが、外見からは空のセルと空白文 字の区別はつかない。したがって、#N/A がよい) (medaka.xls) 練習: Dieldrinの発ガン性試験のデータDieldrin.xlsをロジット分析す る。ロジット変換した値を回帰(省略)した結果と比較。プロビット分 析でも同様のことをやってみよう。 応用 応用 応用 応用
1. LD50LD50LD50LD50(median lethal dose ドースと発音:50%の動物を死亡さ せる用量,化学物質の毒性の強さを表す)の導出 ロジットモデルでは 0.5=1/(1 + exp(–a – bx))を満たす x は exp(– a – bx)=1、すなわち a + bx=0 –a/b= LD50 によって計算する。、 フルオランシンの推定値から LD50=6.1/0.65=9.5(μg/㍑)実実実実 質的安全用量 質的安全用量 質的安全用量
質的安全用量 推定(VSD) virtually safe dose VSD 慣習では 慣習では 慣習では 慣習では 10-5か 10-6以下の発生確率を Acceptable Risk と仮 定する。注意:他にもさまざまなモデル、仮定があるのでこれはVS D計算のひとつの例 1)自然発生(死亡)率がある現象の分析(説明変数が原数値)。用 量0のときの死亡率 p(0)>0 のケース 用量0のときの死亡率を p(0), 用量xのときの死亡率を p(x)と する、ネズミ 10 万頭に1頭の割合(π=10-5)で、新たな腫瘍を発 生させる量が許容量とすると、 p(x)-p(0)= 10-5 p(x)= p(0)+ 10-5 を満たす x を実質的安全量実質的安全量実質的安全量とよぶ。〔注意:実験でははるかの大き実質的安全量 な量を投与している〕 例:フルオランシンでの 例:フルオランシンでの 例:フルオランシンでの 例:フルオランシンでの VSDVSDVSD の導出VSDの導出の導出 自然死亡率の存在を前提の導出 自然死亡率の存在を前提自然死亡率の存在を前提自然死亡率の存在を前提 ロ ジ ッ ト 分 析 で 定 数 項 は a=-6.17254 、 用 量 の 係 数 は b=0.0.650347 P(0)=1/(1+exp(-a-b*0) より、p(0)= 0.002082 これが 自然死亡率 1/(1+exp(-a-b*x)= p(x)= 0.002082+10-5= 0.002092 をとくと、 a+b*x=ln(0.002092/(1-0.002092))= -6.16754 VSD(lobit):x= (-6.16754-(-6.17254))/ 0.0.650347 =0.00769((((μμμμg/l)g/l)g/l)g/l) 自然死亡率から自然死亡率から自然死亡率から 10自然死亡率から -5だけ死亡率を上昇させる 量が VSD プ ロ ビ ッ ト 分 析 プ ロ ビ ッ ト 分 析プ ロ ビ ッ ト 分 析 プ ロ ビ ッ ト 分 析 で は 定 数 項 は a=-3.19997 、 用 量 の 係 数 は b=0.034396。 P(0)=F(a+b*0)より p(0)=0.000687 (プロビットでの死亡率のプロビットでの死亡率のプロビットでの死亡率のプロビットでの死亡率の ほうが速く低下 ほうが速く低下ほうが速く低下 ほうが速く低下) p(x)=0.00001+p(0)=F(a+b*x) を 解 く と a+bx=F -1(0.000697)=-3.19589 VSD(probit):x=(-3.19589-(-3.19997))/ 0.34396 x xx x=0.011857(0.011857(0.011857(0.011857(μμμμg/l)g/l)g/l)g/l) 結論:ロジットとプロビットとモデルを変えただけで、0.011857 と 0.00769とととと VSD に 50%もの差がでてくる。 注意:まだここでは推定誤差推定誤差推定誤差推定誤差は考慮していない。通常は上側 95% 限界で計算する。 ロジットとプロビットモデルによって VSD は異なる。切片と傾き の係数に推定誤差がある。 2)自然発生率が0の場合自然発生率が0の場合自然発生率が0の場合自然発生率が0の場合。用量0のときの死亡率 p(0)=0 のケー ス 注意:説明変数が原数値の常用対数x=log10(投与量)の場合は log10(0)= -∞ゆえ p(log10(0))=0となるので、自然発生率=0とい う仮定に整合的。x=0 は投与量=1(単位)を表わす。 直線あてはめか曲線当てはめか 直線あてはめか曲線当てはめか直線あてはめか曲線当てはめか 直線あてはめか曲線当てはめか 死亡率や発現率の線形予測は高用量の場合、発生確率が1を超 える。そこで横軸に投与量(X)、縦軸にマウスの死亡確率をと ってグラフ化すると曲線あてはめが適当であると予想される。 まず、曲線の形として次の二種類のものがよく利用される。 0 0.5 1 1 12 23 34 45 56 67 78 89 100 死 亡 確 率 投与量(0.01mg)
ロジスティック曲線 ロジスティック曲線ロジスティック曲線 ロジスティック曲線:p(x)=1/(1+e-a-bx) 標準正規分布関数 標準正規分布関数標準正規分布関数 標準正規分布関数: 1 2/2 ( * ) 2 a bx z p e dz a b x π + − −∞ =
∫
= Φ + どちらの関数でも b>0 ならば x が増加するにつれ死亡率は上 昇し、逆に b<0 ならば死亡率は減少。b>0 ならばxが無限大に なると p(x)は1に近づき、x がマイナス無限大になると p(x)は 0に近づき、右上の曲線のようになる。 ロジスティック曲線をあてはめて a,b を推定する分析をロジ ット分析、正規分布関数をあてはめて a,b を推定する分析をプ ロビット分析。(Probability から) 推定法1 推定法1 推定法1 推定法1: : : 発現率を変換して線形回帰分析に帰着: 発現率を変換して線形回帰分析に帰着発現率を変換して線形回帰分析に帰着発現率を変換して線形回帰分析に帰着 ロジステック関数の逆変換をロジット変換といい、 z=loge(p/(1-p))=a+b*x とあらわす。この値ををロジットロジットロジットと呼ぶこともある。 ロジット 同様に 1 ( )p a b x − Φ = + × と線形なので、p に観測された発現 率を代入することにより回帰モデルに帰着。しかし、p=1,p=0 の観測値の存在する例2では使えない。 Excel では 1 ( )p − Φ は NORMSINV 関数。 オッズについて オッズについて オッズについて オッズについて p/(1-p)をオッズ、ln(p/(1-p))を対数オッズという。 説明変数 x の値が 1 単位変化したとき、対数オッズは b 変化 する。変化前後のオッズの比率(オッズ比オッズ比オッズ比)は exp(b)であらオッズ比 わされる。b>0 ならばオッズ比は 1 より大きい。 推定法2:最尤法 推定法2:最尤法 推定法2:最尤法 推定法2:最尤法さいゆうほう、ML,Maximum Likelihood) 最尤法の考え方 尤度関数(likelihood function):確率関数、密度関数を、 パラメーターの関数とみなしたもの 尤度関数を最大化させるパラメータの値が最尤推定量 利点:複雑なモデル(非線型)でも推定できる 欠点:いつもすんなりと最大化できるとは限らない。 コイン投げの問題における最尤推定の原 コイン投げの問題における最尤推定の原 コイン投げの問題における最尤推定の原 コイン投げの問題における最尤推定の原理理理理: コインを n 回だけ投げる パラメーター:p 表が出る確率 p 出る回数 x 回 裏が出る確率 1-p 出る回数 n-x 回 確率関数は f(x;p)=nCxpx(1-p)n-x とおき、x の関数。 尤度関数は f(p;x)= nCxpx(1-p)n-xとおき、p の関数。 対数尤度 lnL= Constant + n*ln(p)+(n-x)*ln(1-p) 最尤推定量は∂lnL/∂p=x/p-(n-x)/(1-p)=0 p*=x/n (最尤推定量は通常の推定と一致 nCx は p には依存しないので、無視する。N=2,x=1 に対して、 p=0.1 では確率 0.09 となり、p=0.1 ならば現実の現象はまず 起きないことを示す。p=0.4では確率 0.24, p=0.5 では確率 0.25、 p=0.6では確率 0.24, p=0.9 では確率 0.09(p=0.9 ならば)したがって、p=0. 5 のときが現実の現象が起きる確 率が最大。これを推定量とする。具体的には∂lnL/∂p=0 と おいて p=1/2 という解を求める。 ロジット、プロビットへの最尤法への応用 ロジット、プロビットへの最尤法への応用ロジット、プロビットへの最尤法への応用 ロジット、プロビットへの最尤法への応用 p(x)=1/(1+exp(-a-b*x))と表現できる。x は用量。a,b がパ ラメーター。niを用量 xiに対応する個体、yi 発現の個体、 pi=p(xi),ni-yi 非発現個数,k 通りの用量で実験すると、 L(a,b)= p1^(y1)(1-p1)^(n1-y1)…pk^(yk)(1-pk)^(nk-yk) ln L(a,b)= y1×ln p1+(n1-y1)ln(1-p1)+…+ yk ×ln(pk)+(nk -yk)ln(1-pk)^ 対数尤度は「確率の対数×個体数」の総和 最尤推定量は ∂lnL(a,b)/∂a=0,∂lnL(p)/∂b=0 の解。 個人で説明変数 x の値が異なるので、残念ながら p=....と いう形では解析的に表現されないので、数値的に求める。 Excel では solver という add-in が利用可能。Solver SolverSolver Solver 利用法利用法利用法利用法 インストール方法:ファイル/オプション/アドイン/設定 solver にチェック 練習: 二次関数の最小問題 x^2-2*x+1 が最小値をとるよ うにxを定める。 1. A1 に初期値 0(同時にパラメタ)を入力 2. A2 に目的関数 =a1^2-2*a1+1 と入力。 3. データタブから solver を起動し、目的値を A2,変数を A1、最小値探索に設定し、係数の正値条件を解除して、 実行。 例1 例1例1
例1DieldrinDieldrinDieldrinDieldrin と腫瘍発現率のと腫瘍発現率のと腫瘍発現率の logitと腫瘍発現率のlogitlogitlogit モデルの推定モデルの推定モデルの推定 モデルの推定 1. Dieldrin_ml.xlsx を開く。 2. F8,G8 にパラメタの初期値 0.001,0.001 を入力。0 以 外が better. 3. F4 に発現確率(割合) =(1/(1+EXP(-A4*$G$8-$F$8))) を入力し、F 列にコピー複写 4. G4 に非発現確率(割合) =1-F4 を計算、G 列にコピー 複写 5. F9 に 対数 尤度 =SUM(LN(F4:G7)*C4:D7)を 入力 し、 (ctrl+shift+enter) 6. データタブから solver を起動し、目的値を F9,変数 を F8:G8、最大値探索に設定し、係数の正値条件を解 除して、実行。
練習:発現確率を=NORMSINV(A4*$G$8+$F$8)に変更し、probit 分 析を行う。推定値と発現確率を比較使用。 Q.なぜ、なぜ、なぜ、なぜ、最尤推定量がよいのか。最尤推定量がよいのか。最尤推定量がよいのか。最尤推定量がよいのか。 A.一致性一致性一致性一致性(consistency) サンプルサイズが無限に大きくなサンプルサイズが無限に大きくなサンプルサイズが無限に大きくなサンプルサイズが無限に大きくな るとき、最尤推定量は真の値に近づく。 るとき、最尤推定量は真の値に近づく。 るとき、最尤推定量は真の値に近づく。 るとき、最尤推定量は真の値に近づく。 未知係数 a にたいして、互いに独立な確率変数 X1,…,Xnの密度 関数を f(xi;a)とする(同一)。-∞<Xi<∞の取る値はとする。 Step 1: 密度関数の定義より∫-∞∞f(xi;a)dxi=1 これを a で微 分すると、 ∫-∞∞(∂/∂a)f(xi;a)dxi
=∫-∞∞[(∂/∂a)logf(xi;a)] f(xi;a)dxi =E[(∂/∂a)logf(xi;a)]=0
すなわち、対数尤度の一次導関数の期待値は0。この a は 真の値
Step 2:
X1,…,Xnが観測されたとき、最尤推定量は 0=(∂/∂a)log[ f(x1;a)…f(xn;a)] =(∂/∂a)[logf(x1;a)+…+logf(xn;a)] =(∂/∂a)logf(x1;a)+…+(∂/∂a)logf(xn;a) の解。右辺を n で割ったものは大数の法則により E[(∂/∂a)logf(xi;a)]に収束するので、 無限大 n のとき、最尤推定量は E[(∂/∂a)logf(xi;a)]=0 の解。 Step 3: 無限大 n のとき最尤推定量の定義式は真の値が満たす式と 同一なので、もしも解が unique ならば、n が無限に大きく なると、最尤推定量は真の値に近づく。 Step 4: Logは上に凸なので、g≠fならば ∫-∞∞[log(g(x)/f(x))] f(x)dx <log∫-∞∞[(g(x)/f(x))] f(x)dx =log1=0 すなわち、Ef[logf(x)]> Ef[logg(x)]
死亡率が推定できない例。 作業: 1.統計解析 BOX と hitachi.xls をダウンロードしてください。 データは次のような情報を含む。172人の社員について年齢(age)、 人事等級(class),査定(ratings)、労働組合加盟の有無(union)、 昇進の有無(promotion) 人事等級は4から1、M(マイスター?) へと順上昇。査定は100点を基準として5点を限度として加減する 相対評価。地方労働委員会は組合差別の有無を調べるためにこ のデータを使ったのであるが、大竹氏の論文の目的は日本企業の 昇進メカニズムを明らかにすることにある。
AGE RATINGS CLASS UNION PROMOTION
32 103 1 0 32 103 1 0 32 100 1 0 まず査定に組合加入が影響しているかをチェック。 査定=a +b×年齢+c×組合ダミー を 推 定 す る 。 上 位 の 人 事 等 級 1 , 2 級 に 属 す る 労 働 者 は hitachi.xlsの2行から86行にあることに注意。 2. エクセルで[ファイル][開く]統計解析ボックス統計解析ボックス統計解析ボックス統計解析ボックスを開く。 3. メニューのウィンドウズで hitachi.xls にもどる。E 列に一列空 列を挿入し(promotion はF列に動く)、A 列 age を複写する。 4. 「ツール」「マクロ」「マクロ」「統計解析ボックス」「最小自乗法」を 選択し、y範囲に b2:b86 を入力、x範囲に D2:E86 を選択。出力先 にはデータに重ならないようG1 を選択。X2(組合)の係数がマイナ ス 1.3 ということは、組合に入っていると査定が平均 1.3 下がること を示す。また、X3(年齢)の係数がマイナスで有意ということは、 「年齢が上昇するにつれて査定が下がる」という不思議な結果であ るが、実は「評価の高い人はすでに上の階級にあがってしまってお り、残っている人で年齢は評価の高くない人である。また若くして高 い級に入っている人は優秀な人である。」という逆の因果関係の結 果であると考えられる。(この手のパラドックスはきわめて頻繁に起 きます。)論文の p.245 表7の結果と一致していることをチェック。い ずれもt値は絶対値が2以上であり、有意。(みなさんのレポートで は「優位」となっていることが多かったのですが、間違い!)ただし、 「組合員であると査定は低い」ことは統計的に認められたのである が、「生産性の低い労働者が組合員になっている」のか「能力とは 関係なく組合員だと査定が低くなる」のかはこのデータだけでは不 明であり、具体的な観察が必要である。(ここでは「能力」「生産性」 のデータがないので) 5) 他の単独の級(1,2,3,4)や、3,4等級を一緒にしたグループで も同様の結果が成立することを確認。
6) 次は 1,2、3,4級を合併したデータで、昇格確率=f(a +b× 年齢+c×組合ダミー+d×査定点)というモデルをプロビット分 析で推定。 7) F列に空の行を挿入し(promotion はG列に移動)、B列 ratingsをF列に複写。 8) 「ツール」「マクロ」「マクロ」「統計解析ボックス」「プロビット・ロ ジット分析」を選択。 Y範囲に g2:g173、X範囲にD2:F173 を指定し、結果の出力 に I1 を指定。(プロビットに印が着いていることを確認) 下の結果では組合の影響は認められず、(他の条件を一定と して)組合に入っていることが昇進確率を下げるとはいえない。 年齢はぎりぎりであるが、マイナスの影響が認められ、高い年 齢ほど昇進確率は低くなる。査定は明確にプラスの影響が認 められ、査定が高いほど昇進確率は高くなる。しかし、地方労 働委員会はこの企業に組合員に対する差別があったと判定 しているのはどうしたことであろう。これはもし組合員に査定を 低くつけたならば(論文の表7の回帰分析ではこの結果が認 められている)、査定、年齢が同じならば、組合員であろうとな かろうと昇進確率は同じように扱っていても、前提としては組 合員であることは昇進確率を下げることになる。 年齢==> 組合=×=> 組合、年齢===>査定==> 係数 標準誤差 t値 定数項 -80.7466 17.82929 -4.52887 UNION 0.703156 0.537337 1.308595 AGE -0.13057 0.063533 -2.05524 RATINGS 0.829847 0.178155 4.657999 9) 今度はロジット分析で同じ分析を行う。 「ツール」「マクロ」「マクロ」「統計解析ボックス」「プロビット・ロジット 分析」を選択。 Y範囲に g2:g173、X範囲にD2:F173 を指定し、出力場所はH20、 ロジットを選択。下の出力をみるとロジットの係数はプロビットの約 1.8倍になっているが、t値はほとんど違わないことに注意。プロビ ットで影響力の認められる変数はロジット分析でも影響力は認めら れる。逆もしかり。 変数 推定値 標準誤差 T 値 定数項 -140.903 32.8352 -4.29122 X2 1.32282 0.999746 1.323155 X3 -0.23055 0.113146 -2.03768 X4 1.448988 0.328004 4.417598 10) 今度は、等級を細かく分けて分析してみよう。 練習 1:死刑制度は殺人事件を防ぐか。Murder.xls 練習2:教育への支出の意思決定 voting.xls voting.xlsをダウンロードして開く。 これは US の学校への支出に たいする投票。日本の制度とちがうのは学校に対する支出が community にかかってくる。子供が住むのを事実上禁止している communityもあるときく。説明される変数は yesVM, ロジット分析のデータ(投票、 日立エレベーター, 死刑と殺人) 統計分析 BOX の扱える0,1になおしてあるので、、、 、 1) 1)1)
1) 統計分析統計分析 BOX統計分析統計分析BOXBOXBOXをダウンロードをダウンロード をダウンロードをダウンロード 2)
2)2)
2)統計分析統計分析 BOX統計分析統計分析BOXBOXBOXでプロビットモデルとロジットモデルを推定してみ よう。「ツール」「マクロ」「マクロ」「統計解析ボックス」「プロビット・ロ ジット分析」を選択。 変数名はいれてはいけないこと、結果の出力先の指定が必要なこ とに注意。 プロビット法では 変数 推定値 標準誤差 t 値 定数項 -3.19997 0.263873 -12.1269 X2 0.343969 0.026403 13.02747 ロジット法による推定結果 変数 推定値 標準誤差 T 値 定数項 -6.17254 0.59696 -10.34 X2 0.650347 0.058409 11.13443 注意:同じようなモデルだがロジット法のほうが係数が約 1.8 倍に なる。(ロジット変換の値が約 1.8 倍なので。次の項で LD50 の計 算で見当がつく。)したがってロジット分析もプロビット分析も係数自 体の意味はあまりない。意味のあるのは符号とt値だけ。 比較のため、死亡率0%,100%のデータをのぞいてロジット変換ロジット変換ロジット変換ロジット変換 の値を Y、用量を X として回帰分析すると下のような結果がでる。 大体の傾向はわかるが、ロジット変換の計算できない用量ロジット変換の計算できない用量ロジット変換の計算できない用量ロジット変換の計算できない用量 14.514.514.514.5、、、、 31 3131 31のデータが欠落しているので、傾きは過小評価になっている。のデータが欠落しているので、傾きは過小評価になっている。のデータが欠落しているので、傾きは過小評価になっている。のデータが欠落しているので、傾きは過小評価になっている。
ロジット変換 の回帰分析によ る推定 係数 標準誤差 t 切片 -4.81295 0.574 -8.37915 X 値 1 0.4978330.4978330.4978330.497833 0.076 6.512228