• 検索結果がありません。

本冊子の利用にあたって 本冊子は 能力強化研修で扱う内容を理解する上で助けとなるであろう統計学の基礎事 項を選択肢形式の問題として提示したものです 統計学に不安のある受講生は事前の学 習として活用ください 試験ではないので正答数自体は重要ではありません より効果的な学習 復習となるよ う 次のような

N/A
N/A
Protected

Academic year: 2022

シェア "本冊子の利用にあたって 本冊子は 能力強化研修で扱う内容を理解する上で助けとなるであろう統計学の基礎事 項を選択肢形式の問題として提示したものです 統計学に不安のある受講生は事前の学 習として活用ください 試験ではないので正答数自体は重要ではありません より効果的な学習 復習となるよ う 次のような"

Copied!
20
0
0

読み込み中.... (全文を見る)

全文

(1)

2018 年度能力強化研修

「インパクト評価:

エビデンスに基づく事業実施(EBP)の実践に向けて」

統計学理解度確認課題

(2)

本冊子は、能力強化研修で扱う内容を理解する上で助けとなるであろう統計学の基礎事 項を選択肢形式の問題として提示したものです。統計学に不安のある受講生は事前の学 習として活用ください。

試験ではないので正答数自体は重要ではありません。より効果的な学習・復習となるよ う、次のような姿勢で問題に取り組むことを強く推奨いたします。

 各設問の選択肢から正答を見つけるだけでなく、他の選択肢がなぜ不正解なのかと いった理由づけも丁寧に行ってください。

 統計分析のソフトウェアを用いれば、計算プロセスを省いて容易に正答が分かる問 題もあります。しかし、統計分析の原理を正しく理解するという観点からは、統計 分析ソフトウェアに頼ることは好ましくない面もあります。本冊子内の問題は、全 て電卓やエクセル等の表計算ソフトの計算機能の助けを借りることで解答にたど り着けるようにしていますので、手計算で解答を導出してください。

(3)

問1から問8は、以下の仮想プロジェクトを素材としている。

農村金融プロジェクトにおいて、プロジェクト活動エリア内に居住する女性を対象に標 本調査を行った。調査では以下のデータを収集した。

収集データ

定義 変数名 コード等

誕生年月日 birth_date 年・月・日(YYMMDD) 行政サービスの満足度 service 大変満足(=5)、満足(=4)、

どちらとも言えない(=3)、

不満足(=2)、大変不満足(=1) 一人当たり家計所得(/月) income

貯蓄口座の有無 saving 有り=1、なし=0 マイクロファイナンスの利用年数 mf

データ例

(4)

以下のA~Cは収集されたデータについて述べたものである。これらに関し、①から⑤ のうち、正しいものを一つ選べ。

① Aのみ正しい。

② Bのみ正しい。

③ AとBのみ正しい。

④ AとCのみ正しい。

⑤ 正しいものはない。

誕生年月日は量的変数であり、四則計算を施すことができる。

行政サービスへの満足度は順序変数であるが、解析的には離散変数

(discrete variable)として扱うことが許される場面もある。

所得データから「貧困ライン以下の層を0」、「貧困ライン以上、国家平 均水準以下を1」、「国家平均水準以上を2」とするダミー変数を作成す ることができる。

(5)

次の図はデータの一人当たり家計所得を階層に分け、ヒストグラムとして示したもので ある。①から④のうち、正しい記述を一つ選べ。

① 中心の代表値として平均値を用いることが望ましい。

② 平均値±標準偏差の範囲に全家計のおよそ70%が入ることが予想される。

③ このような形状の分布は「左に歪んでいる」という。

④ 中央値は平均値よりも小さな値となる。

0 5000 10000 15000 20000

(6)

貯蓄口座がどの程度浸透しているのかを把握するために、金融機関に貯蓄口座を有して いる女性の割合について区間推定を行った。なお、この問3では、サンプルサイズは 1000人と仮定する。1000人のうち、250人が貯蓄口座を有していた。プロジェクト活 動エリアにおける貯蓄口座保有割合の95%信頼区間について、①から④のうち、正し いものを一つ選べ。

① この情報だけでは貯蓄口座保有割合の95%信頼区間を求めることはできない。

② 貯蓄口座保有割合の95%信頼区間は22.3%~27.7%である。

③ 貯蓄口座保有割合の95%信頼区間は22.7%~27.3%である。

④ 貯蓄口座保有割合の95%信頼区間は21.5%~28.5%である。

(7)

プロジェクト予算が不足したため、調査対象者(サンプルサイズ)を1000人から500 人に半減させることとなった。母集団には変化はない。サンプルサイズが半減したこと で、どのような結果がもたらされるか?①から⑤のうち、正しいものを一つ選べ。

① 貯蓄口座保有割合の95%信頼区間は変わらない。

② 貯蓄口座保有割合の95%信頼区間は約2倍に広がる。

③ 貯蓄口座保有割合の95%信頼区間は約1.4倍に広がる。

④ 貯蓄口座保有割合の95%信頼区間は約0.7倍に狭まる。

⑤ ケースにより答えは一意に定まらない。

(8)

※問3、4で示したサンプルサイズ、貯蓄口座保有割合は本問では仮定しない(忘れて よい)。

貧困家計と非貧困家計について、貯蓄口座保有割合に違いがあるのかを検証するために、

「母集団においては貧困家計と非貧困家計間で貯蓄口座保有割合は等しい」という主張 を帰無仮説とする検定を行った。なお、サンプルサイズは大標本を仮定するに十分な大 きさがあるものとする。適切な分析手続きを踏んだ結果、群間には一定の差が見られ、

P=0.02という結果を得た。この意味するところとして①から④のうち、最も適切なも

のを一つ選べ。

① 帰無仮説が正しいとすれば、観察された差の値は、サンプルを変えて同様の検 定を繰り返した時、100回に2回程度しか生じない。

② 母集団における貧困家計と非貧困家計間で貯蓄口座保有割合の差は 2%である。

③ 帰無仮説は有意水準1%で棄却される。

④ 標本に見られた群間の貯蓄口座保有割合の差は2%の誤差を有している。

(9)

問5と同一のデータを用いて、貧困家計と非貧困家計における貯蓄口座保有割合の差の 区間推定を行う。割合の差の区間推定の結果について述べた①から⑥のうち、適切なも のを全て選べ。

① 95%信頼区間に0は含まれる。

② 95%信頼区間に0は含まれない。

③ 90%信頼区間に0が含まれる。

④ 90%信頼区間に0が含まれない。

⑤ 99%信頼区間に0が含まれる。

⑥ 99%信頼区間に0が含まれない。

(10)

貧困家計の貯蓄口座保有割合は23.8%、貯蓄口座保有割合は49.3%であった。以下の回 帰分析を行った時、切片()、及び貧困家計ダミーの係数()の値はいくつになるか?

①から⑥のうち、正しいものを一つ選べ。

𝑆𝑎𝑣𝑖𝑛𝑔𝑖 = 𝛼 + 𝛽𝑃𝑜𝑣𝑒𝑡𝑦𝑖 + 𝜀𝑖

Saving: 貯蓄口座保有ダミー(有り = 1、無し = 0)

Poverty: 貧困家計ダミー(貧困家計 = 1、非貧困家計 = 0)

𝜀: 誤差項

① この情報だけでは、の値を求めることはできない。

② α = 0.493, =‐0.255

③ α = 0.238, = 0.493

④ α = 0.238, = 0.255

⑤ α = 0.493, = 0.238

⑥ α = ‐0.255, = 0.238

(11)

貯蓄口座を有しているか否かは、一人当たり家計所得以外にも農村女性の年齢やマイク ロファイナンスの利用経験有無も影響しそうである。そこで、これらの属性が貯蓄口座 保有に与える影響を検証するために、貯蓄口座の有無を被説明変数とする以下のロジッ トモデルを推計した。なお、サンプルサイズは大標本を仮定するに十分な大きさがある ものとする。

P(𝑆𝑎𝑣𝑖𝑛𝑔 = 1|𝑎𝑔𝑒, 𝑎𝑔𝑒2, 𝑚𝑓_𝑑𝑚𝑦, 𝑖𝑛𝑐𝑜𝑚𝑒)

(𝛼 + 𝛽1𝑎𝑔𝑒 + 𝛽2𝑎𝑔𝑒2+ 𝛽3𝑚𝑓_𝑑𝑚𝑦 + 𝛽4𝑖𝑛𝑐𝑜𝑚𝑒)

(z) = exp (𝑧) [1 + exp (𝑧)]⁄

分析の結果、以下のような推計値を得た。

P(𝑆𝑎𝑣𝑖𝑛𝑔 = 1|𝑎𝑔𝑒, 𝑎𝑔𝑒2, 𝑚𝑓_𝑑𝑚𝑦, 𝑖𝑛𝑐𝑜𝑚𝑒)

(−1.89 − 0.08𝑎𝑔𝑒 + 0.0012𝑎𝑔𝑒2+ 1.85𝑚𝑓_𝑑𝑚𝑦 + 0.000025𝑖𝑛𝑐𝑜𝑚𝑒)

年齢21歳、所得16000、マイクロファイナンス利用歴2年というA氏と、年齢20歳、

所得7000、マイクロファイナンス利用歴0年というB氏について両者の貯蓄口座保有

確率の差を求めた。その値として①から⑤のうち、最も適切なものを選べ。

① 25.3%

② 2.0%

③ 20.3%

④ 16.5%

⑤ 33.6%

(12)

問9から問12は、以下の仮想プロジェクトを素材としている。

保健システム強化のプロジェクトにおいて、全国に20ある全ての郡病院に5S活動を 導入した。なお20の病院のうち8病院は都市部、残りの12病院は農村に位置してい る。プロジェクトでは、5S活動の進展度合いをモニタリングするために、20の郡病院 から無作為に10病院を選び、定期的に実践度スコア(100点満点)を収集することと した。

データ例

id: 郡病院識別番号

score: 実践度スコア

time: 5S導入からの経過月

(13)

以下のA~Cは収集されたデータについて述べたものである。これらに関し、①から⑥ のうち、正しいものを一つ選べ。

① Aのみ正しい。

② Bのみ正しい。

③ Cのみ正しい。

④ AとCのみ正しい。

⑤ AとBのみ正しい。

⑥ BとCのみ正しい。

実践度スコアのデータセットは、その計測構造から繰り返しクロスセク ションデータ(repeated cross-section data)である。

モニタリングの対象となった10病院は層別抽出法に則って抽出されて いる。

実践度スコアは厳密には離散データであるが、解析上は連続データとし て扱って差し支えはない。

(14)

これまでプロジェクト導入後1か月時点、及び2か月時点のスコアを収集した。この2 時点間で5S活動に進展があったか(実践度スコアの改善があったか)を検証するため の分析方法として①から④のうち、最も適切なものを一つ選べ。

① 1か月時、及び2か月時の実践度スコアに対して、対応のない2群の平均値差の 検定(t検定)を行う。

② 1か月時点と2か月時点の実践度スコアを病院ごとに比べ、改善している病院の 割合を求める。

③ 実践度スコアを経過時間で説明する単回帰分析(𝑠𝑐𝑜𝑟𝑒𝑖𝑡 = 𝛼 + 𝛽𝑡𝑖𝑚𝑒𝑖𝑡+ 𝜀𝑖𝑡)を 行い、𝛽が0であるかどうか検定を行う。

𝑠𝑐𝑜𝑟𝑒𝑖𝑡 病院iのtか月時点の実践度スコア

𝑡𝑖𝑚𝑒𝑖𝑡 病院iのtか月時点の5S導入からの経過月

𝜀𝑖𝑡 誤差項

④ 1か月時、及び2か月時の実践度スコアに対して、対応のある2群の平均値差の 検定(t検定)を行う。

(15)

5S活動導入から1年後に20の郡病院全てを対象に5S活動の進展度合いを測定したと ころ、病院間で大きなばらつきが見られた。その要因として病院職員の平均年間給与額 があるのではないかと考え、5S活動導入1年後の実践度スコア(score)を平均年間給 与額(salary)で説明する単回帰分析(𝑠𝑐𝑜𝑟𝑒𝑖 = 𝛼 + 𝛽𝑠𝑎𝑙𝑎𝑟𝑦𝑖+ 𝜀𝑖)を行った。その結 果、平均年間給与額の係数が統計的に有意となる推計値が得られた。仮説通りの結果を 得たと一度は満足したが、農村都市間の地域差を考慮しなくてはいけないのではないか と再考し、改めて説明変数に農村部ダミー変数(rural)を含む重回帰分析(𝑠𝑐𝑜𝑟𝑒𝑖 = 𝛼 + 𝛽𝑠𝑎𝑙𝑎𝑟𝑦𝑖+ 𝛿𝑟𝑢𝑟𝑎𝑙𝑖+ 𝜀𝑖)を行った。すると、農村部ダミーの係数が統計的に有意とな り、平均年間給与額の係数は有意ではなくなった。このような分析結果を生む考えられ るデータとして①から⑤のうち、最も適切なものを一つ選べ。

020406080100

score

0 500 1000 1500 2000

salary rural urban

020406080100

score

0 500 1000 1500 2000

salary rural urban

020406080100

score

200 400 600 800 1000 1200

salary3 rural urban

020406080100

score

0 500 1000 1500 2000

salary rural urban

020406080100

score

0 500 1000 1500 2000

salary rural urban

① ②

③ ④

(16)

前問の分析に加えて、さらに病院の病床数、モニタリングの対象になったか否かを示す ダミー変数を加えた重回帰分析を行った。これまでの分析結果は以下の表に要約されて いる。

第3列に示された分析結果について述べた①から⑤の記述に関し、誤っているものを一 つ選べ。必要に応じて下記のt分布表を参照すること。

① 平均年間給与額のt値は0.70である。

② 農村ダミーは、有意水準10%で有意である。

③ 病床数の95%信頼区間は0を含んでいない。

④ モニタリング対象病院ダミーのp値は0.1よりも大きい。

t分布表(自由度vの100%点、𝑡𝛼(𝑣))

(1) (2) (3)

平均年間給与額 0.0362 0.0015 0.0088 (0.007) (0.0131) (0.0127)

農村ダミー 39.17 24.86

(13.22) (14.09)

病床数 1.62

(0.80)

モニタリング対象病院ダミー -3.90

(5.41)

定数項 17.00 29.76 21.92

(8.15) (8.05) (9.26)

n 20 20 20

(自由度調整済)決定係数 0.59 0.70 0.74 注:カッコ内の値は標準誤差を示している。

10 1.372 1.812 2.228 2.764 3.169

11 1.363 1.796 2.201 2.718 3.106

12 1.356 1.782 2.179 2.681 3.055

13 1.350 1.771 2.160 2.650 3.012

14 1.345 1.761 2.145 2.624 2.977

15 1.341 1.753 2.131 2.602 2.947

16 1.337 1.746 2.120 2.583 2.921

17 1.333 1.740 2.110 2.567 2.898

18 1.330 1.734 2.101 2.552 2.878

19 1.328 1.729 2.093 2.539 2.861

20 1.325 1.725 2.086 2.528 2.845

0.1 0.05 0.025 0.01 0.005

自由度

(17)

問13

プロジェクト対象地域の現状を把握するために、保健省が発行する資料から妊産婦死亡 率、乳児死亡率、HIV有病率といった様々な疾病頻度に関する疫学指標の値を確認し た。疫学指標について述べた以下の①から④の記述のうち、正しいものを一つ選べ。

① 乳児死亡率は率と表記されているが理論的に割合に分類される。

② 割合は必ず0から1の間に分布をするが、比はマイナスの値を取ることもある。

③ 有病率は理論的にも率に分類される。

④ 割合は次元のない量となるが、率の次元は時間の‐1乗となる。

(18)

プロジェクト対象地域では、人口1万人のうち半数が安全な水へのアクセスを有してい る。同地域では下痢が広範に見られるが、下痢を発症している人の割合と安全な水への アクセスとの関係を調べたところ、以下の結果が得られた。

安全な水へのアクセス無群(水無群)に対するアクセス有群(水有群)のリスク比につ いて述べた①から⑤のうち、正しいものを一つ選べ。

① 水有群のリスクは0.143、水無群のリスクは0.305となるので、リスク比は0.47 となる。

② 水有群のリスクは0.072、水無群のリスクは0.153となるので、リスク比は0.47 となる。

③ 水有群のリスクは0.143、水無群のリスクは0.305となるので、リスク比は‐

0.162となる。

④ 水有群のリスクは0.167、水無群のリスクは0.439となるので、リスク比は0.38 となる。

⑤ 水有群のリスクは0.319、水無群のリスクは0.552となるので、リスク比は0.58 となる。

(人)

有 無

有 715 4285 無 1525 3475 安全な水への

アクセス

下痢症状

(19)

と考えられる石鹸による手洗い慣行(石鹸を用いている=1、用いていない=0)、家屋 外の共有トイレの使用(使用している=1、使用していない=0)、魚の摂取(摂取して いる=1、していない=0)に関する情報を収集した。安全な水へのアクセスとともに、

これらの変数を下痢のリスクファクターとするロジスティック回帰分析を行い、以下の ような推計値を得た。

推計結果について述べた①から④の記述のうち、最も適切なものを一つ選べ。

① 推計されたロジスティック回帰式は以下の通りである。

P(𝑑𝑖𝑎𝑟𝑟ℎ𝑒𝑎 = 1|𝑤𝑎𝑡𝑒𝑟, 𝑠𝑜𝑟𝑝, 𝑡𝑜𝑖𝑙𝑒𝑡, 𝑓𝑖𝑠ℎ)

(0.22 + 0.47𝑤𝑎𝑡𝑒𝑟 + 0.58𝑠𝑜𝑟𝑝 + 2.53𝑡𝑜𝑖𝑙𝑒𝑡 + 1.05𝑓𝑖𝑠ℎ)

② 魚の摂取のオッズ比は95%信頼区間に0を含んでいないので、統計的に有意であ る。

③ 石鹸による手洗い慣行のp値は0.05よりも小さい。

④ 共有トイレを使用していない人に比べ、使用している人の方が下痢の発症リスクは 小さいと考えられる。

オッズ比 標準誤差

安全な水へのアクセス 0.47 0.077 0.34 - 0.65 石鹸による手洗い慣行 0.58 0.094 0.43 - 0.80 家屋外の共有トイレの使用 2.53 0.751 1.41 - 4.52

魚の摂取 1.05 0.185 0.74 - 1.48

定数項 0.22 0.068 0.12 - 0.40

95%信頼区間

(20)

名前

統計学理解度確認課題 解答

Part 1

問1

問2

問3

問4

問5

問6

問7

問8 Part 2

問9

問10

問11

問12 Part 3 (Part3の回答は任意です)

問13

問14

問15

参照

関連したドキュメント

 神経内科の臨床医として10年以上あちこちの病院を まわり,次もどこか関連病院に赴任することになるだろ

学校に行けない子どもたちの学習をどう保障す

  「教育とは,発達しつつある個人のなかに  主観的な文化を展開させようとする文化活動

このような情念の側面を取り扱わないことには それなりの理由がある。しかし、リードもまた

子どもたちは、全5回のプログラムで学習したこと を思い出しながら、 「昔の人は霧ヶ峰に何をしにきてい

エッジワースの単純化は次のよう な仮定だった。すなわち「すべて の人間は快楽機械である」という

としても極少数である︒そしてこのような区分は困難で相対的かつ不明確な区分となりがちである︒したがってその

以上の基準を仮に想定し得るが︑おそらくこの基準によっても︑小売市場事件は合憲と考えることができよう︒