Python による機械学習は難しくない。

る。

講師が提示する 3- 4 つ程度の CQ から一つを選び、データベースを利用した研究をデザインする。グループディスカッション形式で、CQ を RQ に落とし込

10 Python による機械学習は難しくない。

2018 年 NDB・DPC データベース研究人材育成＜短期集中セミナー＞

理解度確認テスト

8 月 9 日「データベース管理システムからみた NDB」講師：原湖楠、小林廉毅ご所属（ご職業）を教えてください

医療・介護従事者

大学関係者

各種研究機関に勤務する研究者

企業に所属する者

医療政策の担当者

その他（

）

以下のうち、あなたに最も当てはまる役割を教えてください

ドメインエキスパート

データサイエンティスト

3. DBA

No Question ○ or ×

1 データベースを管理・運用し、外部からのアクセスを可能にするのが、データベース管理システムである。

2 ビッグデータを扱うのにはエクセルで十分である。

3 リレーショナルデータモデルは実体や関連を「テーブル」で表現し、実体間の関係を表すモデルである。

4 ビッグデータを分析する際に用いられるデータベースを RDBMS という。

5 一般的なデータベースでは、インデックスが設定されていない変数の検索は遅い。

6 一般的なストレージは、ストレージ側で検索を行っている。

7 データベースの管理・運用の専門家のことを、Database Administrator

（DBA）と呼ぶ。

8 ローカル開発環境を整備しておかないと、データにアクセス出来るサーバーが混み合って、研究の進行が阻害される。

9 複数人がソースコードを編集するような共同研究の際には、GitHub のようなツールを使ってバージョン管理を行わないと、複数人の編集したところが噛み合わず、エラーが発生したり、意図していない解析が実行されてしまったりする可能性が高まる。

10 データベースに格納されているデータを取り出すには、SQL で select 変数名等と打てば良いだけで容易であるので、統計の勉強をしたドメインエキスパートだけで問題なく研究を進めていくことが出来る。

8 月 10 日テーマ「ビッグデータ研究における統計解析：傾向スコア分析」

講師：山名隼人ご所属（ご職業）を教えてください

医療・介護従事者

大学関係者

各種研究機関に勤務する研究者

企業に所属する者

医療政策の担当者

その他（）

No Question Answer

1 傾向スコア分析では未測定の交絡因子の影響も調整できる。（〇 or ×）

2 傾向スコアの推定の際には、治療の選択を従属変数に投入する。

（〇 or ×）

3 傾向スコアを推定するモデルの c 統計量は、なるべく高いのがよい。（〇 or ×）

4 肺炎で入院した患者に対する薬 A と薬 B の比較を考えます。以下の変数 a˜e を、

①

傾向スコア推定に用いるのに適当なもの

②

傾向スコア推定に用いるのは不適切なものに分類してください。

また追加で入れるべき変数を 2 つ記入してください。

a. 年齢 b. 性別 c. 在院日数

d. 来院時意識障害 e. 薬 A に対するアレルギー

①適当なもの

②不適切なもの

追加

2018 年 NDB・DPC データベース研究人材育成＜短期集中セミナー＞

理解度確認テスト

8 月 10 日テーマ「SPSS を用いた傾向スコア分析」

講師：山名隼人・森田光治良ご所属（ご職業）を教えてください

医療・介護従事者

大学関係者

各種研究機関に勤務する研究者

企業に所属する者

医療政策の担当者

その他（）

No Question Answer

1 傾向スコアマッチングを行う前の、

治療群（ TreatmentX=1 ）とコントロール群

（TreatmentX=0）の人数をそれぞれ記入して下さい。

TreatmentX=1

TreatmentX=0

2 傾向スコアの推定に用いたロジスティック回帰モデルの c 統計量（ROC 曲線下面積）を記入して下さい。

3 傾向スコアを用いた１対１マッチングにより得られたペアの数を記入して下さい。

4 マッチング前とマッチング後の高血圧（HT）の割合 (%)を、治療群とコントロール群でそれぞれ記入して下さい。

マッチング前 TreatmentX=1

TreatmentX=0

マッチング後 TreatmentX=1

TreatmentX=0

8 月 10 日テーマ「Stata を用いた傾向スコア分析」

講師：道端伸明・麻生将太郎

ご所

属（ご職業）を教えてください

1. 医療・介護従事者 2. 大学関係者 3. 各種研究機関に勤務する研究者 4. 企業に所属する者 5. 医療政策の担当者

6. その他（）

No Question 回答欄

1 Stata を用いた日本語文字列操作は可能である。 ○ ・×

2 Stata は csv 形式のデータを読み込める。 ○ ・×

3 傾向スコアの推定には「」コマンドを使用する 4 傾向スコアマッチングにおいて傾向スコアが近い人は、

その背景因子がほぼ同じであることを意味する。

○ ・×

5 「」は、傾向スコアマッチングにおいて、マッチングするペアの傾向スコアの値の差が指定した値より大きい場合マッチさせないオプションである。

6 noreplacement (非復元抽出)は、傾向スコアマッチングのオプションで 1:1 マッチングでのみ指定可能である。

○ ・×

7 傾向スコアマッチング後は、解析対象患者数は「」。

減る・変わらない・増える 8 傾向スコアマッチングは、1:2 以上でマッチングさせること

も可能である。

○ ・×

9 傾向スコアマッチングでマッチング前後の独立変数のバランス確認は Standardized difference を用いる。

○ ・×

10 傾向スコアを用いたアウトカム比較には、傾向スコアマッチング以外にも層別化、回帰分析に変数として投入、逆確率による重み付けがある。

○ ・×

2018 年 NDB・DPC データベース研究人材育成＜短期集中セミナー＞

理解度確認テスト

8 月 10 日テーマ「ビッグデータ研究における統計解析—操作変数法」

講師：篠崎智大

ご所属（ご職業）を教えてください

医療・介護従事者

大学関係者

各種研究機関に勤務する研究者

企業に所属する者

医療政策の担当者

その他（）

No Question ○ or ×

操作変数推定法とは、測定されている交絡変数を調整するための統計手法

ドキュメント内 NDB ・ DPC 等データベース研究人材育成プログラムの開発 (ページ 35-40)

Python による機械学習 は 難 しくない。

る。

講師が提示する 3- 4 つ程度の CQ から一つを選び、データベースを利用した研 究をデザインする。グループディスカッション形式で、CQ を RQ に落とし込

10 Python による機械学習 は 難 しくない。

2018 年 NDB・DPC データベース研究人材育成＜短期集中セミナー＞

理解度確認テスト

8 月 9 日 「データベース管理システムからみた NDB」 講師：原 湖楠、小林 廉毅 ご所属（ご職業）を教えてください

医療・介護従事者

大学関係者

各種研究機関に勤務する研究者

企業に所属する者

医療政策の担当者

その他（

）

以下のうち、あなたに最も当てはまる役割を教えてください

ドメインエキスパート

データサイエンティスト

8 月 10 日 テーマ 「ビッグデータ研究における統計解析：傾向スコア分析」

講師： 山名隼人 ご所属（ご職業）を教えてください

医療・介護従事者

大学関係者

各種研究機関に勤務する研究者

企業に所属する者

医療政策の担当者

その他（ ）

①

②

2018 年 NDB・DPC データベース研究人材育成＜短期集中セミナー＞

理解度確認テスト

8 月 10 日 テーマ 「SPSS を用いた傾向スコア分析」

講師： 山名隼人・森田光治良 ご所属（ご職業）を教えてください

医療・介護従事者

大学関係者

各種研究機関に勤務する研究者

企業に所属する者

医療政策の担当者

その他（ ）

8 月 10 日 テーマ 「Stata を用いた傾向スコア分析」

講師：道端伸明・麻生将太郎

ご所

2018 年 NDB・DPC データベース研究人材育成＜短期集中セミナー＞

理解度確認テスト

8 月 10 日 テーマ 「ビッグデータ研究における統計解析—操作変数法」

講師：篠崎智大

ご所属（ご職業）を教えてください

医療・介護従事者

大学関係者

各種研究機関に勤務する研究者

企業に所属する者

医療政策の担当者

その他（ ）

操作変数推定法とは、測定されている交絡変数を調整するための統計手法

講師が提示する 3- 4 つ程度の CQ から一つを選び、データベースを利用した研究をデザインする。グループディスカッション形式で、CQ を RQ に落とし込

10 Python による機械学習は難しくない。

8 月 9 日「データベース管理システムからみた NDB」講師：原湖楠、小林廉毅ご所属（ご職業）を教えてください

8 月 10 日テーマ「ビッグデータ研究における統計解析：傾向スコア分析」

講師：山名隼人ご所属（ご職業）を教えてください

その他（）

8 月 10 日テーマ「SPSS を用いた傾向スコア分析」

講師：山名隼人・森田光治良ご所属（ご職業）を教えてください

その他（）

8 月 10 日テーマ「Stata を用いた傾向スコア分析」

8 月 10 日テーマ「ビッグデータ研究における統計解析—操作変数法」

その他（）