る。
講師が提示する 3- 4 つ程度の CQ から一つを選び、データベースを利用した研 究をデザインする。グループディスカッション形式で、CQ を RQ に落とし込
10 Python による機械学習 は 難 しくない。
54
2018 年 NDB・DPC データベース研究人材育成<短期集中セミナー>
理解度確認テスト
8 月 9 日 「データベース管理システムからみた NDB」 講師:原 湖楠、小林 廉毅 ご所属(ご職業)を教えてください
1.
医療・介護従事者
2.大学関係者
3.各種研究機関に勤務する研究者
4.企業に所属する者
5.医療政策の担当者
6.その他(
)
以下のうち、あなたに最も当てはまる役割を教えてください
1.
ドメインエキスパート
2.データサイエンティスト
3. DBANo Question ○ or ×
1 データベースを管理・運用し、外部からのアクセスを可能にするのが、デー タベース管理システムである。
2 ビッグデータを扱うのにはエクセルで十分である。
3 リレーショナルデータモデルは実体や関連を「テーブル」で表現し、実体間 の関係を表すモデルである。
4 ビッグデータを分析する際に用いられるデータベースを RDBMS という。
5 一般的なデータベースでは、インデックスが設定されていない変数の検索 は遅い。
6 一般的なストレージは、ストレージ側で検索を行っている。
7 データベースの管理・運用の専門家のことを、Database Administrator
(DBA)と呼ぶ。
8 ローカル開発環境を整備しておかないと、データにアクセス出来るサーバ ーが混み合って、研究の進行が阻害される。
9 複数人がソースコードを編集するような共同研究の際には、GitHub のよう なツールを使ってバージョン管理を行わないと、複数人の編集したところ が噛み合わず、エラーが発生したり、意図していない解析が実行されてしま ったりする可能性が高まる。
10 データベースに格納されているデータを取り出すには、SQL で select 変数 名等と打てば良いだけで容易であるので、統計の勉強をしたドメインエキ スパートだけで問題なく研究を進めていくことが出来る。
55
8 月 10 日 テーマ 「ビッグデータ研究における統計解析:傾向スコア分析」
講師: 山名隼人 ご所属(ご職業)を教えてください
1.
医療・介護従事者
2.大学関係者
3.各種研究機関に勤務する研究者
4.企業に所属する者
5.医療政策の担当者
6.
その他( )
No Question Answer
1 傾向スコア分析では未測定の交絡因子の影響も調整 できる。(〇 or ×)
2 傾向スコアの推定の際には、治療の選択を従属変数に投入する。
(〇 or ×)
3 傾向スコアを推定するモデルの c 統計量は、なるべく高いのが よい。(〇 or ×)
4 肺炎で入院した患者に対する薬 A と薬 B の比較を考えます。以 下の変数 a˜e を、
①
傾向スコア推定に用いるのに適当なもの②
傾向スコア推定に用いるのは不適切なもの に分類してください。また追加で入れるべき変数を 2 つ記入してください。
a. 年齢 b. 性別 c. 在院日数
d. 来院時意識障害 e. 薬 A に対するアレルギー
①適当なもの
②不適切なもの
追加
追加
56
2018 年 NDB・DPC データベース研究人材育成<短期集中セミナー>
理解度確認テスト
8 月 10 日 テーマ 「SPSS を用いた傾向スコア分析」
講師: 山名隼人・森田光治良 ご所属(ご職業)を教えてください
1.
医療・介護従事者
2.大学関係者
3.各種研究機関に勤務する研究者
4.企業に所属する者
5.医療政策の担当者
6.
その他( )
No Question Answer
1 傾向スコアマッチングを行う前の、
治 療 群 ( TreatmentX=1 ) と コ ン ト ロ ー ル 群
(TreatmentX=0)の人数をそれぞれ記入して下さい。
TreatmentX=1
TreatmentX=0
2 傾向スコアの推定に用いたロジスティック回帰モデ ルの c 統計量(ROC 曲線下面積)を記入して下さい。
3 傾向スコアを用いた1対1マッチングにより得られ たペアの数を記入して下さい。
4 マッチング前とマッチング後の高血圧(HT)の割合 (%)を、治療群とコントロール群でそれぞれ記入して 下さい。
マッチング前 TreatmentX=1
TreatmentX=0
マッチング後 TreatmentX=1
TreatmentX=0
57
8 月 10 日 テーマ 「Stata を用いた傾向スコア分析」
講師:道端伸明・麻生将太郎
ご所
属(ご職業)を教えてください1. 医療・介護従事者 2. 大学関係者 3. 各種研究機関に勤務する研究者 4. 企業に所属する者 5. 医療政策の担当者
6. その他( )
No Question 回答欄
1 Stata を用いた日本語文字列操作は可能である。 ○ ・×
2 Stata は csv 形式のデータを読み込める。 ○ ・×
3 傾向スコアの推定には「 」コマンドを使用する 4 傾向スコアマッチングにおいて傾向スコアが近い人は、
その背景因子がほぼ同じであることを意味する。
○ ・×
5 「 」は、傾向スコアマッチングにおいて、マッチン グするペアの傾向スコアの値の差が指定した値より大きい 場合マッチさせないオプションである。
6 noreplacement (非復元抽出)は、傾向スコアマッチングのオ プションで 1:1 マッチングでのみ指定可能である。
○ ・×
7 傾向スコアマッチング後は、解析対象患者数は「 」。
減る ・変わらない・増える 8 傾向スコアマッチングは、1:2 以上でマッチングさせること
も可能である。
○ ・×
9 傾向スコアマッチングでマッチング前後の独立変数のバラ ンス確認は Standardized difference を用いる。
○ ・×
10 傾向スコアを用いたアウトカム比較には、傾向スコアマッチ ング以外にも層別化、回帰分析に変数として投入、逆確率に よる重み付けがある。
○ ・×
58
2018 年 NDB・DPC データベース研究人材育成<短期集中セミナー>
理解度確認テスト
8 月 10 日 テーマ 「ビッグデータ研究における統計解析—操作変数法」
講師:篠崎智大
ご所属(ご職業)を教えてください
1.
医療・介護従事者
2.大学関係者
3.各種研究機関に勤務する研究者
4.企業に所属する者
5.医療政策の担当者
6.
その他( )
No Question ○ or ×
1