• 検索結果がありません。

Python による機械学習 は 難 しくない。

る。

講師が提示する 3- 4 つ程度の CQ から一つを選び、データベースを利用した研 究をデザインする。グループディスカッション形式で、CQ を RQ に落とし込

10  Python による機械学習 は 難 しくない。

   

54

2018 年 NDB・DPC データベース研究人材育成<短期集中セミナー> 

理解度確認テスト 

8 月 9 日  「データベース管理システムからみた NDB」  講師:原  湖楠、小林  廉毅  ご所属(ご職業)を教えてください

1.

医療・介護従事者   

2.

大学関係者   

3.

各種研究機関に勤務する研究者

4.

企業に所属する者   

5.

医療政策の担当者 

6.

その他( 

以下のうち、あなたに最も当てはまる役割を教えてください

1.

ドメインエキスパート   

2.

データサイエンティスト   

3. DBA

No  Question  ○  or  × 

データベースを管理・運用し、外部からのアクセスを可能にするのが、デー タベース管理システムである。 

 

ビッグデータを扱うのにはエクセルで十分である。   

リレーショナルデータモデルは実体や関連を「テーブル」で表現し、実体間 の関係を表すモデルである。 

 

ビッグデータを分析する際に用いられるデータベースを RDBMS という。   

一般的なデータベースでは、インデックスが設定されていない変数の検索 は遅い。 

 

一般的なストレージは、ストレージ側で検索を行っている。   

データベースの管理・運用の専門家のことを、Database  Administrator

(DBA)と呼ぶ。 

 

ローカル開発環境を整備しておかないと、データにアクセス出来るサーバ ーが混み合って、研究の進行が阻害される。 

 

複数人がソースコードを編集するような共同研究の際には、GitHub のよう なツールを使ってバージョン管理を行わないと、複数人の編集したところ が噛み合わず、エラーが発生したり、意図していない解析が実行されてしま ったりする可能性が高まる。 

 

10  データベースに格納されているデータを取り出すには、SQL で select  変数 名等と打てば良いだけで容易であるので、統計の勉強をしたドメインエキ スパートだけで問題なく研究を進めていくことが出来る。 

 

55

8 月 10 日  テーマ  「ビッグデータ研究における統計解析:傾向スコア分析」     

講師:  山名隼人  ご所属(ご職業)を教えてください

1.

医療・介護従事者   

2.

大学関係者   

3.

各種研究機関に勤務する研究者

4.

企業に所属する者   

5.

医療政策の担当者

6.

その他(      )

No  Question  Answer 

傾向スコア分析では未測定の交絡因子の影響も調整  できる。(〇  or  ×) 

 

傾向スコアの推定の際には、治療の選択を従属変数に投入する。

(〇  or  ×) 

 

傾向スコアを推定するモデルの c 統計量は、なるべく高いのが よい。(〇  or  ×) 

 

肺炎で入院した患者に対する薬 A と薬 B の比較を考えます。以 下の変数 a˜e を、 

傾向スコア推定に用いるのに適当なもの 

傾向スコア推定に用いるのは不適切なもの  に分類してください。 

また追加で入れるべき変数を 2 つ記入してください。 

 

a.  年齢    b.  性別    c.  在院日数 

d.  来院時意識障害      e.  薬 A に対するアレルギー   

適当なもの 

不適切なもの 

追加 

追加 

   

56

2018 年 NDB・DPC データベース研究人材育成<短期集中セミナー>   

理解度確認テスト 

8 月 10 日  テーマ  「SPSS を用いた傾向スコア分析」     

  講師:  山名隼人・森田光治良  ご所属(ご職業)を教えてください

1.

医療・介護従事者   

2.

大学関係者   

3.

各種研究機関に勤務する研究者

4.

企業に所属する者   

5.

医療政策の担当者

6.

その他(      )

No  Question  Answer 

傾向スコアマッチングを行う前の、 

治 療 群 ( TreatmentX=1 ) と コ ン ト ロ ー ル 群

(TreatmentX=0)の人数をそれぞれ記入して下さい。 

TreatmentX=1 

TreatmentX=0 

傾向スコアの推定に用いたロジスティック回帰モデ ルの c 統計量(ROC 曲線下面積)を記入して下さい。 

 

傾向スコアを用いた1対1マッチングにより得られ たペアの数を記入して下さい。 

 

マッチング前とマッチング後の高血圧(HT)の割合 (%)を、治療群とコントロール群でそれぞれ記入して 下さい。 

マッチング前  TreatmentX=1   

 

TreatmentX=0 

マッチング後  TreatmentX=1   

 

TreatmentX=0   

57

8 月 10 日  テーマ  「Stata を用いた傾向スコア分析」 

講師:道端伸明・麻生将太郎  

ご所

属(ご職業)を教えてください

1. 医療・介護従事者    2. 大学関係者    3. 各種研究機関に勤務する研究者 4. 企業に所属する者    5. 医療政策の担当者

6. その他(      )

No  Question  回答欄 

Stata を用いた日本語文字列操作は可能である。   ・× 

Stata は csv 形式のデータを読み込める。   ・× 

傾向スコアの推定には「      」コマンドを使用する    傾向スコアマッチングにおいて傾向スコアが近い人は、 

その背景因子がほぼ同じであることを意味する。 

○  ・× 

「        」は、傾向スコアマッチングにおいて、マッチン グするペアの傾向スコアの値の差が指定した値より大きい 場合マッチさせないオプションである。 

 

noreplacement (非復元抽出)は、傾向スコアマッチングのオ プションで 1:1 マッチングでのみ指定可能である。 

○  ・× 

傾向スコアマッチング後は、解析対象患者数は「    」。 

減る  ・変わらない・増える  傾向スコアマッチングは、1:2 以上でマッチングさせること

も可能である。 

○  ・× 

傾向スコアマッチングでマッチング前後の独立変数のバラ ンス確認は Standardized difference を用いる。 

○  ・× 

10  傾向スコアを用いたアウトカム比較には、傾向スコアマッチ ング以外にも層別化、回帰分析に変数として投入、逆確率に よる重み付けがある。 

○  ・× 

   

58

2018 年 NDB・DPC データベース研究人材育成<短期集中セミナー>   

理解度確認テスト 

8 月 10 日  テーマ  「ビッグデータ研究における統計解析—操作変数法」   

講師:篠崎智大 

ご所属(ご職業)を教えてください

1.

医療・介護従事者   

2.

大学関係者   

3.

各種研究機関に勤務する研究者

4.

企業に所属する者   

5.

医療政策の担当者

6.

その他(      )

No  Question  ○  or  × 

操作変数推定法とは、測定されている交絡変数を調整するための統計手法