• 検索結果がありません。

DPC 分析用データセットの作成・開発について

N/A
N/A
Protected

Academic year: 2021

シェア "DPC 分析用データセットの作成・開発について"

Copied!
20
0
0

読み込み中.... (全文を見る)

全文

(1)

平成 30 年度厚生労働行政推進調査事業補助金 政策科学総合研究事業(政策科学推進事業)

「診断群分類を用いた急性期等の入院医療の評価とデータベース利活用に関する研究」

分担研究報告書

DPC 分析用データセットの作成・開発について

堀口 裕正 国立病院機構本部総合研究センター 診療情報分析部 副部長

研究要旨

本研究班において、収集した DPC データは、データセットの量が大きく、一般的な研究 者が保有する分析環境(コンピュータの能力やデータを保管するストレージの量等)では 処理が行えない状況となっている。また、その膨大なデータのうち、矛盾するレコードや、

研究で使用するには留意が必要なデータも混じっている。

そこで、いくつかのデータ処理を行うことによって、データを分析可能なものに絞り込 み、さらに分析に必要な様々な処理を加えてデータセットを作成し、さまざまな研究が実 施しやすい環境を構築することを行った。

本年度、平成 22 年~29 年のデータについては新たに利用承諾がとれた医療機関のデータ を加えて、分析用データセットの再作成を行うとともに、平成 30 年のデータについて分析 用のデータセットの作成を行い、分析に供することができた。その際、キー情報の重複や 必要なデータの欠損のある症例などは、分析に影響度が大きいので、それらの症例情報に ついては確実に除去を行った。

このデータセットの完成で、DPC データの精度を向上させ、より高度な分析を実施すること が可能となると考えられる。

A. 目的

本研究班において、収集した

DPC

データ は 、 ま ず 基 本 調 査 と し て 入 院 情 報 の

D/E/F/H

ファイル・様式

1・3・4

ファイル

(以下それぞれ

FF1/FF3/FF4

ファイルと 表記)と多岐にわたっている。また各病院 のデータ収集が通年化され収集時期の範囲 も広く、多数の医療機関が参加している。

さらに、付随する調査として

ICU/ER・リ

ハビリ・

CP・外来機能といった各種調査が

付随し、それぞれが、基本調査の集計デー タを分析にあたって必要としている。

平成

29

3

月現在、本研究班では平成

15

年度調査から平成

29

年度調査までの

14

年度の調査データを医療機関との契約の元 で保有し、分析に活用しているが、平成

30

年調査データの分量はすべてテキストのデ ータで、1TBを超えた量となっており、一

(2)

般的な研究者が保有する分析環境(コンピ ュータの能力やデータを保管するストレー ジの量等)では処理が行えない状況となっ ている。

そこで、本研究では、平成

21

年度より本 研究班の保有する

DPC

調査データから、

1、 利用できるデータを選択し、

2、 その

1

1

つのデータが研究に利 用する際に留意すべきポイントがあ るかをチェックして情報を付加し 3、 分析に必要な情報を容易にとりだ

せるよう用途別に分割し、

さまざまな統計処理を行うための数値 を計算しやすいよう整理して共通分析用 データセットとして作成し、本研究班に おいてより精度の高い、高度な分析を行 うための環境を整備することを試みてい る。本年度は平成

30

年度(12ヶ月)分のデ ータを通年で

1

つのデータセットとして 取り扱い、各種の分析処理を行うことが 出来る基盤作成を目的とした。

B. 方法

以下の処理を、研究班保有の

DPC

データ に対して行い、分析用データセットを作成 することとした。

1、データの取り込み

参加医療機関から提供された

DPC

デー タ(FF1/3/4/D/E/F/H/外来ファイル)を

DB

に取り込む。その際、平成

26

年度データか らの様式

1

ファイル縦持ち化に対応した処 理を追加した。また、平成

28

年度のフォー マット改正および

H

ファイルの追加に伴う 処理を追加した。

2、エラーチェック

提出されたデータのエラーチェックを行

い、エラーデータをデータセット内から除 外する。また研究に使用する際留意する項 目に対してチェックしフラグを付与する。

どのような条件についてエラー・留意と するかについては本年の研究として検討を 行う。

3、DPCコード情報の一体的保有

平成

20

年度「DPC松田研究班版

DPC

コ ーダーの開発について」で作成した

DPC

コ ーディングツールを利用した

DPC

コード を分析用データセット内に取り込み、他の データと一体的に保有する

以上の処理を行い、分析用データセットを 作成する。

分析用データセットには次のファイルが含 まれる

(A)

拡張

FF1

様式

1

(FF1)情 報に留意フラグ等の情報を付加し たもの

(B)

統合

E

ファイル E ファイルに退 院日及び期間内入院回数を付加し たもの

(C)

統合

F

ファイル F ファイルに退 院日・実施日等を付加したもの

(D) 疑似 D

ファイル D ファイル作成

ルールに基づいて擬似的に

D

ファ イルを生成

(E)

診療明細データ 統合

E

ファイル の点数部分を金額に置き換えたも の

(F)

行為明細データ 統合

F

ファイル の点数部分を金額に置き換えたも の

(G) DPC

年度毎情報 運用時期別に生

成された

DPC

コード情報

(3)

(H) FF4

様式

4

(J)

実施手術

F

ファイルから 手術関係のレコードのみを抽出し たもの

(K) 実施処置 F

ファイルから

処置・薬剤関係のレコードのみを抽

出したもの

(L)

年度別手術コード 手術コードを診 療報酬の運用年度別に変換したも の

尚、データ処理のフローは下に示す図のと おりである。

研究用データ加工フロー全体図

FF1

・病院属性等

・データ属性等

・診断情報(傷病情報)

・手術情報

・診療情報

拡張FF1作

(ア)拡張FF1仮

・病院属性等

・データ属性等

・診断情報(傷病情報)

・手術情報

・診療情報

・入院通番

・前回入院情報

・次回入院情報

・データチェック結果情報

Eファイル

(*)キー情報

・日付正規化前

施設コード+データ識別番号+入院年月日

・日付正規化後

施設コード+データ識別番号+入院通番 Fファイル

手術マスター 処置マスター 薬剤マスター

(カ)実施手術仮

・キー情報(*)

・点数表コード

・レセ電算コード

・実施日

(キ)実施処置仮

・キー情報(*)

・点数表コード、ダミーコード

・レセ電算コード

・実施日

(エ)診療明細データ仮

・Eファイル情報

(退院日を補完)

(点数は全て金額に換算)

(オ)行為明細データ仮

・Fファイル情報

(退院日を補完)

(点数は全て金額に換算)

・包括出来高振り分け情報

擬似Dファイル作成 (コ)擬似Dファイル仮

・キー情報(*)

・DPC年度

・包括算定部分情報

・出来高算定部分情報 (ケ)DPC年度毎情報仮

・キー情報(*)

・DPC年度

・DPCコード

・DPC基本コード

入院通番付与

留意フラグ付与 (カ)実施手術仮

(キ)実施処置仮 (ク)年度別手術コード仮

(A)拡張FF1

・病院属性等

・データ属性等

・診断情報(傷病情報)

・手術情報

・診療情報

・入院通番

・前回入院情報

・次回入院情報

・データチェック結果情報 (B)統合Eファイル

・Eファイル情報

(退院日を補完)

(C)統合Fファイル

・Fファイル情報

(退院日を補完)

・実施日 (D)擬似Dファイル

・キー情報(*)

・DPC年度

・包括算定部分情報

・出来高算定部分情報

(E)診療明細データ

・Eファイル情報

(退院日を補完)

(点数は全て金額に換算)

・入院通番 FF4

(H)FF4

(I)FF3 FF3 (Excel)

原本データ

最終生成データ

実施手術処 置抽出

1

(G)DPC年度毎情報

・キー情報(*)

・DPC年度

・手術コード情報(由来含)

・DPCコード

・DPC要素 (F)行為明細データ

・Fファイル情報

(退院日を補完)

(点数は全て金額に換算)

・包括出来高振分情報

・入院通番 FF4

①.

キーデータ重複チェック エラーデータ除外

(A)~(L)は最終提供テーブル (ア)~(コ)は作業用中間テーブル

(イ)統合Eファイル仮 (ウ)統合Fファイル仮 (エ)診療明細データ仮 (オ)行為明細データ仮

DPC定義マスタ

(電子点数表)

除外デー タFF1

DPCコー ダーから

(ク)年度別手術コード仮

・キー情報(*)

・手術インデックス

・DPC年度

・点数表コード

・レセ電算コード

・実施日

・回数、側数、麻酔

・由来フラグ(FF1,Fファイル)

年度別手術 コード変換 Kコードリンク マスター

(イ)統合Eファイル仮

・Eファイル情報

(退院日を補完)

(ウ)統合Fファイル仮

・Fファイル情報

(退院日を補完)

・実施日

全月分マージ 退院日補完 実施日補完

診療明細、行 為明細作成

(J)実施手術 (K)実施処置 (L)年度別

手術コード

C.結果

本年度の研究期間においては平成

29

年度 時点で伏見班保有のデータに対して

B.方法

で示した処理を行なうと同時に平成30年 度データについても収集が終わった分につ いて仮処理をおこなった。

以下特記すべき事項に関して記載する。

1、エラーチェックについて

本研究データセット作成については、以 下のルールの下で、データエラーチェック および留意フラグ付与を行った。

(4)

1

エラーチェック仕様 No 理(NG 条件

対象 ータ種別備考ラグ内容 1 ERR010

FF1 重複し

FF1縦にて「施設コ 識別 番号+入院年月 +回数管理番号 診療情報番号+ 連番重複 去のFF1 複も

FF1 FF1T

FF1除外FF1ルに、エ報と格納し、以 降の処理には使用し 様式1(診療情報番号=0がエ場合、子様式1(診療情報番号1)のレ 一緒 様式1の重複は該当の子1み除外親様式1の子式1に 影響を及ぼさ 「日帰り入退院+同一日再入帰り入退院+日帰り入退場合は 同一日再入初の日帰り入院を採用数管理番号が最小のみ 採用。この場ERR010なく、ERR220、非採用の様式1情報の 除外と

(5)

2 ERR020

FF4 重複し

FF4設コ 識別 号+入院年月日 が重複

FF4 FF1除外FF1ルに、エ報と格納し、以 降の処理には使用し 様式1と様式1の両方を除外。(過去に仮確定し子様式1。) 3 ERR030

Eイル 重複 いる

Eイル 別番号院年 日+区分+ 順序番号+該当 月」が重

E

FF1除外FF1ルに、エ報と格納し、以 降の処理には使用し 様式1と様式1の両方を除外。(過去に仮確定し子様式1。) 4 ERR040

Fイル 重複 いる

Fフルの 別番号+入院年 日+区分+ 順序番号+行為 細番号+該当月 が重複

F

FF1除外FF1ルに、エ報と格納し、以 降の処理には使用し 様式1と様式1の両方を除外。(過去に仮確定し子様式1。)

(6)

5 ERR050

EF合フ ルの 複し

EF合フルの 設コ 識別番号+入 年月日 分+順序番号+ 為明細番号+該 月」が重

EF統合FF1除外FF1ルに、エ報と格納し、以 降の処理には使用し 様式1と様式1の両方を除外。(過去に仮確定し子様式1。) 6 ERR060

外来E ルの 複し

外来Eルの 設コ 識別番号+入 年月日 分+順序番号+ 当月重複

外来EFF1除外FF1ルに、エ報と格納し、以 降の処理には使用し 様式1と様式1の両方を除外。(過去に仮確定し子様式1。) 7 ERR070

外来Fイル のキが重

外来Fルの 設コ 識別番号+入 年月日 分+順序番号+ 為明細番号+該 」が重

外来FFF1除外FF1ルに、エ報と格納し、以 降の処理には使用し 様式1と様式1の両方を除外。(過去に仮確定し子様式1。)

(7)

ERR080

Dイルのキ 重複 いる

Dイルの「施設 +デ 番号+院年月日+ 区分+順序 番号重複

D

FF1除外FF1ルに、エ報と格納し、以 降の処理には使用し 様式1と様式1の両除外。(過去に仮確定し子様式1。) ERR090

Hイルのキ 重複 いる

Hルの +棟コ+ 識別番号+ 退院年月日+入院 年月日+実施年月 ++ +重複

H

FF1除外FF1ルに、エ報と格納し、以 降の処理には使用し 様式1と様式1の両方を除外。(過去に仮確定し子様式1。)

(8)

8 ERR110

在院日数が 日未満である

入院日>退院日FF1 FF1T

除外FF1を除FF1ルに、エ報と格納し 以降の処理使用し 様式1(診療情報番号=0がエ場合、子様式1(診療情報番号1)のレ 一緒 様式1のエラーの場合は、該当子様式1は除、親様式1他の子 式1は除外し 様式1で退院日が'00000000'である場合は、許親様式1はこのエ る。 9 ERR120

入院時年齢 0歳未満で

生年月日>入院FF1 FF1T

除外FF1を除FF1ルに、エ報と格納し 以降の処理使用し 様式1(診療情報番号=0がエ場合、子様式1(診療情報番号1)のレ 一緒去に確定た子様式1 様式1のエラーの場合は、該当子様式1は除、親様式1他の子 式1は除外し

(9)

10ERR130

年月日が誤

実在し月日 131日、732 日な SQLserver datetime型で扱え 付(17531 1以前

ALL FF1T も)

除外FF1を除FF1ルに、エ報と格納し 以降の処理使用し 象は全ての日付情報と くまで実在し月日のチのみであり、手術日が入院日と退院の間に か、などの相関チは行わな '00000000'は許 様式1(診療情報番号=0がエ場合、子様式1(診療情報番号1)のレ 一緒去に確定た子様式1 様式1のエラーの場合は、該当子様式1は除、親様式1他の子 式1は除外し 式1開始日、様式1終了日をチ象に加。 回退院年月日は日00記を共用し本チの対象外と る。 11ERR140 番) 12ERR150 番) 13ERR160

統括診療情 番号が異常 ある 日以内再入 院集約

統括診療情報番 が0以上の数字 ない

FF1 FF1T

除外のエ除外より最初に定す FF1を除FF1ルに、エ報と格納し 以降の処理使用し

(10)

ド) 14ERR170

様式1対象 間が1日未 である

様式1開始日> 式1終了日

FF1 FF1T

除外FF1を除FF1ルに、エ報と格納し 以降の処理使用し 様式1(診療情報番号=0がエ場合、子様式1(診療情報番号1)のレ 一緒 様式1のエラーの場合は、該当子様式1は除、親様式1他の子 式1は除外し 15ERR180

親様式1に て様式1開 始日、様式 終了日が入 日、退院日 一致し

統括診療情報番 =0 かつ式1 開始日が入院年 日と致し たは式1終了日 が退院年月日と 致し

FF1 FF1T

除外FF1を除FF1ルに、エ報と格納し 以降の処理使用し 様式1(診療情報番号=0がエ場合、子様式1(診療情報番号1)のレ 一緒去に確定た子様式1 様式1のエラーの場合は、該当子様式1は除、親様式1他の子 式1は除外し

(11)

16ERR190

様式1開始 が入院退 の範囲であ

様式1開始日< 院年月 また 様式1開始 退院年月日

FF1 FF1T

除外FF1を除FF1ルに、エ報と格納し 以降の処理使用し 様式1(診療情報番号=0がエ場合、子様式1(診療情報番号1)のレ 一緒 様式1のエラーの場合は、該当子様式1は除、親様式1他の子 式1は除外し 17ERR200

様式1終了 が入院退 の範囲であ

様式1終了日< 院年月 また 様式1終了 退院年月日

FF1 FF1T

除外FF1を除FF1ルに、エ報と格納し 以降の処理使用し 様式1(診療情報番号=0がエ場合、子様式1(診療情報番号1)のレ 一緒 様式1のエラーの場合は、該当子様式1は除、親様式1他の子 式1は除外し

(12)

ERR210

回数管理番 が異常である

回数管理番号が 以上の数字

FF1T除外のエ除外より最初に定す FF1を除FF1ルに、エ報と格納し 以降の処理使用し ERR220

同じ院日 入院が複数 在す

回数管理番号が 数存在 最小の回数管理 号のみの様式1 報のみ採用し 他の回数管理番 の様式1情報は ERR220て除

FF1T除外FF1を除FF1ルに、エ報と格納し 以降の処理使用し 20_FF1_キ重複チ でチ施。 18ERR510

EイルF イルが不 整合であるF イル が非存であ る)

Eイルの各 、同じ 月のFルに 設コ 識別番号+入 院年月日+ 区分+順序番号 を持つが存

E ル、F

ラグ様式1(診療情報番号=0みチ対象 様式1(診療情報≧1はチ象外。フラグ0を設定す

0:無し 1:Fイル欠落有り

(13)

在し 19ERR520

EイルF イルが不 整合であるE イル 非存在であ る)

Fイルの各 、同じ 月のEルに 同じ「施設 識別番号+ 入院年月日 区分+順序番 号」を持つレ が存在

E ル、F

ラグ様式1(診療情報番号=0みチ対象 様式1(診療情報番号≧1はチ象外。フラグ0を設定す

0:無し 1:Eイル欠落有り 20ERR530

入院期間外 EF 存在 する

Eルの実施 FF1入院 たは FF1退院 日<Eルの 施日

FF1,E ル、 統合E イル

ラグ様式1(診療情報番号=0みチ対象 様式1(診療情報番号≧1はチ象外。フラグ0を設定す

0:無し 1:入院期間外E

参照

関連したドキュメント

(2)対象者情報(対象になると見込まれる者の情報)は、

報も大量に生み出され、質の高い情報を見つけ出

はじめに

はじめに • 筒井浩平氏 「Android端末でのARアプリケーションの開発」 (平成23年度卒業研究) →AR技術に関心を持った • AR(Augmented Reality)

2006+ Dataset の作成に使用され,現在も稼働し続けているハニーポットのデータを使用して新たに Kyoto

れている wine regognition data というイタリアのワイン 関するデータを用いて自作プログラムの動作確認を行っ た.これは 178

子宮頚がん検診におけるベセスダシステムの導入 子宮頚がん検診におけるベセスダシステムの導入 < < 背景 背景 > >

表 -4 には,比較のために赤井川を除外したモデルに 加え,最も RMSE が小さい,即ちモデルの再現性が最