• 検索結果がありません。

DPC 分析用データセットの作成・開発について 研究分担者

N/A
N/A
Protected

Academic year: 2021

シェア "DPC 分析用データセットの作成・開発について 研究分担者"

Copied!
20
0
0

読み込み中.... (全文を見る)

全文

(1)

令和元年度厚生労働行政推進調査事業補助金 政策科学総合研究事業(政策科学推進事業)

「診断群分類を用いた急性期等の入院医療の評価とデータベース利活用に関する研究」

分担研究報告書

DPC 分析用データセットの作成・開発について

研究分担者 堀口 裕正 国立病院機構本部総合研究センター 診療情報分析部 副部長

研究要旨

本研究班において、収集したDPCデータは、データセットの量が大きく、一般的な研究 者が保有する分析環境(コンピュータの能力やデータを保管するストレージの量等)では 処理が行えない状況となっている。また、その膨大なデータのうち、矛盾するレコードや、

研究で使用するには留意が必要なデータも混じっている。

そこで、いくつかのデータ処理を行うことによって、データを分析可能なものに絞り込 み、さらに分析に必要な様々な処理を加えてデータセットを作成し、さまざまな研究が実 施しやすい環境を構築することを行った。

本年度、平成30年のデータについては新たに利用承諾がとれた医療機関のデータを加え て、分析用データセットの再作成を行うとともに、令和元年のデータについて分析用のデ ータセットの作成を行い、分析に供することができた。その際、キー情報の重複や必要な データの欠損のある症例などは、分析に影響度が大きいので、それらの症例情報について は確実に除去を行った。また、令和2年度からのデータセットの変更に伴う検討を行なっ た。

このデータセットの完成で、DPCデータの精度を向上させ、より高度な分析を実施するこ とが可能となると考えられる。

A.

目的

本研究班において、収集したDPCデータ は 、 ま ず 基 本 調 査 と し て 入 院 情 報 の D/E/F/Hファイル・様式134ファイル

(以下それぞれ FF1/FF3/FF4 ファイルと 表記)と多岐にわたっている。また各病院 のデータ収集が通年化され収集時期の範囲 も広く、多数の医療機関が参加している。

さらに、付随する調査として ICU/ER・リ ハビリ・CP・外来機能といった各種調査が 付随し、それぞれが、基本調査の集計デー タを分析にあたって必要としている。

平成 313 月現在、本研究班では平成 15年度調査から平成30年度調査までの15 年度の調査データを医療機関との契約の元 で保有し、分析に活用しているが、令和元

年調査データの分量はすべてテキストのデ

ータで、1.5TB を超えた量となっており、

一般的な研究者が保有する分析環境(コン ピュータの能力やデータを保管するストレ ージの量等)では処理が行えない状況とな っている。

そこで、本研究では、平成21年度より本 研究班の保有するDPC調査データから、

1、 利用できるデータを選択し、

2、 その11つのデータが研究に利用 する際に留意すべきポイントがある かをチェックして情報を付加し 3、 分析に必要な情報を容易にとりだせ

るよう用途別に分割し、

さまざまな統計処理を行うための数値

(2)

を計算しやすいよう整理して共通分析用 データセットとして作成し、本研究班に おいてより精度の高い、高度な分析を行 うための環境を整備することを試みてい る。本年度は平成 30 年度〜令和元年度 (24

ヶ月)分のデータを通年で1つのデータセッ トとして取り扱い、各種の分析処理を行う ことが出来る基盤作成を目的とした。

B.

方法

以下の処理を、研究班保有のDPCデータ に対して行い、分析用データセットを作成 することとした。

1、データの取り込み

参加医療機関から提供された DPC デー タ(FF1/3/4/D/E/F/H/外来ファイル)をDB に取り込む。

2、エラーチェック

提出されたデータのエラーチェックを行 い、エラーデータをデータセット内から除 外する。また研究に使用する際留意する項 目に対してチェックしフラグを付与する。

どのような条件についてエラー・留意と するかについては本年の研究として検討を 行う。

3、DPCコード情報の一体的保有

平成20年度「DPC松田研究班版DPCコ ーダーの開発について」で作成したDPCコ ーディングツールを利用した DPC コード を分析用データセット内に取り込み、他の データと一体的に保有する

以上の処理を行い、分析用データセットを

作成する。

分析用データセットには次のファイルが含 まれる

(A) 拡張FF1 様式1FF1)情 報に留意フラグ等の情報を付加し たもの

(B) 統合Eファイル E ファイルに退

院日及び期間内入院回数を付加し たもの

(C) 統合Fファイル F ファイルに退

院日・実施日等を付加したもの

(D) 疑似Dファイル D ファイル作成

ルールに基づいて擬似的に D ファ イルを生成

(E) 診療明細データ 統合Eファイル の点数部分を金額に置き換えたも の

(F) 行為明細データ 統合Fファイル の点数部分を金額に置き換えたも の

(G) DPC年度毎情報 運用時期別に生

成されたDPCコード情報 (H) FF4 様式4

(J) 実施手術 F ファイルから 手術関係のレコードのみを抽出し たもの

(K) 実施処置 F ファイルから

処置・薬剤関係のレコードのみを抽 出したもの

(L) 年度別手術コード手術コードを診 療報酬の運用年度別に変換したも の

尚、データ処理のフローは下に示す図のと おりである。

(3)

研究用データ加工フロー全体図

FF1

・病院属性等

・データ属性等

・診断情報(傷病情報)

・手術情報

・診療情報

拡張FF1作

(ア)拡張FF1仮

・病院属性等

・データ属性等

・診断情報(傷病情報)

・手術情報

・診療情報

・入院通番

・前回入院情報

・次回入院情報

・データチェック結果情報

Eファイル

(*)キー情報

・日付正規化前

施設コード+データ識別番号+入院年月日

・日付正規化後

施設コード+データ識別番号+入院通番 Fファイル

手術マスター 処置マスター 薬剤マスター

(カ)実施手術仮

・キー情報(*)

・点数表コード

・レセ電算コード

・実施日

(キ)実施処置仮

・キー情報(*)

・点数表コード、ダミーコード

・レセ電算コード

・実施日

(エ)診療明細データ仮

・Eファイル情報

(退院日を補完)

(点数は全て金額に換算)

()行為明細データ仮

・Fファイル情報

(退院日を補完)

(点数は全て金額に換算)

・包括出来高振り分け情報

擬似Dファイル作成 (コ)擬似Dファイル仮

・キー情報(*)

・DPC年度

・包括算定部分情報

・出来高算定部分情報 (ケ)DPC年度毎情報仮

・キー情報(*)

・DPC年度

・DPCコード

・DPC基本コード

入院通番付与

留意フラグ付与 (カ)実施手術仮

(キ)実施処置仮 (ク)年度別手術コード仮

(A)拡張FF1

・病院属性等

・データ属性等

・診断情報(傷病情報)

・手術情報

・診療情報

・入院通番

・前回入院情報

・次回入院情報

・データチェック結果情報 (B)統合Eファイル

・Eファイル情報

(退院日を補完)

(C)統合Fファイル

・Fファイル情報

(退院日を補完)

・実施日 (D)擬似Dファイル

・キー情報(*)

・DPC年度

・包括算定部分情報

・出来高算定部分情報

(E)診療明細データ

・Eファイル情報

(退院日を補完)

(点数は全て金額に換算)

・入院通番 FF4

(H)FF4

()FF3 FF3 (Excel)

原本データ

最終生成データ

実施手術処 置抽出

1デ

同一

(G)DPC年度毎情報

・キー情報(*)

・DPC年度

・手術コード情報(由来含)

・DPCコード

・DPC要素 (F)行為明細データ

・Fファイル情報

(退院日を補完)

(点数は全て金額に換算)

・包括出来高振分情報

・入院通番 FF4

①.

キーデータ重複チェック エラーデータ除外

(A)~(L)は最終提供テーブル (ア)~(コ)は作業用中間テーブル

(イ)統合Eファイル仮 (ウ)統合Fファイル仮 (エ)診療明細データ仮 (オ)行為明細データ仮

DPC定義マスタ

(電子点数表)

除外デー タFF1

DPCコー ダーから

(ク)年度別手術コード仮

・キー情報(*)

・手術インデックス

・DPC年度

・点数表コード

・レセ電算コード

・実施日

・回数、側数、麻酔

・由来フラグ(FF1,Fファイル)

年度別手術 コード変換 Kコードリンク マスター

(イ)統合Eファイル仮

・Eファイル情報

(退院日を補完)

(ウ)統合Fファイル仮

・Fファイル情報

(退院日を補完)

・実施日

全月分マージ 退院日補完 実施日補完

診療明細、行 為明細作成

(J)実施手術 (K)実施処置 (L)年度別

手術コード

C.

結果

本年度の研究期間においては平成 30 年 度時点で伏見班保有のデータに対してB.方 法で示した処理を行なうと同時に令和元年 度データについても収集が終わった分につ いて仮処理をおこなった。また、令和元年

度には過去になかった10月の期中改定が あったためその部分を考慮し作業を実施し た。

以下特記すべき事項に関して記載する。

1、エラーチェックについて

本研究データセット作成については、以下のルールの下で、データエラーチェックおよ び留意フラグ付与を行った。

(4)

1エラーチェック仕様 Noー番 ックックNG 件)

象デ ータ種別備考 1 ERR010

FF1のキ 重複し

FF1縦に「施設コ ードデー 番号+入院年月 +回数管理番号 診療情報番号+ +バー 番」が重 過去FF1の重 チェ

FF1 FF1T

重複重複デFF1デーデータFF1ルに報と格納し 降の処理には使用し 親様式1(診療情報番号=の場合、子様式1(診療情報番号≧1)の 緒に除外す 子様式1重複は該当の子様式1のみ外と様式他の子様式 響を及ぼ 「日帰り入退院+同一日再入院」日帰り入退院+日り入退院」の場は、 日再入院お最初の日帰り入院用す回数管理番号が最小のものの 採用場合はERR010はなERR220採用の様式1情報の 除外と

(5)

2 ERR020

FF4のキ 重複し

FF4 +デ別番 号+入院年月日 が重複

FF4重複重複デFF1デーデータFF1ルに報と格納し 降の処理には使用し 様式様式1の両方を除外(過去に仮確定し子様式1 3 ERR030

Eルのキ が重複し いる

Eルの「施設 ードデー 別番号入院年月 日+区分+ 順序番号+該当 月」が重

Eァイ

重複重複デFF1デーデータFF1ルに報と格納し 降の処理には使用し 様式様式1の両方を除外(過去に仮確定し子様式1 4 ERR040

Fルのキ が重複し いる

の「施設 ードデー 別番号+入院年 日+区分+ 順序番号+行為 細番号+該当月 が重複

Fァイ

重複重複デFF1デーデータFF1格納し 降の処理には使用し 様式様式1の両方を除外(過去に仮確定し子様式1

(6)

5 ERR050

EF統合 のキが重 てい

EF合フルの 施設+デ 別番号+入院 日+デ 分+順序番号+ 為明細番号+該 月」が重

EF統合重複重複デFF1デーデータFF1ルに報と格納し 降の処理には使用し 様式様式1の両方を除外(過去に仮確定し子様式1 6 ERR060

外来Eファ のキが重 てい

外来Eイル 施設+デ 別番号+入院 日+デ 分+順序番号+ 月」が重

外来E重複重複デFF1デーデータFF1ルに報と格納し 降の処理には使用し 様式様式1の両方を除外(過去に仮確定し子様式1 7 ERR070

外来Fァイ キーが てい

外来Fイル 施設+デ 別番号+入院 日+デ 分+順序番号+ 為明細番号+該 月」が重

外来F重複重複デFF1デーデータFF1ルに報と格納し 降の処理には使用し 様式様式1の両方を除外(過去に仮確定し子様式1

(7)

ERR080

Dルの が重複し いる

Dの「施設 ード+識別 番号+入院年月+ タ区+順序 号」が重

Dァイ

重複重複デFF1デーデータFF1ルに報と格納し 降の処理には使用し 様式様式1の両方を除外(過去に仮確定し子様式1 ERR090

Hルの が重複し いる

Hの「施設 ード+コー+ 識別番号+ 退院年月日+入院 年月日+実施年月 +コー+ージョ +連番」が重

Hファ

重複重複デFF1デーデータFF1ルに報と格納し 降の処理には使用し 様式様式1の両方を除外(過去に仮確定し子様式1

(8)

8 ERR110

在院日数が 日未満

入院日>退院日FF1 FF1T

除外ーデーFF1除外デFF1ルに報と格納し 以降の処理使用し 親様式1(診療情報番号=の場合、子様式1(診療情報番号≧1)の 緒に除外す 様式のエの場合は当子様式1は除様式1他の子 式1除外し 子様式1退院日'00000000'場合は親様式1はこのエ る。 9 ERR120

入院時年齢 歳未満で

生年月日>入院FF1 FF1T

除外ーデーFF1除外デFF1ルに報と格納し 以降の処理使用し 親様式1(診療情報番号=の場合、子様式1(診療情報番号≧1)の 緒に除外す過去仮確定し子様除外す 様式のエの場合は当子様式1は除様式1他の子 式1除外し

(9)

10ERR130

年月日が誤 てい

実在し月日 131日、732 など、お SQLserver datetime型で扱え 日付17531 1日以前)

ALL FF1T

除外ーデーFF1除外デFF1ルに報と格納し 以降の処理使用し 象は全ての日付情報と 在し月日のチのみ術日が入院日と退院の間に か、の相関チは行わな '00000000'許容す 親様式1(診療情報番号=の場合、子様式1(診療情報番号≧1)の 緒に除外す過去仮確定し子様除外す 子様式1の場合は当子様式1は除様式1他の子 式1除外し 式1開始日式1終了日を象に加。 前回退院年月日は日を00記を共用し本チの対象外と る。 11ERR140欠番 12ERR150欠番 13ERR160

統括診療情 番号が異常 ある 日以内再入 院集約

統括診療情報番 以上の数字で ない

FF1 FF1T

除外のエ除外より最初に定す ーデーFF1除外デFF1ルに報と格納し 以降の処理使用し

(10)

ド) 14ERR170

様式1対象 間が1日未 ある

様式1開始日> 式1了日

FF1 FF1T

除外ーデーFF1除外デFF1ルに報と格納し 以降の処理使用し 親様式1(診療情報番号=の場合、子様式1(診療情報番号≧1)の 緒に除外す 様式のエの場合は当子様式1は除様式1他の子 式1除外し 15ERR180

親様式 様式 始日、様式 終了日が入 退院日に 一致し

統括診療情報番 =0かつ様式 開始日が入院年 と一しな たは様式終了 が退院年月と一 ない

FF1 FF1T

除外ーデーFF1除外デFF1ルに報と格納し 以降の処理使用し 親様式1(診療情報番号=の場合、子様式1(診療情報番号≧1)の 緒に除外す過去仮確定し子様除外す 様式のエの場合は当子様式1は除様式1他の子 式1除外し

(11)

16ERR190

様式1開始 院と退院 囲外で

様式1開始日< 院年月たは 様式1開始 退院年月

FF1 FF1T

除外ーデーFF1除外デFF1ルに報と格納し 以降の処理使用し 親様式1(診療情報番号=の場合、子様式1(診療情報番号≧1)の 緒に除外す 様式のエの場合は当子様式1は除様式1他の子 式1除外し 17ERR200

様式1終了 院と退院 囲外で

様式1終了日< 院年月たは 様式1終了 退院年月日

FF1 FF1T

除外ーデーFF1除外デFF1ルに報と格納し 以降の処理使用し 親様式1(診療情報番号=の場合、子様式1(診療情報番号≧1)の 緒に除外す 様式のエの場合は当子様式1は除様式1他の子 式1除外し

(12)

ERR210

回数管理番 が異常

回数管理番号が 以上の数字

FF1T除外のエ除外より最初に定す ーデーFF1除外デFF1情報共に格納し 以降の処理使用し ERR220

入院日の 入院が複数 在す

回数管理番号が 数存在 最小の回数管理 号のみの様式1 報のみ採用し 他の回数管理番 の様式報は ERR220して る。

FF1T除外ーデーFF1除外デFF1ルに報と格納し 以降の処理使用し 20_FF1_キー重チェ 18ERR510

EルとF ルが る(F ルデ 存在で る)

Eルの各レ 対し 月のF 施設+デ 識別番号+入 院年月日+ 区分+順序番号 ードが

Eァイ ル、F イル

親様式1(診療情報番号=のみ象。 子様式1(診療情報番号≧対象外。0る。

0: 1:Fルデ落有

(13)

ない 19ERR520

EルとF ルが る(E ルデ 非存在 る)

Fルの各レ 対し 月のEイル 同じ「施設 デー識別番号+ 年月日+デ 区分+順序番 」をコー が存在

Eァイ ル、F イル

親様式1(診療情報番号=のみ象。 子様式1(診療情報番号≧対象外。0る。

0: 1:Eルデ落有 20ERR530

入院期間外 EFルレ が存 する

Eの実施日 FF1の入院日 たは FF1の退 日<Eの実 施日

FF1,E イル 統合E ァイ

親様式1(診療情報番号=のみ象。 子様式1(診療情報番号≧対象外。0る。

0: 1:入院期間外Eルデ

参照

関連したドキュメント

Birdwhistell)は、カメラフィル ムを使用した研究を行い、キネシクス(Kinesics 動作学)と非言語コミュニケーションにつ いて研究を行いました。 1952 年に「Introduction

そして取得した各種データは、不用意に保管・分類されていく。基本的には標

機械物理研究室では,光などの自然現象を 活用した高速・知的情報処理の創成を目指 した研究に取り組んでいます。応用物理学 会の「光

※ 硬化時 間につ いては 使用材 料によ って異 なるの で使用 材料の 特性を 十分熟 知する こと

Instagram 等 Flickr 以外にも多くの画像共有サイトがあるにも 関わらず, Flickr を利用する研究が多いことには, 大きく分けて 2

平成 16 年度に試行的に除去作業を行 い、翌平成 17 年度から、ボランティア

※お寄せいた だいた個人情 報は、企 画の 参考およびプ レゼントの 発 送に利用し、そ れ以外では利

なお、関連して、電源電池の待機時間については、開発品に使用した電源 電池(4.4.3 に記載)で