医療情報学会・人工知能学会 AIM 合同研究会資料 SIG-AIMED-002-11
医療情報システムにはどんなデータがあり、
どの程度利用可能か
What kinds of data are in healthcare information systems,
and how useful and reliable are they
木村通男
1Michio Kimura
11
浜松医科大学医学部附属病院医療情報部
1
Hamamatsu University, School of Medicine, Department of Medical Informatics
Abstract: Many kinds of data are in healthcare information systems. This paper intends to clarify their
data format, standardization, and reliability.
Image data are standardized in DICOM standard, and easy to get in CD media. Prescription data are not dispensing data, nor administration data. Lab results must be evaluated with reference value. Disease classifications include bogus diseases for the purpose of prescriptions and examination orders to be compensated. These three are in HL7 v2.5 format with each standard item codes, at 630 hospitals in japan where SS-MIX storage is installed. Reports and summaries are now being standardized. They are good source of research as they are written for other’s eyes. Claim data are available from Ministry of health, for public profit researchers. This includes DPC data, which is for fixed payment system, as this is with some clinical evaluations. Progress notes by doctors and nurses are still in natural language format. Home care data is becoming to be available and collected through network from home devices.
These data are basically each patient’s medical records, on which citizens have heavy privacy concerns. Even anonymized, citizens are negative for for-profit secondary use of these data.
はじめに
医療機関の情報システムには様々な種類のデータ が蓄積されている。機能的に分類すれば、診療録(カ ルテ)、処方情報、検査情報、画像情報、診療録以外 の各種文書、会計情報、物流情報、などである。 まず70年代には会計が電子事務化された。80 年代には画像検査機器がディジタル化され、画像は フィルムでなく画面で観察され、保存されることが 始まった。CT, MRI, CR といったディジタル画像検 査 機 器 の 普 及 と PACS(Picture Archiving and Communication System)の出現である。 次いで90年代から、人間(患者、職員)が指示 や結果を持って伝えるのでなく、医師が処方の指示、 検査の依頼をキーボードでおこない、検査機器が生 み出す結果は画面で参照されるようになった。これ がオーダエントリシステムである。指示や依頼がそ の後会計に進み、待ち時間の短縮と、請求漏れが減 少したため、普及は一気に進んだ。 元来医療機関には、通常5年間の診療録の保存義 務が課せられており、以前、これらは紙とフィルム で達成されてきた。2000年代に入り、電子カル テが出現し、診療記録(医師や看護師による所見) がキーボードで入力されるようになった。当時は忙 しい医師がキーボードで入力など、と言われたが、 コピー&ペーストでレポートを書いてきた世代が医 師になると、そのような抵抗はもう見られない。 また、今の時代は、1か所の病院で外来、入院、 手術、退院、外来フォロー、と済ませるのは効率悪 いとされ、診療所での診断、急性期病院での精査と 手術、療養型病院での回復、さらには介護施設、在 宅と、分業が進んでいる。当然これらの施設間の情報連携も重要である。 このように進んできたのが医療情報の情報システ ム化であり、当然数多くの患者情報が電子化され、 蓄積されている。しかしこれらを二次利用しようと したとき、患者の同意や倫理問題以前に、集計可能 な形にそろっているのか、そもそも内容は後刻の検 討に耐えられるものなのか、という点は、必ずしも 認識されていない。 本稿では、これら一つ一つについて、データ形式、 普及度、内容についての問題点を紹介し、利用を志 す研究者の認識の深まりを促したい。
画像
放射線画像(MRI 含む)は標準化が進んでいる。紹 介 時 に 画 像 C D が 頻 用 さ れ て お り 、 そ の 内 容 は DICOM という国際規格である[1]。DICOM 画像には、 患者名、検査日時、検査条件、位置(単純撮影なら 正面、側面など、CT なら胸骨-120mm など)といっ たタグも付いていて、画像処理に利用できる。この 分野では、心臓カテーテル検査などの動画が、まだ DICOM 対応できていない場合もある。また、昔は 10mm ごとに撮っていた CT は、今や 1mm 以下の幅 も可能で、その結果、枚数は 1000 枚を超えることも あり、この対応に難儀している。これらから作成さ れる 3D 画像は、必ずしも標準化されておらず、ベ ンダ間の互換性はまだ少ない。 超音波画像、内視鏡画像、病理組織画像も DICOM 形式で、放射線画像システムの中で保存、参照され ることが増えている。 デジタルカメラ画像や、手術動画なども利用が始 まっている。これらは JPEG や MPEG4 といった民生 用のデータ形式が使われている。当然これらには、 DICOM のような、患者名、部位などのタグ情報はな い。処方、注射
薬剤情報の標準的データ形式は HL7 v2.5 である。 この形式でデータを出せるベンダーは 2016 年3月 時点で14あり、全国 1474 施設で稼働している(日 本の総病院数は8000余り)[2]。もちろんそれぞ れのベンダーの独自形式が内部では使われているが、 同じベンダーと言っても新旧システムで同じ形式と は限らない。 検査結果、病名とともに、処方、注射情報は、 SS-MIX 標準化ストレージで保存されている施設が 630 施設に増えている[2]。ディレクトリ構造のそれ ぞれの中に置かれたデータは、HL7 v2.5 形式であり [3]、これらは厚労省標準として指定されている。 図1 SS-MIX ストレージの構造。上は標準化スト レージ、HL7 v2.5 による処方、注射、検査結果、病 名が入る。下は拡張ストレージ、Transaction date ま で同じ、その下にその他の形式のデータが入る。 ただし、この 630 施設の中で、薬剤コードを厚労 省標準たる HOT9 としているところは2割程度であ る。それ以外は各施設の独自コードを使っている。 また、これらはあくまでもオーダ、つまり医師の 指示内容である。薬局では、あるいは病棟では、ジ ェネリック医薬品が用いられていることも多く、そ れは、「処方情報」でなく、「調剤情報」である。こ の調剤情報は調剤薬局が持っているが、まだまだ形 式はバラバラである。 さらに、実際本当にどれだけ飲んだか、どれだけ 注射したか、は「服薬情報」「実施情報」である。精 神科、小児科の病棟ではかなりこれらを正確に記録 しているが、全科に徹底できているわけではない。 更に挙げるなら、新薬は2週間まで、とされてい ることが多いが、患者が遠方から来ていて、月一回 しか来られない、と言ったとき、「2週間毎日2錠」 「2週間休薬」と、オーダ情報は記録されていても、 実際は4週間毎日1錠であることもあると聞く。厚 生労働省は SS-MIX2 ストレージに蓄積された薬剤、 検査結果、病名のデータを用いて薬剤副作用情報の 検知を行う事業を進めている[4]。そこではこういっ た情報のノイズを除去する試みがなされている。病名
病名は国際的には ICD コードが用いられる。現在 第10版で、11版の準備が進んでいる。診療報酬 請求には ICD 対応病名集(および歯科病名集)[1] の利用が求められるため、コードの標準化はなされ ている。 しかし、通常、平均 5-10、多い場合は数十の病名 が一人の患者に付いている。過去に疑い、そのため 行った検査に対応したもの、すでに治癒した病名と そのため出した薬剤のための病名が、消されずに残 っている場合が多い、どれが終わった病名で、どれ が今時点で主たる病気かという情報はメンテナンス されていないことがほとんどである。 病名と合併症の有無などが決まれば、どんな検査 をやろうが、どんな薬剤を出そうが、一日当たりの 診療報酬は一定額(手術料は除く)、という支払い方 式が、中~大病院で広がっている。DPC による請求 である。この、DPC 請求のためのファイルには、「主 たる(あるいはもっとも医療資源を要した)病名」 が、選ばれている。この選択は医師により退院時に 行われており、比較的信頼できる。 表1 4年間の糖尿病患者の病名登録。圧倒的に NIDDM が多いはずであるがそうなっていない。初 診時には医師は「糖尿病」を選ぶ。これは E14 の ICD コードになる。その後診察、検査が進んで、NIDDM であると判っても、新たに登録直しをしない。E11 でも E14 でも、できる検査、出せる薬はあまりかわ らないからである。
検体検査
いわゆる採血(等)の検査である。処方と同じく HL7 v2.5 が指定標準形式で、普及率は処方とセット として、同じである。これにも標準コード JLAC10 の普及の問題があり、処方と同じく、2割程度であ る。腎臓病学会などでは、SS-MIX ストレージを牙 として、症例登録を呼びかけており、その大規模デ ータベースに参加するためには、コードが標準的で なければならない。そのモチベーションで、今後の 普及が期待されている。 血清中 AST の値は、肝臓の機能の指標として用い られる。単位は(μg/dl)であるから、どこへ 行っても同じであろうと思われるが、検査方法によ るばらつきがある。何か発色する化学物質と結合さ せて色を見たり、放射性同位元素と結合させて放射 能カウントを取ったりするが、データはいろいろな ファクターで揺れる。各検査部、検査センターは極 力揺れないように、室温、湿度をキープし、試薬を 大事に保管している。しかし基準値(正常値)は。 施設ごとに異なる。値だけに目を向けず、基準値と ともに評価することが重要である。なお、HL7 形式 では、基準値も同時に記録されている。 図2 hl7 V2.5 による検査結果の例。メッセージに ついてのメタデータ、患者情報、オーダされた検査、 検査結果、の順に並んでいる。各種医療文書(報告書、サマリー等)
紹介状、画像検査報告書、病理診断報告書、退院 時サマリ―、入院時診療計画書、などである。これ らは、他人が読むことを前提として書かれており、 したがって狭い分野でしか通用しない略号などが使 われず、背景情報もなるべく省略されていないため、 分析に適している。 図3 紹介状を作成している画面。紹介状は診療報 酬が算定できる(2000 円程度)ので、算定基準とし て項目が例示されているので、ほぼどこでも同じ内 容であるが、XML のタグなどはベンダーによってま ちまちである。 医療情報の標準化は、画像、検査結果、処方、病名と進んできたが、診療施設間連携が求められる今、 この分野の標準化が進められている。保健福祉医療 システム工業会(JAHIS)、日本医療情報学会、日本 HL7 協会などが協力して作業を進めている。中間的 な成果物は JAHIS の HP に挙げられているものもあ る[5]。紹介状はすでに厚生労働省規格である。しか し他のものはまだ各文書システムベンダーごとの形 式である。
診療報酬請求書
電子請求がなされているので、ある意味、よく形 式が標準化されていると言える。厚生労働省では平 成23年から、匿名化された診療報酬情報を、研究 者が公益のために使用できるようにしている[6]。こ れには特定健診(いわゆるメタボ健診)の内容も含 まれる。 SS-MIX が稼働している施設が主として大きな病 院であるのに対し、こちらは診療所のデータも網羅 しており、全数をとらえることができる。 一方、これの持つ検査情報は、どういう検査が行 われたかであり、検査結果ではない。 データ保全の施設基準などの審査があるが、平成 28年度からは、サテライトセンターが設置され、 いわゆるクリーンルーム方式で、原データ持ち出し なしの原則で、利用しやすくなっている。 中 ~ 大 病 院 で の 入 院 患 者 へ の 包 括 払 い 請 求 書 (DPC)に、主たる病名が選ばれていることは先に述 べたが、DPC 請求には、簡単な臨床評価データが含 まれている。心不全の程度や、感染等合併症の有無 などである。医師が記載しているので、貴重な情報 である。これらの DPC 請求データを、病院が持ち寄 って、病院機能のベンチマーキングを行っているグ ループもある[7,8]。また、厚生労働省でも有識者会 議で定められたガイドラインに基づいて、提供が開 始されている[9]。医師による経過記録、看護記録
いわゆるカルテ記載内容である。施設、診療科に よって、自由文によるもの、テンプレートを用いる ものなど、さまざまである。 教科書的には、患者背景、既往歴、主訴、理学的 (等)所見、現病歴、などでの構造化があるが、そ れに沿った電子カルテ記述システムは、手数が多く なり不評である。そもそもそのように構造化して書 いたからといって、後での症例検索の助にならない、 ということが大きな原因であろう。この構造化手法 には、ISO 13606, 医療情報システム開発センターが 定めた J-MIX などがあるが、広まりを見せていない。 したがってこの分野の情報には、自然言語処理の技 術を用いることが多くトライされている。その文章 を得るためのデータ形式は、電子カルテベンダーに よってそれぞれである。 …在宅データ
在宅ケアの管理に診療報酬が付与されていること もあり、在宅ケアレポートなどは、介護者から上が ってくるが、これらもベンダーごとにまちまちであ る。 一方、在宅治療機器がIT化されており、患者デ ータを測定、記録しているケースが多くなってきた。 長時間心電図(ホルタ―心電計)が典型的であるが、 睡眠時無呼吸の加圧レスピレーター(CPAP)は気道の 圧も測っており、SD カードなどに記録して、管理加 算を算定している医師は、そのカードをPC上のソ フトで見ている。このプロセスがインターネットを 介しての送信となっているケースも出てきた。 図4 電子カルテの画面とは別の PC で、SD カード に記録された睡眠時のデータを参照している。 長時間心電図の波形データと、付帯するデータは、 日本初の医療情報規格として ISO となっている。こ れ以外のこの分野はまだまだ各種機器ベンダーの独 自データ形式である。 …おわりに ―あくまでも公益利用
現状で利用することができる各種医療データにつ いてその形式、信頼性などについて述べた。これら は元々患者一人一人の個人情報、それももっとも機 微なものに分類される。したがって、改正個人情報 保護法でも、二次利用にあたっては、原則オプトイ ンが求められる。また、筆者のおこなった調査で、 市民は、いかに特定されないようになっていても、患者データの二次利用については、副作用検知、新 薬・機器開発、施策立案などに使われることはまだ よしとしても、営利に用いられることにはかなりの 抵抗を示している[11]。 匿名化したと称する患者データを、利用目的もろ くに吟味せずに「販売」する業者も見かける。匿名 化がゼロイチで境界されるがごとき安易な考え方で ある。名前と住所を消し、年齢を層化した程度の「糖 尿病患者リスト」なら、その地区の基幹病院の糖尿 病外来で、呼ばれる名前を聞いてリストすれば、ほ ぼ特定できるであろう。国民罹患率5%の糖尿病で もそうである。ましてやもっと稀少な疾患であれば、、 明らかにそういったデータの営利利用は改正個人 情報保護法では(いや、現行でも)法律に触れるが、 それ以前に、データを提供した医療施設がどのよう に患者から見られるかが心配である。営利業者はさ っさと逃げるが、いったん信頼を失った医療機関は、 ずっとその場に残るのである。 この分野の研究をおこなう研究者は、こういった ことを十分に理解していただきたい。うまくいかな い(儲からない)と思ったらさっさと去っていく研 究者(業者)を、我々は歓迎しない。
謝辞
本研究の一部は、厚生労働科学研究費補助金(地 域医療基盤開発推進 研究事業)電子カルテ情報を用 い た 証 拠 性 の あ る 臨 床 研 究 手 法 に 関 す る 研 究 (H27-医療-指定-016))の助成による。参考文献
[1] DICOM, HL7, SS-MIX2、各種コードなどは HELICS 規格として推奨されており、以下の HELICS 協議会 のサイトで詳細を得ることができる。
http://helics.umin.ac.jp/ [2] SS-MIX コンソーシアム調べ
http://www.ss-mix.org/cons/
[3] Kimura M, Nakayasu K, Ohshima Y, Fujita T, Nakashima N, et.al: SS-MIX: A Ministry Project to Promote
Standardized Healthcare Information Exchange, Methods Inform Med, 50: 131-139, 2011. [4] 木村通男:医療データの時系列検索で副作用情報を 検知, 日経ビッグデータ 20(10)32, 2015. [5] JAHIS 標準とは https://www.jahis.jp/standard/contents_type=32 [6] 厚生労働省、レセプト情報・特定健診等情報の提供 に関するホームページ、 http://www.mhlw.go.jp/stf/seisakunitsuite/bunya/kenkou_ iryou/iryouhoken/reseputo/ [7] https://www.girasol.org/ [8] 一般社団法人 診断群分類研究支援機構 http://dpcri.or.jp/index.php [9] DPCデータの提供に関するガイドラインの制定に ついて http://www.mhlw.go.jp/stf/shingi2/0000068752.html [10] 医用波形記述規 MFER http://www.mfer.org/jp/index.htm [11] 木村通男:日本の一般生活者における医療情報 の扱いに関する意識調査, 月刊新医療 37(5): 165-171, 2010.