• 検索結果がありません。

九州大学学術情報リポジトリ

N/A
N/A
Protected

Academic year: 2022

シェア "九州大学学術情報リポジトリ"

Copied!
3
0
0

読み込み中.... (全文を見る)

全文

(1)

九州大学学術情報リポジトリ

Kyushu University Institutional Repository

XML文書としての電子カルテ検索システム

関, 隆宏

九州大学大学評価情報室

安元, 裕司 和多, 太樹 中島, 直樹 他

http://hdl.handle.net/2324/1526185

出版情報:全国大会講演論文集. 第68回(平成18年), pp.51-52, 2006-03. Information Processing Society of Japan

バージョン:

権利関係:

(2)

4D-6 XML 文書と して の 電子カルテ検索システム

関 隆宏

安元 裕司

††

  和多 太樹

  中島 直樹

‡‡

廣川 佐千男

‡‡

†九州大学大学評価情報室 ‡‡九州大学大学院システム情報科学府 ‡‡九州大学病院医療情報部 ‡‡九州大学 情報基盤センター 

1 は じめに

政府は e-Japan戦略の 一環と して 「 平成18年に は 電子カルテ普及率を60% に 」 と いう努力を掲げ医療 の IT化を進めて いる.病院内,病院間,あるいは 医師, 看護士,患者の 間の コミュニケーションの 向上が進む こと が期待される.様々な 項目から構成されるカルテ は ,半構造化データの 典型で あり,その 検索と 分析手法 の 開発は ,国民に 対する医療の 高度化の ための インフ ラと 位置付けられる. 今後蓄積され続ける電子カルテ を,情報共有の ためだけで な く,科学的根拠に 基づ く医 療(EBM Evidence based Medicine)の 基礎データと して 利用し,データに 基づ く科学的発見を支援する検 索・分析システムが必要と される.医師は ,患者の 症状 と 検査結果の データに 応じて ,原因と 対応を推定する. 場合に よって は ,仮説と して 複数の 原因を考え,それぞ れに 対する再検査項目を考慮する. この ような 高度の 判断をするの が医師の 最も重要な 職務で あるが,それ は 各々の 医師の 経験と 知識に 依存する.それらの 知識 は 従来,書籍や論文と して 蓄積され長期間の 教育に よ り伝達されて きた.本研究で は ,この ような 知識だけで な く,蓄積されるカルテ・データを,医師の 分析に 役立 て るシステムを作ること を目指す.

本研究で は ,医療カルテを対象と して ,それぞれの 項 目を検索の 観点と して 捉える多面的検索方式を提案す る.各文書の それぞれの 項目を独立した文書と して 捉 え,個別インデックスを構成すること に より,項目毎の クラスタリングを実現する.利用者は ,複数の 項目か ら任意の 二項目を選択すること に より,2つの 観点を 用いたクラスタリング結果を見ること がで きる.さら に ,各項目の クラスタから抽出した特徴的キーワード Multipronged Retrieval System for Care Card as XML Documents

Takahiro SEKI([email protected])

†† Yuji YASUMOTO([email protected])

Taiki WADA([email protected])

‡‡ Naoki NAKASHIMA([email protected] u.ac.jp)

0 Sachio HIROKAWA([email protected]) Office for Information of University Evaluation, Kyushu Uni- versity (†)

Graduate School of Information Science and Electrical Engi- neering, Kyushu University (‡‡)

Department of Medical Informatics, Kyushu University Hos- pital (‡‡)

Computing and Communications Center, Kyushu University (‡‡)

を2つの 軸に 表示すること に より,単純な 可視化で は な く,可視化画面に おいて それぞれの セルを二種類の キーワードで 解釈すること がで きる.この キーワード は ,検索結果全体の 概観を与えるだけで な く,検索絞込 みに も利用で き,対話的な 検索の 効率が向上で きる.具 体的な システムと して ,著者の 中島が所属する九大附 属病院外科の 341件の 退院カルテを対象と して 検索シ ステムを実現した.これに より,クラスタリング方式, キーワード抽出法,分類結果の 分析を情報検索と 医療 と いう二つの 観点からの 分析が可能と な った. 2 関連研究

医療カルテの 電子化に ついて は データベースや検索 に ついて の 既存の 技術を応用し,様々な 企業に よりビ ジネスレベルで 進んで いる.研究動向の 中心は ,電子 カルテの 標準化と 現場で の 入力インターフェース向上 [1, 2]やネットワーク化に おける安全性向上[3, 4]の 2点に ある.この ような 標準化が達成されると ,複数の 機関に よるデータ共有が可能と な り,本稿で 提案する 分析システムの 活用が期待で きる.

本稿で 利用する多面的検索方式は ,著者の 廣川等が 九州大学教員データベースの 開発に おいて 着想を得た もの で あり[5]これを電子カルテに 適用するもの で あ る. カルテの 解析に ついて は ,科学技術振興機構(JST) に よる「 安全性に 係わる社会問題の 解決の ための 知識 体系の 構築」 プロジェクトがあり,医療安全研究グルー プ( 代表永 井良三教授) に よる,数値的データに つい て の 統計解析機能をもつ電子カルテシステムの 開発も ある.しかし,本研究の アプローチは ,数値的データだ けで な く,カルテの 項目に 含まれる文書情報を半構造 化文書と して 捉えるもの で ある.

インデックス付と XML検索の 統合に 関する研究と

して は , Raghavらの 構造索引と 転置リストと を統合

して 索引を作成する方法[6],絹谷らの XML文書から 利用者の 問い合わせに 最適な 部分文書を,文書構造と 文書内容の 両者を利用して 取り出す方法[7],森らの タ イトルや見出し,強調語に 着目して 特徴量ベクトルを

改善し, XML文書検索システムの 精度を向上させる

方法[8] な ど がある. しかしこれらは いずれもXML の 個別の 部分構造に 着目する多面的検索で は な い. 本 研究で は XML文書の 各項目毎に インデックスを作成

(3)

し, 多面的な 検索を行うシステムを扱う. 3 システム概要

本研究で は ,汎用連想計算エンジン(GETA)を利用 して いる. 検索の 対象と したい各項目に 対し,WAM と 呼ば れるGETAに 固有の インデックスを作成する. ユーザーは ウェブ上の フォームから検索したい語を入 力し,ど の 項目で 検索したいの かを選択する. ここで , 選択された項目に 入力された語を含む文書の リストが 返され,この リストをユーザーが任意に 選ぶ2つの 項 目で ,それぞれ指定した個数に クラスタリングを行い, 片方の クラスタで i番,もう一方の クラスタで j番に 属 するような 文書が(i, j)要素と な るような マトリック スを作成する. また,検索結果の 絞込みを容易に する ため,各クラスタごと に 特徴語を抽出する. ユーザー は あるセルに 含まれる文書が多い場合,その セルに 含 まれる文書で 再度マトリックスを作成するズーミング を行うこと に より,検索結果の 絞込みをする.

今回対象と したXML文書は 「 主訴」 ,「 現病歴」 ,

「 既往歴」 ,「 家族歴」 ,「 入院時現症」 ,「 入院時検査所 見」 ,「 入院後経過」 ,「 退院時処方」 ,「 生活歴」 ,「 退 院後の 方針」 がフラットに 並ぶ構造を持つ.この それ ぞれの 項目に 対して 形態素解析を行い,インデックス を作成した.

図1は 文書中に 「 ポリープ」 を含む文書を「 既往歴」

「 考察」 で 5× 5に 分割した例で ある。

図1: 検索結果の マトリックス表示

4 まと めと 今後の 課題

本研究で は XML形式の 電子カルテの 各項目ごと に インデックスを作成し,ユーザーが選ぶ任意の 観点で 検索を行い, 任意に 選ぶ2つの 観点で 結果をマトリッ

http://geta.ex.nii.ac.jp/

クス表示すること に より多面的な 検索,分析を行うシ ステムを作成した. 本システムの 定性的および定量的 な 評価を行うこと が今後の 課題で ある. また,クラス タリング方法の 検討な ど をする必要がある.

参考文献

[1] 中島直樹,田中直美,関口直孝,小林邦久,井口 登,与志,名和田新,野瀬善明, 電子カルテ定型 語彙集の 有用性に ついて の 検討–入力の 簡便化と 診療の 標準化,医療情報学,Vol.22 (suppl. 1), p.

535, 2002

[2] 田中直美,中島直樹,高野香子,宮崎美穂,井口 登与志,名和田新,野瀬善明,電子カルテ診療に おける患者が理解しやすいヒューマンインター フェイスの 開発,医療情報学,Vol 22 (suppl. 1) : p.362, 2002

[3] 清本 晋作,田中 俊昭,三宅 優,三田村 好矩,医療 情報流通プラットホームに おけるセキュリティ機 構の 開発,電子情報通信学会論文誌, Vol.J88-D1, No.2pp.378-390, 2005

[4] 中島直樹,坂本憲広,三村和郎,梅田文夫,井口登 与志,名和田新, 公開鍵基盤を用いた広域分散型 糖尿病電子カルテ開発事業に ついて ,糖尿病ケア IT革命,別冊 80-85, 2002, 2002.

[5] 廣川佐千男,関隆宏,安元裕司,山田泰寛,教員デー タに 対する多面的検索システム,情報処理学会研 究報告2005-DBS-137(II) pp.665-672, 2005 人工知能学会研究会資料SIG-KBS-A501, pp.1-4, 2005

[6] R.Kaushik, R.Krishnamurthy, J.F.Naughton, R.Ramakrishnan. On the integration of struc- ture indexed and inverted lists,SIGMOD 2004, (2004).

[7] 絹谷弘子,波多野賢治,吉川正俊,植村俊亮.XML 文書の 文書構造と 内容を用いた部分文書の 抽出手 法,トランザクション「 データベース」 Vol.43, No.SIG02,(2002).

[8] 森康弘,吉川正俊,波多野賢治.特徴ベクトルの 要素間の 影 響を考慮したXML文書検索手法の 提 案,DEWS2004,(2004).

参照

関連したドキュメント

Q25 「運搬受託者の許可番号」の欄には積込場所(排出場所)、運搬先のどちらを管

地企業や海外企業が進出し、映画産業ボリウッドや多くのコンテンツ産業が拠点を構えている流行発信基地でもあ

Figure 6: Susceptibility of single-ended oscillators to radiated electromagnetic field, 80 MHz-1 GHz 4 EMI

第 1 節 はじめに 本稿は、CD-R

蚊の駆除が要望された福島県南相馬市鹿島区の蚊相は

9 募集コンプライアンスガイド

[r]

評価要素のイメージ (3) 運営管理 執務者に対する定期的な執務 環境の満足度調査 満足度 6