• 検索結果がありません。

効率的医療情報検索システムの開発

N/A
N/A
Protected

Academic year: 2021

シェア "効率的医療情報検索システムの開発"

Copied!
12
0
0

読み込み中.... (全文を見る)

全文

(1)

医学用語シソーラスに基づく

効率的医療情報検索システムの開発

金子周司,鵜川義弘,大武 博,河本 健,

竹内浩昭,竹腰正隆,天野博夫,藤田信之

(京大・薬/ライフサイエンス辞書プロジェクト)

(2)

ライフサイエンス辞書(

ライフサイエンス辞書( LSD LSD )の )の シソーラス シソーラス 化 化

„„ ライフサイエンス辞書(ライフサイエンス辞書(19931993~)~)

…… PubMedPubMed 文献抄録,教科書での出現頻度に基づく文献抄録,教科書での出現頻度に基づく 10 万語対訳辞書10 万語対訳辞書

…… 専門用語,用言(動詞,形容詞等),用法,用例,音声などを収録専門用語,用言(動詞,形容詞等),用法,用例,音声などを収録

„„ MeSHMeSH に準拠したに準拠した 2.52.5万語見出しシソーラスを制作(万語見出しシソーラスを制作(20062006~)~)

…… LSD 名詞LSD 名詞 6 万語(下記カテゴリー)のうち6 万語(下記カテゴリー)のうち 4.5 万語がツリーに帰属4.5 万語がツリーに帰属

…… 未収録語は他のツリー参照あるいは独自に拡張を予定未収録語は他のツリー参照あるいは独自に拡張を予定

(3)

2008年11月24日 医療情報学会(横浜)医療情報学会(横浜)

対訳 対訳 シソーラスの応用 シソーラスの応用

1. 1. 対象の抽出 対象の抽出

„„ 表記の表記の解釈,解釈,整理統一整理統一

„„ 索引の自動作成(教科書,学会抄録索引の自動作成(教科書,学会抄録))

„„ 情報検索での表記のゆれを吸収情報検索での表記のゆれを吸収

„„ 未収録語の抽出未収録語の抽出

2. 2. 関係の抽出 関係の抽出

„„ 情報検索ヘルパー情報検索ヘルパー

„„ 連想検索連想検索

„„ データマイニングデータマイニング

„„ AERS 情報解析AERS 情報解析

„„ テキストマイニングテキストマイニング

„„ 電子カルテ解析電子カルテ解析

(4)

初歩的な日本語テキストマイニング 初歩的な日本語テキストマイニング

最長一致する語句に Perl で統制語 XML タグをつけ,カテゴリー色分け表示 最適化の作業中

(5)

2008年11月24日 医療情報学会(横浜)医療情報学会(横浜)

英語テキストマイニング 英語テキストマイニング

抄録中に共起する 統制語をカウント 600 MB1 word PubMed抄録

(6)

概念 概念 共起解析 共起解析

2型糖尿病」と共起する 専門用語(材料は英語)

•上位/下位概念

対比/並立概念

因果関係

人的介入(診断,治療)

研究手法・尺度 などが抽出された

→オントロジーへの応用 結果はコーパス依存 抄録単位で広めに収集

(7)

2008年11月24日 医療情報学会(横浜)医療情報学会(横浜)

糖尿病 糖尿病 や合併症 や合併症 に共起する概念 に共起する概念

(8)

共起概念による連想検索 共起概念による連想検索 (1) (1)

WebLSD シソーラス 20086月無料公開

(9)

2008年11月24日 医療情報学会(横浜)医療情報学会(横浜)

共起概念による連想検索

共起概念による連想検索 (2) (2)

(10)

WebLSD WebLSD 検索例 検索例

(商品名から (商品名 から) )

(11)

2008年11月24日 医療情報学会(横浜)医療情報学会(横浜)

Mac OS X 10.5

Mac OS X 10.5 Leopard Leopard 辞書 辞書 .app .app への実装 への実装

Safari ブラウザ上の英語 テキストに対して,ショート カットキーでカーソル位置 の複合語訳を表示できる

(12)

まとめ まとめ

„ MeSH準拠によるLSDシソーラス化がひとまず完了したので,

医学研究情報ポータルへの応用を試みた

„ 英語抄録中に共起する統制語をカウントすることによって,

2万の統制語に最大30個の関連キーワードを選んだ

„ Webで公開している10万語対訳辞書に,シソーラスツリーと 関連キーワードによる連想検索を実装した

„ MacOS X Leopard で複合語に対応できるマウスオーバー 辞書を制作した(近日正式公開)

„ 今後,シソーラスやツールの改良・応用を進めるとともに,

医療教育での実践と評価も行う

参照

関連したドキュメント

容易出现的误用情况归纳到位。以「広がる」&「広まる」的辨析为例。我们 可在 BCCWJ(Version 1.1)的「文字列検索」页面检索两词的用例,用「広 が」 「

When we consider using WEKO as a data repository, it is not easy for the users to search the data which they wish because metadata are not well standardized in many academic fields..

国内の検査検体を用いた RT-PCR 法との比較に基づく試験成績(n=124 例)は、陰性一致率 100%(100/100 例) 、陽性一致率 66.7%(16/24 例).. 2

事 業 名 夜間・休日診療情報の多言語化 事業内容 夜間・休日診療の案内リーフレットを多言語化し周知を図る。.

しかし,物質報酬群と言語報酬群に分けてみると,言語報酬群については,言語報酬を与

「系統情報の公開」に関する留意事項

 英語の関学の伝統を継承するのが「子どもと英 語」です。初等教育における英語教育に対応でき

本案における複数の放送対象地域における放送番組の