• 検索結果がありません。

A-004 大規模データ分析による精神神経系疾患診断系の検討(A分野:モデル・アルゴリズム・プログラミング,一般論文)

N/A
N/A
Protected

Academic year: 2021

シェア "A-004 大規模データ分析による精神神経系疾患診断系の検討(A分野:モデル・アルゴリズム・プログラミング,一般論文)"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

大規模データ分析による精神神経系疾患診断系の検討

Development of Psychiatric Diagnosis System using Big Data Analysis

石井 一夫

沼田周助

木下 誠

大森 哲郎

Kazuo Ishii

Shusuke Numata

Makoto Kinoshita

Tetsuro Ohmori

1. はじめに

近年の国内経済状況の長期悪化,およ び社会状況の変化により,精神神経系疾 患に罹患する患者数が急激に増えている. 平成 23 年の第 19 回社会保障審議会医療 部会資料の「患者調査」に基づく資料に よると,平成 11 年から患者数は急激に 増加しており,平成 20 年にはその患者 数は,がん患者の 2 倍以上で,糖尿病よ りも多くなっている.なかでも,平成8 年には 43.3万人であったうつ病の患者 数がうつ病等の気分障害の総患者数は, 平成 20 年には 104.1 万人と 12 年間で 2.4 倍に増した.一方,国内の自殺者数も, 平成 10 年以降,継続して毎年3万人を 超えており同資料においても3万1千人 で,悪性新生物,心疾患,脳血管疾患, 肺炎,老衰,不慮の事故に続き,死因の 第9位となっており,社会的な問題とな っている.また,自殺の大きな要因とし てあげられるのは,うつ病などの精神疾 患との因果関係である.トーマス・E・ エリスらによれば,自殺既遂者の 95%は何らかの精神疾患 を患っていて,その大半が治療可能だったという研究結果 もある. しかし,うつ病および総合失調症などの精神神 経系疾患の原因はいまだ不明であり,その診断は,もっぱ ら医師による患者からの愁訴に基づく問診により実施され てきた.科学的エビデンスによる診断法の存在しない,い わゆる"アンメットメディカルニーズ"(未充足の医療ニー ズ)の疾患である. 本研究は,複数の診断マーカによる説明変数を用いた精 神神経系疾患の診断系を確立することを目標に,東京農工 大学農学府ゲノム科学人材育成プログラムと徳島大学大学 院ヘルスバイオサイエンス研究部精神医学科との共同研究 により精神神経系疾患のゲノムレベルのデータを用いたデ ータ分析を開始した.その結果,うつ病,総合失調症,お よび双極性感情障害の3つの精神神経系疾患において複数 の変動マーカ(ゲノムメチル化および発現変動遺伝子マー カ)を元にした判別分析により,非常に高い感度および特 異度で疾患患者と健常者を識別できる数理モデルを構築す ることが可能となったので報告する

2. データ分析行程

図1にデータ分析の大まかな全体のワークフローを示す 1-4).本研究では,まずメチル化マイクロアレイを用いて数 理モデル化を試みた.その後,次世代シーケンサーの少数 データでその有効性を確認した. (1) 説明変数の選択 次世代シーケンサーやマイクロアレイによる網羅的発現 解析や網羅的ゲノムメチル化解析を用いた場合,発現変動 遺伝子や,ゲノム DNA メチル化部位など,大量の説明変 数が得られる. これらの説明変数は,負の二項分布また はポアソン分布をすることが知られている.従って正規分 布を仮定しているステューデントの t 検定を用いずに,マ ンホイットニーの U 検定などのノンパラメトリック検定を 用いて選択した. (2) 識別方法と説明変数の最適化 複数の説明変数による疾患,患者の識別には,多変量解 析(重回帰分析,判別分析,クラスタ分析など),サポー トベクトルマシン,機械学習(SOM など),ベイズフィ ルタリング,ランダムフォレストなどの利用が考えられる. 今回は,このうち良好な結果の得られた判別分析を中心に 紹介する. 説明変数の選択は最初に,各マーカについて健常者群と 患者群の間でマンホイットニーの U 検定を実施し,両群で †東京農工大学農学府 Graduate School of Agricultural and

Life Sciences, Tokyo University of Agriculture and Technology ‡徳島大学大学院ヘルスバイオサイエンス研究部 Institute of Health Biosciences, The University of Tokushima Graduate School

図1 本研究で用いられるデータ解析の全体のワークフロー

FIT2014(第 13 回情報科学技術フォーラム)

Copyright © 2014 by

The Institute of Electronics, Information and Communication Engineers and Information Processing Society of Japan All rights reserved.

41

A-004

(2)

有意差の見られたものを選択した.さらに,ウィルクスラ ムダなどの別の指標をもちいて,説明変数を絞り込み,少 数の説明変数で良好な識別の出来る数理モデルを選択した. 識別の指標は,感度,特異度のほか,健常者群と患者群の 間の判別スコアの平均値の差などを指標とした. (3) 得られた数理モデルの検証 最終的に得られた数理モデルは,クロスバリデーション (交差検定法)により検証した. (4) 分析結果の視覚化 分析結果は,グラフやヒートマップなどで視覚化した.

3. 各疾患での分析結果

うつ病および総合失調症における分析結果は,すでに他 の場所で紹介しているので,そちらを参照していただきた い 5).今回はうつ病および総合失調症に加え,双極性感情 傷害 I 型においても,有効な識別能力を有する数理モデル の構築が可能であることが確認できたのでその結果を報告 する. 双極性感情傷害 I 型 20 名,健常者 20 名において,最適 化を試みた 10 個のメチル化マーカを用いて判別分析を実 施したときの判別分析の結果を図 2 に示す. 10 個の説明変数(メチル化マーカ)を用いた判別分析に より,双極性感情傷害 I 型患者と健常者を良好に識別出来 ていることが確認できる. この 10 個の説明変数(メチル化マーカ)を用いた判別 分析を,さらに別の双極性感情傷害 I 型患 12 名者 12 名と 健常者 12 名について実施した結果を図3に示す.図2で 識別できた 10 個の説明変数を用いて,別の双極性感情傷 害 I 型患者群と健常者群を識別でき,この数理モデルが双 極性感情傷害 I 型の診断に有効であることが示唆された.

4. まとめ

今回,うつ病,総合失調症に加え,双極性感情障害の3 つの精神神経系疾患において,良好な識別能力を有する診 断系の構築に成功した. その結果,従来では問診による経験的判断でしか,診断 がつかなかった精神神経系疾患においてエビデンスに基づ く診断を導入する糸口が見えてきた. 臨床医学的な知見の詳細は関連の臨床系の雑誌に報告す るのでそちらを参照してほしい6,7) 謝辞 本研究を行なうにあたり,日本ヒューレット・パッカー ド社,Amazon Web Services,Inc.および,理化学研究所スー パーコンピュータ「京」と互換性を有する SCLS 計算機シ ステムのご支援をいただいた.ここにお礼を申し上げる. 参考文献 [1] 石井一夫: ゲノム科学におけるビッグデータ分析・大規模デー タマイニング, BIOINDUSTORY, 31, 6, pp67-73 (2014). [2] 石井一夫: 解説:医療,農学,環境分野におけるビッグデータ 解析, 生物工学会誌, 92, 2, pp92-93 (2014). [3] 石井一夫, 佐藤暁, 古崎利紀, 有江力, 寺岡徹:ゲノム科学におけ るビッグデータ・データマイニング,日本統計学会誌, 43, 1, pp90-111 (2013). [4] Rizzo M(著), 石井一夫, 村田真樹(共訳): R よる計算機統計学, オ ーム社 (2011). [5] 石井一夫,沼田周助,木下 誠,大森哲郎:ビッグデータ分析による 精神神経系疾患診断系の検討, 日本計算機統計学会第 28 回大会 中央大学後楽園キャンパス(2014)

[6] Fuchikami M, Morinobu S, Segawa M, Okamoto Y, Yamawaki S, Ozaki N, Inoue T, Kusumi I, Koyama T, Tsuchiyama K, Terao T., DNA Methylation Profiles of the Brain-Derived Neurotrophic Factor (BDNF) Gene as a Potent Diagnostic Biomarker in Major Depression, PLoS One. 6, 8, e23881 (2011).

[7] Kinoshita M, Numata S, Tajima A, Shimodera S, Ono S, Imamura A, Iga J, Watanabe S, Kikuchi K, Kubo H, Nakataki M, Sumitani S, Imoto I, Okazaki Y, Ohmori T. DNA methylation signatures of peripheral leukocytes in schizophrenia., Neuromolecular Med. 15, 1, 95-101 (2013). ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 − 3 − 2 − 1 0 1 2 3 Discrimination_Analysis:10_MethylationSites Index rlt1_2$x 健常者 | 双極性感情傷害 判 別 ス コ ア 図 3 10 個のメチル化マーカを用いて,図2とは 別の集団の双極性感情傷害 I 型および健常者を識別 した判別分析の結果 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0 10 20 30 40 − 4 − 2 0 2 Discrimination_Analysis:10_MethylationSites Index rlt1_2$x 図 2 10 個のメチル化マーカを用いて,双極性感情 傷害 I 型および健常者を識別した判別分析の結果 健常者 | 双極性感情傷害 判 別 ス コ ア

FIT2014(第 13 回情報科学技術フォーラム)

Copyright © 2014 by

The Institute of Electronics, Information and Communication Engineers and Information Processing Society of Japan All rights reserved.

42

第 1 分冊

参照

関連したドキュメント

 膵の神経染色標本を検索すると,既に弱拡大で小葉

を,松田教授開講20周年記念論文集1)に.発表してある

振動流中および一様 流中に没水 した小口径の直立 円柱周辺の3次 元流体場 に関する数値解析 を行った.円 柱高 さの違いに よる流況および底面せん断力

(注妬)精神分裂病の特有の経過型で、病勢憎悪、病勢推進と訳されている。つまり多くの場合、分裂病の経過は病が完全に治癒せずして、病状が悪化するため、この用語が用いられている。(参考『新版精神医

近畿、中国・四国で前年より増加した。令和 2(2020)年の HIV 感染者と AIDS 患者を合わせた新規報告数に占 める AIDS 患者の割合を地域別にみると、東京都では

(G1、G2 及び G3)のものを扱い、NENs のうち低分化型神経内分泌腫瘍(神経内分泌癌 ; neuroendocrine carcinoma; NEC(G3)

および皮膚性状の変化がみられる患者においては,コ.. 動性クリーゼ補助診断に利用できると述べている。本 症 例 に お け る ChE/Alb 比 は 入 院 時 に 2.4 と 低 値

鈴木 則宏 慶應義塾大学医学部内科(神経) 教授 祖父江 元 名古屋大学大学院神経内科学 教授 高橋 良輔 京都大学大学院臨床神経学 教授 辻 省次 東京大学大学院神経内科学