• 検索結果がありません。

電子情報通信学会ワードテンプレート (タイトル)

N/A
N/A
Protected

Academic year: 2021

シェア "電子情報通信学会ワードテンプレート (タイトル)"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

DEIM Forum 2014 F6-4

健康データマイニングにより自動抽出されたルールの妥当性検証

竹内 裕之 児玉 直樹

高崎健康福祉大学健康福祉学部医療情報学科 〒370-0033 群馬県高崎市中大類町 37-1

E-mail: {htakeuchi, kodama}@takasaki-u.ac.jp

あらまし 個人の日常の健康状態と生活習慣に関わる時系列データをサーバに蓄積し, 両者の相関ルールを抽出

する「健康データマイニング」をコア技術とした, クラウド型個人健康管理システムを開発している.

「健康データ

マイニング」では, クラウドで自動的にルールを抽出するために, 前処理として健康状態と生活習慣の遅延期間を考

慮した時系列データ間の相関分析を行っている.本稿では, ボランティアユーザについて自動抽出された相関ルー

ルを散布図に立ち戻って検証し, 開発中の「健康データマイニング」アルゴリズムの今後の課題について考察した.

キーワード 個人健康管理システム 健康データマイニング 時系列データ解析

1. は じ め に

イ ン タ ー ネ ッ ト を 活 用 し た 健 康 医 療 分 野 の ユ ビ キ タ ス 化 が 進 展 し て お り , 最 近 の 国 際 学 会 の 潮 流 と し て も , m(mobile)-health や p(personalized)-health と い っ た 概 念 が 浸 透 し て い る [1,2]. 特 に 体 重 , 体 脂 肪 率 , 血 圧 と い っ た 個 人 の 健 康 に 関 す る デ ー タ が 家 庭 や 職 場 な ど で も 容 易 に 取 得 で き る よ う に な り , 携 帯 電 話 や ス マ ー ト フ ォ ン 等 の 携 帯 端 末 を 通 し て イ ン タ ー ネ ッ ト 上 ( ク ラ ウ ド ) に 蓄 積 で き る 技 術 が 開 発 さ れ て い る . 我 々 は い ち 早 く , ク ラ ウ ド で 処 理 を 行 う 自 動 健 康 デ ー タ マ イ ニ ン グ を コ ア 技 術 と し た 個 人 健 康 管 理 シ ス テ ム を 開 発 し て き た [3,4]. こ の シ ス テ ム は , 携 帯 端 末 を 通 し て 入 力 し た 個 人 の 日 常 の 生 活 習 慣 と 健 康 に 関 す る デ ー タ を ク ラ ウ ド に 蓄 積 し , 生 活 習 慣 と 健 康 状 態 の 相 関 ル ー ル 抽 出 ( 健 康 デ ー タ マ イ ニ ン グ ) を 行 い , そ の 結 果 を 個 人 の 携 帯 端 末 か ら 参 照 で き る も の で あ る . ク ラ ウ ド 型 で あ る た め , 保 健 師 や 管 理 栄 養 士 な ど 保 健 指 導 者 が 参 画 す る 運 用 も 可 能 で あ る [5]. 本 シ ス テ ム で は , 個 人 の 生 活 習 慣 や 健 康 に 関 す る デ ー タ を 日 毎 の 粒 度 で 時 系 列 的 に 蓄 積 す る こ と を 前 提 と し て お り , 健 康 管 理 を 行 う 多 く の 人 々 の 長 期 に わ た る デ ー タ は ま さ に 健 康 ビ ッ グ デ ー タ を 構 成 す る . 今 後 , ウ ェ ア ラ ブ ル セ ン サ ー な ど か ら 発 生 す る ス ト リ ー ム 状 の 生 体 情 報 を 扱 う よ う に な る と そ の デ ー タ 量 は さ ら に 膨 大 な も の と な る . 本 稿 で は , 本 学 の 学 生 を 中 心 と し た 個 人 健 康 管 理 シ ス テ ム の ボ ラ ン テ ィ ア ユ ー ザ が , 2012 年 6 月 1 日 か ら 11 月 30 日 ま で の 6 か 月 間 に 日 毎 の 粒 度 で 蓄 積 し た 生 活 習 慣 と 健 康 に 関 す る デ ー タ に 基 づ き , 開 発 し た 健 康 デ ー タ マ イ ニ ン グ 手 法 に よ っ て 得 ら れ た , パ タ ー ン や ル ー ル に つ い て そ の 妥 当 性 を 検 証 す る .

2. 研 究 方 法

2.1. 対象ユーザ

本 研 究 の 対 象 ユ ー ザ は い ず れ も 本 学 の 学 生 で あ り , 22 歳 の 男 女 3 名 で あ る . ユ ー ザ A(女 )は , 特 定 保 健 用 食 品 で あ る 健 康 茶 の 摂 取 が , ユ ー ザ B(女 ) は , 豆 乳 摂 取 が , そ れ ぞ れ の ユ ー ザ の 日 々 の 体 重 ・ 体 脂 肪 率 に 与 え る 影 響 を 調 べ た . ま た ユ ー ザ C(男 )は 喫 煙 の 習 慣 が あ り , 喫 煙 量 と 血 圧 の 関 係 を 調 べ た .

2.2. データの取得方法

体 重 , 体 脂 肪 率 は , タ ニ タ の 体 組 成 計 ( Inner Scan: BC-521) を 用 い , 毎 朝 起 床 後 も し く は 毎 日 入 浴 前 ( ユ ー ザ に よ っ て 異 な る ) に 計 測 し た . 血 圧 , 脈 拍 数 は オ ム ロ ン 社 の 自 動 血 圧 計 ( オ シ ロ メ ト リ ッ ク 法 ) を 用 い て 起 床 後 に 計 り , 血 圧 に つ い て は 3 回 計 測 し て そ の 平 均 値 を デ ー タ 登 録 し た . 生 活 習 慣 と し て の 消 費 エ ネ ル ギ ー は , 歩 行 に よ る も の は オ ム ロ ン の 歩 数 計 ( Walking style) を 携 帯 し て 計 測 し , そ の 他 の 運 動 に つ い て は Mets 値 を 基 に 推 測 し た . 必 要 に 応 じ て , 摂 取 エ ネ ル ギ ー に つ い て は 毎 食 事 の 内 容 か ら イ ン タ ー ネ ッ ト 上 の 関 連 サ イ ト を 参 照 す る な ど し て 推 測 し た . ま た , 健 康 茶 , 豆 乳 な ど の 摂 取 量 は 1 日 あ た り の 摂 取 量 ( ml) を 記 録 し た . 喫 煙 量 は 1 日 当 た り の 喫 煙 量 ( タ バ コ 本 数 ) を 記 録 し た .

2.3. 健康データマイニングの概要

我 々 が 開 発 し て い る 健 康 デ ー タ マ イ ニ ン グ で は , 「 生 活 習 慣 の 蓄 積 が 健 康 状 態 に 変 化 を も た ら し , そ の 影 響 は 時 間 遅 れ を も っ て 現 れ る こ と が あ る 」 と い う 極 め て シ ン プ ル な モ デ ル を ベ ー ス と し て い る [6].す な わ ち , あ る 健 康 状 態 の 変 化 を 出 力 変 数 と し , 時 間 遅 れ を 考 慮 し た あ る 期 間 の 生 活 習 慣 の 蓄 積 を 入 力 変 数 と し て 相 関 ル ー ル を 抽 出 す る . 相 関 ル ー ル の 抽 出 に は , ま ず 入 力 変 数 の い た ず ら な 増 加 を 防 ぐ た め に , あ ら か じ め

(2)

時 系 列 デ ー タ を 基 に し て , 出 力 変 数 で あ る 健 康 状 態 の 変 化 に 影 響 を 及 ぼ す 生 活 習 慣 の 蓄 積 を ス ク リ ー ニ ン グ す る .ス ク リ ー ニ ン グ に は 式 (1)で 表 さ れ る 時 系 列 デ ー タ 間 の ピ ア ソ ン の 積 率 相 関 係 数 を 用 い る .

)

(

)

(

)

,

(

)

,

(

ij t nm ij t nm ij t nm

e

SD

h

SD

e

h

Cov

e

h

r

=

(1) こ こ で , m n nm

h

h

h

=

(2) は 目 的 変 数 で あ る 健 康 デ ー タ

h

の 変 化 を 表 す 差 分 値 で あ り , j i i ij t

e

e

e

e

=

+

−1

+

・・・

+

(3) は 生 活 習 慣 デ ー タ

e

の 蓄 積 を 表 す , あ る 期 間 に 亘 る 加 算 値 で あ る . 時 間 遅 れ は 遅 延 期 間 s = n – i ≧ 1 で 表 現 す る ( 図 1 参 照 ). 図 1 健 康 状 態 と 生 活 習 慣 の 時 系 列 相 関 の 評 価 式 (1)に お い て , r は 相 関 係 数 , SD(⊿ hn m)は ⊿ hn mの 時 系 列 区 間( こ こ で は 3 ヶ 月 )に お け る 標 準 偏 差 , SD(et i j) は et i jの 時 系 列 区 間 ( こ こ で は 3 ヶ 月 ) に お け る 標 準 偏 差 , Cov(⊿ hn m, eti j)は ⊿ hn mと eti jの 共 分 散 で あ る . 実 際 の ス ク リ ー ニ ン グ は , 対 象 と す る 健 康 状 態

h

と 各 種 生 活 習 慣

e

の 時 系 列 デ ー タ に つ い て , n-m, i-j, s を パ ラ メ ー タ と し て 式 (1) の ピ ア ソ ン の 積 率 相 関 係 数 を 評 価 す る . す な わ ち , 各 (n-m, i-j, s)の セ ッ ト に つ き 式 (1)を 評 価 し , も し , 1 つ 以 上 の 相 関 係 数 の 絶 対 値 が あ る 閾 値 rsよ り 大 き け れ ば , そ の

e

の 蓄 積 を

h

に 対 す る 入 力 変 数 と し て 採 用 す る .そ し て , ル ー ル マ イ ニ ン グ 処 理 に お け る 実 際 の 入 力 フ ィ ー ル ド は 相 関 係 数 の 絶 対 値 が 最 大 と な る (n-m, i-j, s) の セ ッ ト ((n-m)ma x,

(i-j)max, sma x) を も と に 定 義 す る . 例 え ば , (i-j)max=2,

sma x=2 で あ れ ば ,

e

に 関 わ る 入 力 フ ィ ー ル ド を

e

i

+

e

i1

+

e

i2 (

i=n-

2) (4) と 定 義 す る . す な わ ち , 「 2 日 前 か ら 3 日 間 の 生 活 習 慣

e

の 蓄 積 」 を 入 力 変 数 の ひ と つ と し て 定 義 す る . こ こ で , (

i-j

)maxが 大 き い と い う こ と は , 長 期 間 の 生 活 習 慣 の 蓄 積 が 現 在 の 健 康 状 態 に 影 響 を 与 え ,

s

ma xが 大 き い と い う こ と は , 生 活 習 慣 の 蓄 積 が 遅 れ を も っ て 現 在 の 健 康 状 態 に 影 響 を 与 え る と い う こ と に な る [7]. 次 に , 時 系 列 相 関 に よ る ス ク リ ー ニ ン グ で 採 用 さ れ た 生 活 習 慣 の 蓄 積 を 入 力 変 数

Y(

通 常 複 数

と し , 対 象 と す る 健 康 状 態 を , そ の 時 系 列 デ ー タ が「 高 い 」「 中 間 」「 低 い 」 の 3 つ の シ ン ボ ル 値 を 持 つ 出 力 変 数 X と し て , ITRULE ア ル ゴ リ ズ ム [8]を 用 い た 相 関 ル ー ル マ イ ニ ン グ を 行 う . ITRULE ア ル ゴ リ ズ ム は ,

If Y=y, then X=x with probability p

と い う 相 関 ル ー ル を 生 成 す る .こ の ア ル ゴ リ ズ ム で は , 多 く の デ ー タ セ ッ ト か ら 有 効 な 相 関 ル ー ル を 抽 出 す る た め に , 式 (5)で 表 さ れ る

測 度 を 用 い て ル ー ル を 評 価 す る [8].

(

)

      − − − + = )) ( 1 ( )) | ( 1 ( log )) | ( 1 ( ) ( ) | ( log ) | ( ) ( | x p y x p y x p x p y x p y x p y p y x J (5) J測 度 は Y=y と い う 事 象 が 起 き た 場 合 に X の 値 に 関 し て 得 ら れ る 情 報 量 の 大 き さ , つ ま り Y=y と い う 前 提 が あ る 場 合 と な い 場 合 で X の 値 x に 関 す る 確 率 分 布 が い か に 異 な る か と い う 尺 度 に , Y=y と い う 事 象 が 起 き る 確 率 p(y) を 掛 け た も の で あ り , こ の 値 が 大 き い ほ ど よ い 相 関 ル ー ル と い う こ と に な る .

3. 自 動 抽 出 さ れ た ル ー ル と そ の 検 証

3.1. 健康 茶 摂取に関わるルール

ユ ー ザ A は 22 歳 女 性 で , 特 定 保 健 用 食 品 と な っ て い る 健 康 茶 摂 取 の 効 果 を 検 証 し よ う と し た . こ の ユ ー ザ は 摂 取 の タ イ ミ ン グ に 関 心 を 持 ち , 当 初 3 カ 月 間 は , 食 前 , 食 中 , 食 後 と 摂 取 の タ イ ミ ン グ を 変 え て デ ー タ を 取 得 し た 結 果 , 相 関 解 析 で 食 中 の 摂 取 が 有 効 で あ る こ と を 見 出 し た . そ こ で , そ の 後 の 3 カ 月 間 は 食 中 摂 取 に タ イ ミ ン グ を 絞 り , 摂 取 量 を 変 化 さ せ な が ら 毎 日 健 康 茶 を 摂 取 し た . 体 重 , 体 脂 肪 率 は 毎 日 入 浴 前 に 計 測 し た . サ ー バ で 自 動 的 に 実 行 さ れ た 健 康 デ ー タ マ イ ニ ン グ か ら は , 「 4 日 間 の 総 摂 取 カ ロ リ ー が 1 日 平 均 1369.5 kcal よ り 大 き い , か つ 2 日 間 の 健 康 茶 摂 取 量 が 1 日 平 均 177.5

(3)

ml 未 満 な ら ば 2 日 後 の 体 脂 肪 率 が 高 い 傾 向 に あ る 」 [確 信 度 : 77.8% サ ポ ー ト 率 : 10.5%] と い う ル ー ル が 抽 出 さ れ た . こ の ユ ー ザ と し て は , 食 事 に よ る 摂 取 カ ロ リ ー が 1 日 平 均 1370 kcal よ り 多 く , 健 康 茶 の 摂 取 量 が 1 日 平 均 178 ml よ り 少 な い と , 体 脂 肪 率 が 高 く な る と い う こ と で , 生 活 習 慣 上 の 目 標 が 得 ら れ た こ と に な る . ル ー ル の 妥 当 性 を 検 証 す る た め に , ま ず 4 日 間 の 1 日 平 均 総 摂 取 カ ロ リ ー と 7 日 前 か ら の 体 脂 肪 率 変 化 の 散 布 図 を 図 2 に 示 す . デ ー タ 数 n = 66, 相 関 係 数 r = 0.488, 1%水 準 で 正 の 相 関 が 見 ら れ , 1 日 平 均 摂 取 カ ロ リ ー が 1,350 kcal を 超 え る と , す べ て の 体 脂 肪 率 変 化 が プ ラ ス に な っ て い る .次 に , 2 日 間 の 1 日 平 均 健 康 茶 摂 取 量 と 7 日 前 か ら の 体 脂 肪 率 変 化 の 散 布 図 を 図 3 に 示 す . デ ー タ 数 n = 67, 相 関 係 数 r = -0.356, 1 % 水 準 で 有 意 な 負 の 相 関 が み ら れ , 1 日 平 均 健 康 茶 摂 取 量 が 180 ml 未 満 で あ る と 体 脂 肪 率 変 化 が プ ラ ス に な る 確 率 が 高 い こ と が 判 る . こ の よ う に , こ こ で 自 動 抽 出 さ れ た ル ー ル は 散 布 図 か ら 裏 付 け ら れ て い る . 図 2 1 日 平 均 総 摂 取 カ ロ リ ー と 7 日 前 か ら の 体 脂 肪 率 変 化 の 散 布 図 図 3 1 日 平 均 健 康 茶 摂 取 量 と 7 日 前 か ら の 体 脂 肪 率 変 化 の 散 布 図

3.2. 豆乳 摂 取に関わるルール

ユ ー ザ B は 22 歳 女 性 で , 豆 乳 に 含 ま れ る 大 豆 た ん ぱ く 質 な ど の ダ イ エ ッ ト 効 果 を 検 証 し よ う と し た . 大 豆 た ん ぱ く 質 に 含 ま れ る β ― コ ン グ リ シ ニ ン は , 「 摂 取 し た 油 脂 を 完 全 に は 消 化 せ ず , 一 部 を 未 消 化 で 体 外 に 排 出 す る 」 作 用 が あ る と さ れ , 体 重 , 体 脂 肪 率 の 低 下 が 期 待 さ れ た .し か し 当 初 3 カ 月 間 の デ ー タ か ら は , 「 10 日 間 の 豆 乳 摂 取 量 が 1 日 平 均 550 ml よ り 多 い な ら ば , 3 日 後 の 体 重 が 高 い 傾 向 に あ る 」 [確 信 度 : 100% サ ポ ー ト 率 : 15.0%] と い う ル ー ル が 自 動 抽 出 さ れ た . 該 当 す る 散 布 図 ( 図 4)を 検 証 す る と , 体 重 変 化 は 豆 乳 摂 取 量 と 正 の 相 関 を 示 し , 確 か に 1 日 平 均 摂 取 量 が 540 ml を 超 え る あ た り か ら 殆 ど の 体 重 変 化 が プ ラ ス で あ る こ と が 判 る . 図 4 1 日 平 均 豆 乳 摂 取 量 と 10 日 前 か ら の 体 重 変 化 の 散 布 図 し か し こ の ユ ー ザ は , 豆 乳 摂 取 量 が 420 ml 以 下 で あ る と 体 重 変 化 は 殆 ど マ イ ナ ス で あ る こ と に 気 が つ い た . さ ら に 図 5 に 示 し た よ う に 体 脂 肪 率 変 化 と 豆 乳 摂 取 量 の 散 布 図 が 非 線 形 で あ り , 豆 乳 摂 取 量 が 480 ml 以 下 で あ れ ば 体 脂 肪 率 も 低 下 す る こ と が 判 っ た . 図 5 1 日 平 均 豆 乳 摂 取 量 と 9 日 前 か ら の 体 脂 肪 率 変 化 の 散 布 図

(4)

そ こ で , こ の ユ ー ザ は , そ の 後 の 3 カ 月 間 は 1 日 当 た り の 豆 乳 摂 取 量 を 最 多 400 ml に 制 限 し て デ ー タ を 蓄 積 し , 体 重 , 体 脂 肪 率 変 化 と の 相 関 を み た . 体 重 , 体 脂 肪 率 は 起 床 後 朝 食 前 に 毎 日 計 測 し た . そ の 結 果 , 「 10 日 間 の 豆 乳 摂 取 量 が 1 日 平 均 305 ml よ り 多 い な ら ば , 翌 日 の 体 重 が 低 い 傾 向 に あ る 」 [確 信 度 : 86% サ ポ ー ト 率 : 8.6%] と い う ル ー ル が 自 動 抽 出 さ れ た . 図 6 は , ル ー ル を 検 証 す る た め の , 後 半 3 カ 月 間 の 体 重 と , 摂 取 量 を 制 限 し た 10 日 間 の 1 日 平 均 豆 乳 摂 取 量 の 散 布 図 で あ る . デ ー タ 数 n = 72, 相 関 係 数 r = -0.700, 1 % 水 準 で 確 か に 負 の 相 関 が 得 ら れ た . さ ら に , 体 脂 肪 率 と 10 日 間 の 1 日 平 均 豆 乳 摂 取 量 の 間 に も , 5% 水 準 で は あ る が 負 の 相 関 が み ら れ た ( 図 7). 図 6 1 日 平 均 豆 乳 摂 取 量 と 体 重 の 散 布 図 図 7 1 日 平 均 豆 乳 摂 取 量 と 体 脂 肪 率 の 散 布 図

3.3. 喫煙に関わるルール

ユ ー ザ C は 喫 煙 の 習 慣 を 持 つ 22 歳 の 男 性 で あ る . 健 康 状 態 と し て は 体 重 と 血 圧 に 関 心 が あ り , 喫 煙 量 と の 関 係 を 検 証 し た .血 圧 は 起 床 後 30 分 以 内 に 毎 日 計 測 し , 最 大 ( 心 臓 収 縮 期 ) 血 圧 と 最 小 ( 心 臓 拡 張 期 ) 血 圧 を 3 回 計 測 し , そ の 平 均 値 を 記 録 し た . 計 測 に は , オ ム ロ ン 社 の 自 動 血 圧 計 ( オ シ ロ メ ト リ ッ ク 法 ) を 用 い た . 自 動 実 行 さ れ た 健 康 デ ー タ マ イ ニ ン グ か ら は , 「 喫 煙 量 が 1 日 8.5 本 よ り 多 い な ら ば , 翌 日 の 最 大 , 最 小 血 圧 が 高 い 傾 向 に あ る 」 [確 信 度 = 83.3% サ ポ ー ト 率 = 20%] と い う ル ー ル が 抽 出 さ れ た . 図 8 と 9 は こ の ル ー ル を 検 証 す る た め の , 1 日 の 喫 煙 量 と 2 日 前 か ら の 最 大 , 最 小 血 圧 変 化 の 散 布 図 で あ る . 確 か に , 1 日 の 喫 煙 量 が 8 本 を 超 え る と 最 大 , 最 小 血 圧 と も 変 化 は 殆 ど プ ラ ス に な っ て い る こ と が 判 り , 散 布 図 か ら ル ー ル の 妥 当 性 を 検 証 で き た . 因 み に , 最 大 血 圧 で は デ ー タ 数 n = 82, 相 関 係 数 r = 0.529, 1%水 準 で 有 意 な 正 の 相 関 が 得 ら れ , 最 小 血 圧 で も 同 じ よ う に 1%水 準 で 有 意 な 正 の 相 関 が 得 ら れ て い る . 喫 煙 が 血 圧 , 脈 拍 数 を 急 上 昇 さ せ る こ と は よ く 知 ら れ て い る [9]が , 生 活 習 慣 と し て の 喫 煙 が , 起 床 後 の 安 静 時 血 圧 に も 影 響 し て い る こ と が 示 唆 さ れ た . 図 8 1 日 の 喫 煙 量 と 2 日 前 か ら の 最 大 血 圧 変 化 の 散 布 図 図 9 1 日 の 喫 煙 量 と 2 日 前 か ら の 最 小 血 圧 変 化 の 散 布 図

(5)

4. 考 察

4.1. 健 康 データマイニングのアルゴリズム

生 活 習 慣 デ ー タ の 蓄 積 と 健 康 状 態 の 変 化 の 時 系 列 相 関 係 数 の 大 き さ ( こ こ で は 0.3 以 上 ) で ス ク リ ー ニ ン グ を か け て , タ ー ゲ ッ ト で あ る 健 康 状 態 に 対 し て 生 活 習 慣 デ ー タ か ら な る 入 力 変 数 を 自 動 設 定 す る の が , 健 康 デ ー タ マ イ ニ ン グ の コ ア の 部 分 で あ る [7].相 関 ル ー ル は 因 果 関 係 で あ り , 相 関 関 係 と は 異 な る の で あ る が , 因 果 関 係 が あ る な ら 少 な か ら ず 相 関 も 認 め ら れ る で あ ろ う と い う 前 提 で こ の ア ル ゴ リ ズ ム は 成 り 立 っ て い る . こ の よ う な 観 点 で 3 人 の ユ ー ザ に つ い て の 結 果 を 考 察 す る . こ の う ち 最 も 有 効 に 相 関 ル ー ル が 自 動 抽 出 さ れ た の は , 3.3 の 例 で あ る . 喫 煙 量 と 最 大 , 最 小 血 圧 の 時 系 列 相 関 係 数 は 0.3 を 超 え て い る の で , 喫 煙 量 は 健 康 デ ー タ マ イ ニ ン グ の 入 力 変 数 と し て 自 動 設 定 さ れ る . そ し て , 図 8, 9 の 散 布 図 か ら 判 る よ う に , 1 日 の 喫 煙 量 が 8 本 以 下 で あ れ ば , 血 圧 の 変 化 は プ ラ ス と マ イ ナ ス の 確 率 は ほ ぼ 同 等 で あ る が 8 本 を 超 え る と 80%以 上 の 確 率 で プ ラ ス に な っ て い る . 健 康 デ ー タ マ イ ニ ン グ の ア ル ゴ リ ズ ム は 迷 う こ と な く 因 果 関 係 で あ る ル ー ル を 出 力 す る . 3.1 の 例 も 比 較 的 わ か り や す い . 体 脂 肪 率 変 化 と の 関 わ り に お い て , 摂 取 カ ロ リ ー お よ び 健 康 茶 摂 取 量 と の 時 系 列 相 関 係 数 が そ れ ぞ れ 0.3 を 超 え て お り , 双 方 が 入 力 変 数 と し て 選 ば れ た . そ し て , 図 2 の 散 布 図 を み る と 1 日 の 平 均 総 摂 取 カ ロ リ ー が 1300 kcal 以 下 で あ る と 体 脂 肪 率 変 化 は プ ラ ス と マ イ ナ ス の 確 率 が ほ ぼ 同 程 度 で あ る が , 1300 kcal を 超 え る と 80%以 上 の 確 率 で プ ラ ス 変 化 と な る . 図 3 の 健 康 茶 摂 取 量 に つ い て の 散 布 図 で は , 目 視 で 明 瞭 な 因 果 関 係 は み ら れ な い が , ア ル ゴ リ ズ ム 上 特 殊 化 の 条 件 と し て 相 関 ル ー ル に 反 映 さ れ た と 考 え ら れ る . こ れ ら は , 健 康 デ ー タ マ イ ニ ン グ が 成 功 し た 例 で あ る が , 3.2 の 例 は 非 線 形 性 の 強 い ケ ー ス で 誤 り で は な い が 自 動 健 康 デ ー タ マ イ ニ ン グ が ユ ー ザ に 適 切 な 情 報 を 与 え な い 場 合 で あ る . 事 実 は , 10 日 間 に わ た る 豆 乳 過 剰 摂 取 は む し ろ 体 重 お よ び 体 脂 肪 率 を 増 加 さ せ る と い う こ と で あ る が , 自 動 抽 出 さ れ た ル ー ル だ け み る と 「 豆 乳 摂 取 は 体 重 を 増 加 さ せ る 」 と い う こ と に な る . 体 脂 肪 率 に 関 し て は 図 5 か ら 判 る よ う に 強 い 非 線 形 相 関 が 現 れ て お り , 豆 乳 摂 取 量 と の 間 で 単 純 に 相 関 係 数 を 求 め る と そ の 大 き さ は 0.3 よ り 小 さ く 入 力 変 数 に 選 ば れ な い . し た が っ て ル ー ル も 抽 出 さ れ な い と い う 結 果 に な っ て い た . 結 論 と し て ダ イ エ ッ ト を 目 的 と し た 豆 乳 摂 取 量 に は 適 量 が あ り , そ の 範 囲 で 摂 取 す る こ と に よ り 期 待 し た 相 関 ル ー ル が 抽 出 さ れ , 散 布 図 ( 図 6,7) か ら も そ れ が 裏 付 け ら れ た .

4.2. ルール自動抽出の今 後の課 題

生 体 に お け る 生 活 習 慣 と 健 康 状 態 の 関 係 は 程 度 の 差 こ そ あ れ 本 来 非 線 形 で あ り , 線 形 を 前 提 と し た 積 率 相 関 係 数 の み で 因 果 関 係 へ の ス ク リ ー ニ ン グ を か け る に は リ ス ク が あ る .特 に , 3.2 の 例 の よ う に 非 線 形 性 が 強 い 場 合 に は , 生 活 習 慣 デ ー タ の 範 囲 を 限 定 し て ル ー ル マ イ ニ ン グ を 実 行 す る 必 要 が あ る . 今 後 相 関 の 非 線 形 性 を 自 動 認 識 し て , 非 線 形 性 が 強 い 場 合 に は 生 活 習 慣 デ ー タ の 範 囲 を 分 割 し て , そ れ ぞ れ の 分 割 範 囲 内 で ル ー ル 生 成 を 行 う な ど の 工 夫 が 必 要 に な る .

5. ま と め

本 学 の 学 生 を 中 心 と し た 個 人 健 康 管 理 シ ス テ ム の ボ ラ ン テ ィ ア ユ ー ザ が , 2012 年 6 月 1 日 か ら 11 月 30 日 ま で の 6 か 月 間 に 日 毎 の 粒 度 で 蓄 積 し た 生 活 習 慣 と 健 康 に 関 す る デ ー タ に 基 づ き , 開 発 し た 健 康 デ ー タ マ イ ニ ン グ 手 法 に よ っ て 得 ら れ た , パ タ ー ン や ル ー ル に つ い て そ の 妥 当 性 を 検 証 し た . そ の 結 果 ( 1 ) 本 稿 で 対 象 と し た 3 ボ ラ ン テ ィ ア ユ ー ザ の 内 2 名 に つ い て は サ ー バ に 蓄 積 さ れ た 時 系 列 デ ー タ に 基 づ き , 開 発 し た 健 康 デ ー タ マ イ ニ ン グ の ア ル ゴ リ ズ ム に よ っ て , 適 切 に 生 活 習 慣 と 健 康 状 態 の 間 の 相 関 ル ー ル が 自 動 抽 出 さ れ て い た . ( 2 ) 他 の 1 名 に つ い て は , 誤 り で は な い が 妥 当 で は な い 相 関 ル ー ル が 自 動 抽 出 さ れ , そ の 原 因 は 生 活 習 慣 デ ー タ と 健 康 状 態 の 間 に 強 い 非 線 形 の 相 関 が あ る こ と に よ る こ と が 判 っ た . ( 3 ) 上 記 の 場 合 , 生 活 習 慣 デ ー タ の 範 囲 に 制 限 を 設 け る こ と に よ り 適 切 に 健 康 状 態 と の 間 の 相 関 ル ー ル が 抽 出 さ れ る こ と を 確 認 で き た . 謝 辞 本 研 究 は 文 部 科 学 省 科 研 費 ( 課 題 番 号 : 23500813) の 助 成 を 受 け て い る . ま た , 日 本 デ ー タ ベ ー ス 学 会 と 日 立 製 作 所 に よ る 日 立 HiRDB ア カ デ ミ ッ ク 制 度 の 適 用 を 受 け て い る . 本 研 究 に 協 力 し て い た だ い た 高 崎 健 康 福 祉 大 学 健 康 福 祉 学 部 医 療 情 報 学 科 の 学 生 諸 氏 に 感 謝 し ま す .

参 考 文 献

[1] H. Kumpusch, D. Hayn, K. Kreiner, M. Falgenhauer, J. Mor, and G. Schreier, “A Mobile Phone Based Telemonitoring Concept for the Simultaneous Acquisition of Biosignals and Physiological Parameters”, Proc. 13th

(6)

(Medinfo2010), pp. 1344-1348, 2010.

[2] E. C. Kyriacou, C. S. Pattichis, and M. S. Pattichis, ” An Overview of Recent Health Care Support System for eEmergency and mHealth Applications”, Proc. 31st Annual

Int ernational Conference of the IEEE EMBS, pp. 1246-1249, 2009.

[3] H. Takeuchi, T. Hashiguchi, and T. Shintani, “Personal Dynamic Healthcare Syst em Utilizing Mobile Phone and Web Technologies”, Proc. 2n d Int’l Conf. Advances in

Biomedical Signal and Information Proces sing, pp. 304-307, 2004.

[4] 竹 内 裕 之 , 児 玉 直 樹 , 橋 口 猛 志 , 林 同 文 , “ イ ン タ ー ネ ッ ト 上 で 動 く 自 動 健 康 デ ー タ マ イ ニ ン グ シ ス テ ム ” 高 崎 健 康 福 祉 大 学 紀 要 第 5 号 pp. 1-11, 2006. [5] H. Takeuchi, Y. Mayuzumi, N. Kodama, and K. Sato, “Application Service Provider Syst em for Healt hcare with Data Mining Function”, Proc. 13th World Congress on

Medical and Health Informatics (Medinfo 2010), 2010. [6] 竹 内 裕 之 , 児 玉 直 樹 , “ 生 活 習 慣 と 健 康 状 態 に 関 す る 時 系 列 デ ー タ 解 析 手 法 の 開 発 ”, DEWS 2008.

[7] 竹 内 裕 之 , 児 玉 直 樹 , 橋 口 猛 志 , 林 同 文 , “ 個 人 健 康 管 理 を 目 的 と し た 健 康 デ ー タ マ イ ニ ン グ シ ス テ ム ”, DEWS 2006.

[8] P. Smyth and R. M. Goodman, “An Information Theoretical Approach to Rule Induction from Databases”, IEEE Trans. Knowledge and Data Engineering, vol.4, no.4 pp. 301-316, 1992.

[9] 上 園 慶 子 , 佐 々 木 悠 , 川 崎 晃 一 , 浦 江 明 憲 , 天 本 敏 昭 ,“ 喫 煙 の 血 圧・脈 拍 に 対 す る 急 性 効 果 と そ の 喫 煙 時 刻 に よ る 差 異 ”, 健 康 科 学 ( 九 州 大 学 ) 第 15 巻 pp. 85-89, 1993.

参照

関連したドキュメント