DEIM Forum 2016 F4-3
クラスタリングとヒートマップによる時系列データ可視化
熊谷 沙津希
†伊藤 貴之
†本橋 陽介
‡梅津 圭介
‡高塚 正浩
‡‡†お茶の水女子大学大学院
人間文化創成科学研科 〒112-0012 東京文京区大塚 2-1-1
‡日本電気株式会社情報・ナレッジ研究所
〒211-8666 神奈川県川崎市中原区下沼部 1753
‡‡
The University of Sydney, Faculty of Engineering and Information Technologies J12 School of IT Building, The University of Sydney NSW 2006 AustraliaE-mail: †{satsuki, itot}@itolab.is.ocha.ac.jp, ‡y-motohashi@bk.jp.nec.com, ‡k-umezu@ak.nec.com,
‡‡masa.takatsuka@sydneyu.edu.au
あらまし 時系列データの可視化には折れ線グラフと並んでヒートマップがよく用いられる.ヒートマップは標本 数の多い時系列データにおいて大きな画面空間を要することから,重要でない標本や時刻のフィルタリングが重要 となる.本報告ではヒートマップを用いた時間列データ可視化の一手法として,標本群や時刻群の位置関係を表現 するために散布図表示を併用し,さらに標本と時刻をフィルタリングするためのGUIを搭載した手法を提案する. 我々の実装では,任意の2標本間または2時刻間の距離を定義し,その距離を用いて標本群や時刻群の系統樹を構築 し,それに沿ってヒートマップのデザインを決定する.それと同時に,標本群および時刻群の位置関係を2つの散布 図で表示することで,標本群や時刻群の分布を可視化する. キーワード ヒートマップ,可視化,クラスタリング1. 概 要
ヒ ー ト マ ッ プ は , 時 系 列 デ ー タ 可 視 化 の た め の 効 果 的 な 表 現 の 一 つ で あ り , 折 れ 線 グ ラ フ と 同 様 に 広 く 用 い ら れ て い る 手 法 で あ る . し か し な が ら , 入 力 デ ー タ が 変 数 や 時 刻 を 多 数 含 む と き , 表 示 の た め の 画 面 領 域 を 大 幅 に 必 要 と す る 場 合 が あ る . 我 々 は , 時 系 列 デ ー タ 可 視 化 に お い て ヒ ー ト マ ッ プ を 適 切 に 形 成 す る と と も に , 重 要 で は な い 標 本 や 時 刻 を 対 話 的 に フ ィ ル タ リ ン グ す る こ と が 重 要 で あ る と 考 え る . 本 報 告 で は , 変 数 と 時 刻 の 有 意 義 な 表 示 を 可 能 に し , ユ ー ザ が 対 話 的 に 操 作 で き る 時 系 列 デ ー タ の た め の ヒ ー ト マ ッ プ ベ ー ス な 可 視 化 手 法 に つ い て 議 論 す る . 我 々 が 開 発 し て い る ヒ ー ト マ ッ プ ベ ー ス の 可 視 化 手 法 の 画 面 キ ャ プ チ ャ を 図 1 に 示 す . 本 手 法 で は 2 標 本 間 の 非 類 似 度 ,お よ び 2 時 刻 間 の 非 類 似 度 を 算 出 し , そ の 位 置 関 係 を2 つ の 散 布 図 で 表 示 す る . そ れ と 同 時 に , 非 類 似 度 に も と づ い て 標 本 群 の 系 統 樹 を 生 成 し , 系 統 樹 上 で の 標 本 群 の 隣 接 性 に も と づ い て ヒ ー ト マ ッ プ を 生 成 す る . 図 1 に お い て 画 面 の 左 半 分 に は ヒ ー ト マ ッ プ が 表 示 さ れ , 画 面 の 右 半 分 に は2 つ の 散 布 図 が 表 示 さ れ て い る . 画 面 の 右 端 に は 2 つ の ス ラ イ ダ ー 部 品 が 搭 載 さ れ て お り , こ れ を 操 作 す る こ と で 重 要 で な い 標 本 , ま た は 重 要 で な い 時 刻 を ヒ ー ト マ ッ プ か ら 割 愛 す る た め の 閾 値 を 調 節 す る こ と が で き る . 図 1 提 案 手 法 の 画 面 キ ャ プ チ ャ 例2. 関 連 研 究
時 系 列 デ ー タ の 可 視 化 に は , 一 般 的 に 折 れ 線 グ ラ フ や ヒ ー ト マ ッ プ を 用 い た 可 視 化 が 利 用 さ れ て い る . 画 面 空 間 の 横 軸 に 時 刻 を 割 り 当 て る 形 式 で 時 系 列 デ ー タ を 可 視 化 す る 手 法 と し て , 折 れ 線 グ ラ フ と ヒ ー ト マ ッ プ が 広 く 用 い ら れ て い る . 折 れ 線 グ ラ フ は ヒ ー ト マ ッ プ に 比 べ て , 各 標 本 に お け る 正 確 な 数 値 を 読 み 取 り や す い , ま た 線 の 傾 き か ら 数 値 の 上 昇 や 下 降 を 読 み 取 り や す い , な ど の 利 点 が あ る . し か し , デ ー タ を 構 成 す る 標 本 数 の 増 加 と と も に , 折 れ 線 ど う し の 絡 み 合 い も 増 加 し , 視 認 性 低 下 の 原 因 と な る . こ れ ら の 問題 を 解 決 す る た め に , 折 れ 線 の 表 示 数 を 対 話 的 に 調 節 す る 手 法 が 提 案 さ れ て い る[1].ま た ,数 値 の 範 囲 が 大 き く , か つ 数 値 分 布 が 不 均 一 で あ る 場 合 に は , 画 面 領 域 を 浪 費 す る よ う な 可 視 化 結 果 に な る こ と が 多 い , と い う 問 題 も あ る . ヒ ー ト マ ッ プ は 値 の 大 き さ を 色 で 表 示 す る 可 視 化 手 法 で あ る . ヒ ー ト マ ッ プ を 用 い た 時 系 列 デ ー タ の 可 視 化 に は , デ ー タ を 構 成 す る 標 本 を 縦 軸 に 沿 っ て 一 列 ず つ に 並 べ , 横 軸 に 何 ら か の 変 数 ( 時 系 列 デ ー タ の 場 合 に は 時 刻 ) を 割 り 当 て て , 両 軸 を 分 割 し て 得 ら れ る 各 領 域 に 色 付 け る . ヒ ー ト マ ッ プ は 標 本 数 が 大 き な デ ー タ に お い て も , 数 値 を 表 現 す る 形 状 が 画 面 上 で 重 な り 絡 み 合 う こ と が な い た め , 視 認 性 の 維 持 が 容 易 で あ る . さ ら に 折 れ 線 グ ラ フ と 比 較 し て , 数 値 の 範 囲 や 分 布 に よ り 表 示 領 域 を 浪 費 す る よ う な 可 視 化 結 果 を 生 じ る こ と も な い . ヒ ー ト マ ッ プ を 用 い た 可 視 化 で は , 標 本 や 変 数 を 縦 軸 に 沿 っ て 並 べ る 順 番 に よ っ て , そ の 効 果 が 大 き く 変 わ る . こ こ で 井 元 ら は ヒ ー ト マ ッ プ の 時 間 的 に 変 化 す る デ ー タ の 興 味 深 い 結 果 を 抽 出 す る 手 法 を 定 時 し た [2].さ ら に ,標 本 の 画 面 上 で の 配 置 順 を 決 定 す る た め の 一 手 段 と し て , 類 似 性 に も と づ い て 標 本 の 分 類 や 順 列 化 を 適 用 す る こ と が 考 え ら れ る[3,4]. し か し こ れ ら の 手 法 で は ,k-means 法 を 単 純 に 適 用 し て 標 本 を ク ラ ス タ リ ン グ し て い る た め , 類 似 性 は 低 い が 関 係 性 の 高 い 標 本 を 視 覚 的 に 比 較 す る こ と が 容 易 で は な い . 例 え ば 負 の 相 関 を 有 す る 変 数 が 同 一 の ク ラ ス タ に 属 す る こ と が な い た め , こ の よ う な 変 数 を 視 覚 的 に 比 較 す る こ と が 容 易 で は な い . 多 次 元 デ ー タ の 分 析 に お い て , 次 元 間 の 相 関 や 類 似 度 を 散 布 図 で 表 示 す る 手 法 が い く つ か 発 表 さ れ て い る . Yuan ら の 手 法 [5]や Zhang ら の 手 法 [6]で は , 多 次 元 デ ー タ を 構 成 す る 各 次 元 を , 標 本 数 だ け 次 元 が あ る ベ ク タ と し て 扱 い ,そ の 非 類 似 度 を 散 布 図 で 表 示 し て い る . 提 案 手 法 の 画 面 右 側 に あ る 2 つ の 散 布 図 も 同 様 な 考 え 方 に も と づ い て 生 成 さ れ て い る .
3. 変 数 間 距 離 に 基 づ く ヒ ー ト マ ッ プ 表 示
本 章 で は 提 案 手 法 が 前 提 と す る デ ー タ 構 造 を 定 義 し , 全 体 的 な 処 理 手 順 を 述 べ た の ち に , 具 体 的 な 実 装 方 法 に つ い て 論 じ る . 3.1 デ ー タ 構 造 と 処 理 手 順 入 力 情 報 と な る 時 系 列 デ ー タ がm 標 本 お よ び n 時 刻 を 有 す る デ ー タ で あ る と す る . こ の と き 本 報 告 で は , 標 本 群A お よ び 時 刻 群 T を 以 下 の よ う に 表 現 す る .こ こ でvij は i 番 目 の 標 本 の j 番 目 の 時 刻 に お け る 実 数 値 で あ る .A = {𝑎
!, … , 𝑎
!}
𝑎
!= {𝑣
!!, … , 𝑣
!"}
T = {𝑡
!, … , 𝑡
!}
𝑡
!= {𝑣
!!, … , 𝑣
!"}
以 上 の 定 義 に よ り ,各 標 本 お よ び 各 時 刻 は ベ ク タ と し て 表 現 さ れ る . 図 2(1)の 赤 線 が 1 個 の 標 本 を , 図 2(1) の 青 線 が 1 個 の 時 刻 に 対 応 す る . 提 案 手 法 で は 任 意 の 時 刻 間 の 非 類 似 度 ( 以 下 距 離 と 称 す る ) を 算 出 し て , そ れ ら の 距 離 関 係 を 表 す 散 布 図 を 図 2(2)の よ う に 表 示 す る . 同 様 に 提 案 手 法 で は , 任 意 の 標 本 間 の 距 離 を 算 出 し て , そ れ ら の 距 離 関 係 を 表 す 散 布 図 を 図 2(3)の よ う に 表 示 す る . さ ら に 提 案 手 法 で は , 時 刻 群 と 標 本 群 に ク ラ ス タ リ ン グ を 適 用 す る こ と で , ヒ ー ト マ ッ プ 上 で の 表 示 対 象 と な る 時 刻 群 と 標 本 群 を 特 定 す る ( 図2(4)). 図 2 提 案 手 法 の 処 理 手 順 3.2 標 本 間 の 距 離 算 出 2 章 で 論 じ た ヒ ー ト マ ッ プ 型 の 時 系 列 デ ー タ 可 視 化 手 法 の 問 題 点 を 解 決 す る た め に , 変 数 間 の 類 似 性 に 着 目 す る の で は な く , 類 似 性 に 限 定 せ ず に 任 意 の 変 数 間 距 離 を 算 出 し , そ れ に 基 づ い て 生 成 さ れ た 距 離 行 列 を 用 い , 変 数 を ク ラ ス タ リ ン グ す る こ と を 考 え る . 我 々 は 正 と 負 の 相 関 に お い て 変 数 間 の 関 係 を 観 察 し た い と 考 え ,相 関 係 数 に も と づ い て 変 数 間 距 離 を 算 出 し こ れ に ク ラ ス タ リ ン グ を 適 用 す る こ と に し た .こ こ で 高 次 元 デ ー タ を 構 成 す る 変 数𝑣 = {𝑣!… 𝑣!}と し , i 番 目 の 変 数 は 数 値𝑣!= {𝑣!!… 𝑣!"}を 持 つ と す る .現 時 点 の 我 々 の 実 装 で は ケ ン ド ー ル 順 位 相 関 係 数 を 適 用 し て ,式(1)か ら i 番 目 と j 番 目 の 変 数 間 の 相 関 係 数𝑑 𝑖, 𝑗 を 算 出 す る . ま た , こ の と き P は 変 数 i に お け る 任 意 の 隣 り 合 う 2 つ の 時 刻 と , 変 数 j の こ れ に 対 応 す る 2 つ の 時 刻 に つ い て ,そ れ ぞ れ の 組 の 大 小 関 係 が 一 致 す る と き 1 を 加 算 し ,不 一 致 の と き -1 を 加 算 し た 和 と す る . 𝑑 𝑖, 𝑗 = 4𝑃 𝑛(𝑛 − 1)− 1 こ こ で 得 ら れ た 値 を 式(2)に 適 用 し , i 番 目 と j 番 目 の 変 数 間 の 距 離𝐿!,!を 得 る .𝐿!,! = 1 − 𝑑 𝑖, 𝑗 上 記 処 理 を 全 て の 2 変 数 の ペ ア に 適 用 し , 距 離 行 列 を 得 る . 続 い て こ の 距 離 行 列 に , 以 下 を 用 い て ク ラ ス タ リ ン グ を 適 用 す る . 3.3 階 層 型 ク ラ ス タ リ ン グ と ヒ ー ト マ ッ プ デ ザ イ ン 階 層 型 ク ラ ス タ リ ン グ と は , 近 い 距 離 に あ る 標 本 を 1 個 ず つ 階 層 的 に 連 結 さ せ , 標 本 を 一 続 き に つ な げ た 系 統 樹 を 形 成 し , ク ラ ス タ を ボ ト ム ア ッ プ に 形 成 す る 手 法 で あ る . 提 案 手 法 で は 階 層 型 ク ラ ス タ リ ン グ 手 法 に よ り , 全 て の 標 本 を 連 結 す る 系 統 樹 を 構 築 し , そ の 隣 接 順 に 沿 っ て ヒ ー ト マ ッ プ 上 で の 標 本 の 並 び 順 を 決 定 す る . ま た 距 離 の 閾 値 を 与 え る こ と で , 標 本 群 の ク ラ ス タ を 形 成 す る . 提 案 手 法 に お け る ヒ ー ト マ ッ プ デ ザ イ ン の 考 え 方 を 図3 に 示 す . 図 3 系 統 樹 に も と づ く ヒ ー ト マ ッ プ デ ザ イ ン 提 案 手 法 が 表 示 す る ヒ ー ト マ ッ プ で は , 横 軸 が 時 刻 を 表 し , 標 本 群 が 画 面 の 縦 軸 に 沿 っ て 上 下 に 並 ぶ . 同 一 ク ラ ス タ に 属 す る 標 本 群 は 間 隔 を 空 け ず に ひ と 続 き に 並 べ て 表 示 し , 異 な る ク ラ ス タ に 属 す る 標 本 間 に は 境 界 線 を 表 す 灰 色 の 帯 を は さ ん で 表 示 す る . ま た 我 々 の 実 装 で は , 表 示 す る ク ラ ス タ の 構 成 標 本 数 の 下 限 値 を 設 定 し , そ れ よ り も 標 本 数 の 少 な い ク ラ ス タ は 表 示 し な い , と い う 制 約 を 設 け て い る . 我 々 の 実 装 で は 原 則 と し て2 を 下 限 値 と し て い る . い ず れ の 他 の 標 本 と も 強 い 相 関 を 有 さ な い 標 本 は 標 本 数1 の ク ラ ス タ を 構 成 す る こ と か ら , 下 限 値 を2 と す る こ と で そ の よ う な 標 本 は 可 視 化 す る 意 義 が な い と し , ヒ ー ト マ ッ プ か ら 割 愛 す る . 系 統 樹 を 構 築 す る た め の 提 案 手 法 で の 具 体 的 な 実 装 に つ い て 述 べ る . 木 構 造 に は 各 変 数 に 相 当 す る リ ー フ 部 分 と , 任 意 の 変 数 同 士 を 連 結 さ せ る 際 の 分 岐 に 当 た る ブ ラ ン チ 部 分 が あ る .構 築 さ れ た 系 統 樹 を 保 存 し , こ の ブ ラ ン チ 部 分 に 番 号 を 振 り 分 け る . よ り 下 位 層 に リ ー フ を 所 有 す る ブ ラ ン チ に 若 い 番 号 を 付 与 し , 各 階 層 に お い て 同 様 に ブ ラ ン チ に 番 号 を 付 与 す る . ヒ ー ト マ ッ プ 表 示 の 際 に は こ の 番 号 が 若 い 順 に 下 か ら 表 示 す る た め , ユ ー ザ 操 作 に よ っ て 変 わ る ク ラ ス タ リ ン グ の 表 示 結 果 の 前 後 で , 各 ク ラ ス タ の 位 置 , お よ び ク ラ ス タ 内 の 各 標 本 の 位 置 関 係 が 大 き く 入 れ 替 わ る こ と が な い . こ れ に よ り , ユ ー ザ の メ ン タ ル マ ッ プ を 保 持 し や す い 可 視 化 を 実 現 で き る . 同 一 の 入 力 デ ー タ に 対 し て ク ラ ス タ リ ン グ の 閾 値 を 調 節 し て 可 視 化 結 果 の 例 を 図 4 に 示 す . 図 4 ク ラ ス タ リ ン グ 結 果 と ヒ ー ト マ ッ プ 表 示 (左 )閾 値 0.2 (右 )閾 値 0.25 な お 我 々 の 実 装 で は , 時 刻 群 に も 同 様 に 階 層 型 ク ラ ス タ リ ン グ を 適 用 し , 表 示 す る ク ラ ス タ の 構 成 時 刻 数 の 下 限 値 を 2 と 設 定 し て い る . こ れ に よ り , 他 の い ず れ の 時 刻 と も 数 値 分 布 が 全 く 異 な る ノ イ ズ の よ う な 時 刻 を ヒ ー ト マ ッ プ か ら 割 愛 す る こ と が で き る . 3.4 カ ラ ー マ ッ プ 我 々 の 実 装 で は ヒ ー ト マ ッ プ の 色 計 算 に 以 下 の 2 種 類 の カ ラ ー マ ッ プ を 採 用 し て い る . な お 色 計 算 に は HSB 表 色 系 を 採 用 し ,入 力 値 に は vijを[0,1]の 区 間 に 正 規 化 し た 値 v’ijを 使 用 す る も の と す る . 1) 色 相 の み を 変 化 さ せ る 汎 用 的 な カ ラ ー マ ッ プ 圧 倒 的 に 多 数 の 可 視 化 ソ フ ト ウ ェ ア が 採 用 し て い る 色 計 算 . 色 相 を v’ijの 関 数 と し , 彩 度 と 明 度 を 定 数 と す る . 2) 平 均 値 と 相 対 値 に 着 目 し た カ ラ ー マ ッ プ HSB 値 を 以 下 の 式 で 算 出 す る . H = hue(𝑣! !"), 𝑆 = 𝑠𝑎𝑡𝑢𝑟𝑎𝑡𝑖𝑜𝑛 𝑣!!!" , 𝐵 = 𝑐𝑜𝑛𝑠𝑡 こ こ で hue お よ び saturation は 色 相 と 彩 度 を 算 出 す る 関 数 で あ り ,v′!" は 1 つ の 標 本 に お け る v’ijの 平 均 値 で あ る と す る . ま た𝑣′′!"= 𝑣′!"− v′!" と す る . こ の 表 現 に よ り , 色 相 に よ っ て 標 本 全 体 の 数 値 の 大 小 を 表 現 し , 彩 度 に よ っ て 単 一 の 標 本 に お け る 数 値 の 変 化 を 表 現 す る .
3.5 散 布 図 表 示 と ユ ー ザ イ ン タ フ ェ ー ス 我 々 の 実 装 で は 図 1 に 示 す 通 り , ク ラ ス タ リ ン グ の た め の 閾 値 を 設 定 す る ス ラ イ ダ ー を 搭 載 し て い る . ス ラ イ ダ ー 操 作 を 停 止 す る た び に 提 案 手 法 で は , ス ラ イ ダ ー の 位 置 に よ っ て 指 定 さ れ る 閾 値 に も と づ い て , 標 本 ま た は 時 刻 の ク ラ ス タ を 形 成 す る . ま た 我 々 の 実 装 で は , 系 統 樹 が 構 築 さ れ る 様 子 を 散 布 図 上 で 可 視 化 す る . 画 面 右 側 の 2 つ の 散 布 図 で は , 標 本 群 ま た は 時 刻 群 の 距 離 行 列 に 対 し てMDS( 多 次 元 尺 度 構 成 法 ) を 適 用 す る こ と で 各 標 本 ま た は 各 時 刻 の 散 布 図 上 の 位 置 を 算 出 し て い る . こ の 散 布 図 で は ス ラ イ ダ ー 操 作 に 連 動 し て , 同 一 ク ラ ス タ に 所 属 す る 2 標 本 ま た は 2 時 刻 を 連 結 す る 線 分 を 描 画 す る . こ の 散 布 図 表 示 に よ り , ヒ ー ト マ ッ プ 表 示 だ け で は 視 覚 的 に 把 握 し き れ な い 標 本 間 ま た は 時 刻 間 の 関 係 を 把 握 し や す く な る .
4. 実 行 例
本 章 で は 実 デ ー タ を 用 い た 提 案 手 法 の 実 行 例 を 示 す . 我 々 は 気 象 庁 AMeDAS に よ っ て 記 録 さ れ た 全 国 86 地 点 に お け る 1 ヶ 月 間( 31 日 間 )の 3 時 間 お き の 気 温 ( 測 定 値 合 計248 回 ) を 可 視 化 し た . 以 下 , ユ ー ザ の 対 話 操 作 に よ る 閾 値 設 定 と と も に 階 層 型 ク ラ ス タ リ ン グ が 適 用 さ れ , そ の ク ラ ス タ リ ン グ 結 果 に 伴 っ て 異 な る ヒ ー ト マ ッ プ が 表 示 さ れ る 様 子 を 示 す . ま た , 提 案 手 法 で 画 面 右 側 に 表 示 さ れ る 散 布 図 に つ い て も 同 時 に 解 説 す る . 提 案 手 法 に お い て ユ ー ザ の 対 話 操 作 に よ っ て 閾 値 を 調 節 し な が ら 生 成 し た ヒ ー ト マ ッ プ を 図 5 に 示 す . こ の ヒ ー ト マ ッ プ に お い て ,色 の つ い た 帯 は 標 本 群( 本 実 行 例 の 場 合AMeDAS の 観 測 地 点 群 )の ク ラ ス タ を 表 す .ま た ,こ の 操 作 に と も な っ て 標 本 群( 観 測 地 点 群 ) の 散 布 図 を 構 成 す る 点 群 を 連 結 す る 線 分 が 表 示 さ れ る 様 子 を 図 6 に 示 す . こ こ で 変 数𝑑𝑎𝑡𝑎!"#"$%は , 標 本 群 に よ っ て 構 成 さ れ る デ ン ド ロ グ ラ ム か ら ク ラ ス タ を 生 成 す る た め の 閾 値 で あ る .𝑑𝑎𝑡𝑎!"#"$%の 値 が 大 き く な る ほ ど , 図5 に 示 す ヒ ー ト マ ッ プ で は 多 く の 観 測 地 点 に お け る 気 温 が 表 示 さ れ , 図6 に 示 す 散 布 図 で は 多 く の 点 群 が 線 分 で 連 結 さ れ る . 図 6 の 赤 丸 は 線 分 が 存 在 す る 部 位 を 示 し て い る . 以 上 の 適 用 例 か ら , 我 々 は 以 下 の 現 象 を 発 見 し た . [現 象 1] 北 海 道 や 沖 縄 に 属 す る 観 測 点 は𝑑𝑎𝑡𝑎!"#"$%値 が だ い ぶ 大 き く な っ て よ う や く ヒ ー ト マ ッ プ 上 に 表 示 さ れ る . [現 象 2] 同 じ 地 域 に 属 す る 観 測 点 の 中 に も ,𝑑𝑎𝑡𝑎!"#"$% 値 が 小 さ い う ち か ら ヒ ー ト マ ッ プ 上 に 表 示 さ れ る 観 測 点 と , だ い ぶ 大 き く な っ て よ う や く ヒ ー ト マ ッ プ 上 に 表 示 さ れ る 観 測 点 が 混 在 し て い る . 図 5 AMeDAS 気 温 デ ー タ の ヒ ー ト マ ッ プ 表 示 例 図 6 AMeDAS 気 象 デ ー タ へ の 散 布 図 表 示 例 以 上 の 現 象 に つ い て , 図 7 に 示 す 日 本 地 図 と と も に 考 察 す る . [現 象 1]の 原 因 と し て ,観 測 所 間 の 物 理 的 距 離 が 考 え ら れ る . 北 海 道 は 日 本 の 約 22%を 占 め て お り , 本 デ ー タ に お い て 約6400km2に 1 観 測 所 が 割 り 当 て ら れ て い る .一 方 東 京 は 日 本 の 0.5%,つ ま り 約 2100km2に 1 観 測 所 が 割 り 当 て ら れ て い る . ま た , 沖 縄 県 は 周 辺 の 各 島 に1 観 測 所 が 割 り 当 て ら れ て い る . よ っ て 北 海 道 や 沖 縄 で は 観 測 所 間 の 気 象 傾 向 の 差 異 が 大 き い た め , 𝑑𝑎𝑡𝑎!"#"$%値 が だ い ぶ 大 き く な っ て よ う や く ヒ ー ト マ ッ プ 上 に 現 れ る . 続 い て[現 象 2]に つ い て 考 察 す る . [現 象 2]が 見 ら れ る 具 体 的 な 観 測 点 の 例 と し て , 中 国 地 方 に お け る 広 島と 岡 山 , 鳥 取 と 松 江 , の2 組 が あ げ ら れ る . こ れ ら の 地 域 は 同 じ 中 国 地 方 で あ り な が ら , そ の 間 に 山 脈 が 立 ち は だ か っ て い る た め , 観 測 所 間 の 気 象 傾 向 の 差 が 大 き い .こ の た め 同 じ 地 域 に 属 し て い な が ら ,𝑑𝑎𝑡𝑎!"#"$%値 が だ い ぶ 大 き く な っ て よ う や く 同 一 ク ラ ス タ に 属 す る よ う に な る . 図 7 日 本 の 山 脈 地 図 (【 世 界 地 図 |SEKAICHIZU】の 日 本 地 図 を 元 に 著 者 が 手 を 加 え 作 成 し た . http://www.sekaichizu.jp/atlas/japan/p500_japan.html, 2016/02/12) 本 章 で 紹 介 し た AMeDAS 気 温 デ ー タ で の 実 行 例 と そ の 考 察 か ら , 提 案 手 法 に よ る 可 視 化 結 果 に は あ る 程 度 妥 当 性 が あ る と 考 え ら れ る . し か し な が ら 本 実 行 例 は , そ の 数 値 分 布 が す で に 十 分 解 明 さ れ て い る デ ー タ を 用 い る こ と で 可 視 化 結 果 の 妥 当 性 を 示 し た に 過 ぎ な い . 提 案 手 法 に 限 ら ず 可 視 化 技 術 が 本 来 目 指 す べ き 用 途 は , そ の 特 徴 が 明 ら か に な っ て い な い デ ー タ の 特 徴 を 視 覚 的 に 発 見 し , そ れ を 第 三 者 に 対 し て 表 現 す る 点 に あ る . そ こ で 今 後 の 課 題 と し て , ま だ 数 値 分 布 が 明 ら か に な っ て い な い デ ー タ を 可 視 化 し て , そ の 特 徴 を 発 見 す る タ ス ク を も っ て , 提 案 手 法 の 有 用 性 を 検 証 し た い .
5. 応 用 : 異 常 値 を 含 む 標 本 間 の 相 関 の 可 視
化
本 報 告 の 提 案 手 法 の 応 用 と し て 我 々 は 現 在 , 時 系 列 デ ー タ 中 で 異 常 値 を 含 む 標 本 を 抽 出 し , そ の 標 本 間 の 相 関 を 可 視 化 す る ツ ー ル を 開 発 し て い る . 3.1 節 と 同 様 に , 入 力 情 報 と な る 時 系 列 デ ー タ が m 標 本 お よ び n 時 刻 を 有 す る も の と す る . こ の と き 我 々 の 実 装 で は ,標 本 群A = {𝑎
!, … , 𝑎
!}
の 中 か ら 異 常 値 を 含 む 上 位 m’個 の 標 本 を 抽 出 す る . 以 降 こ れ をA′ = {𝑎
!, … , 𝑎
!!}
と 記 述 す る . 我 々 の 現 在 の 実 装 で は 単 純 に ,i 番 目 の 標 本 を 構 成 す る 各 時 刻 の 実 数 値 に 対 し て(𝑣
!"− 𝜇
!)/𝜎
! を 算 出 し ,そ の 最 大 値 が 上 位 で あ る m’個 の 標 本 を 抽 出 し て い る . こ こ で𝜇
!は i 番 目 の 標 本 に お け る 実 数 値 の 平 均 値 ,𝜎
!は i 番 目 の 標 本 に お け る 実 数 値 の 標 準 偏 差 で あ る . こ れ 以 外 の 異 常 値 検 出 方 法 を 適 用 す る こ と も 可 能 で あ る . 以 上 の 処 理 に よ っ て 抽 出 さ れ た 標 本 群 A’に 提 案 手 法 を 適 用 す る こ と で , 異 常 値 を 含 む 標 本 間 の 相 関 を 可 視 化 で き る . こ の よ う な 可 視 化 は 例 え ば , 「 同 じ 時 期 に 異 常 に よ く 売 れ る 商 品 間 の 売 上 の 相 関 を 可 視 化 す る 」 「 同 じ 時 期 に 異 常 に よ く ア ク セ ス さ れ る ウ ェ ブ ペ ー ジ 間 の ア ク セ ス 数 の 相 関 を 可 視 化 す る 」 と い っ た 用 途 に 有 効 で あ る . 図 5 に そ の 例 を 示 す . な お , こ の 応 用 例 に 関 す る 実 装 で は , 散 布 図 の 表 示 を 割 愛 し て い る . か わ り に こ の 実 装 で は , ユ ー ザ に よ る ヒ ー ト マ ッ プ 上 で の マ ウ ス ク リ ッ ク 操 作 に 対 応 す る 箇 所 の 詳 細 情 報 を 表 示 す る テ キ ス ト 表 示 欄 を ウ ィ ン ド ウ 右 下 部 に 表 示 し て い る .6. ま と め と 今 後 の 課 題
本 報 告 で は , ヒ ー ト マ ッ プ を 用 い た 時 系 列 デ ー タ 可 視 化 の 一 手 法 を 提 案 し た . 提 案 手 法 で は 時 間 軸 を 横 軸 と し て 標 本 群 を 縦 軸 に 並 べ る 一 般 的 な ヒ ー ト マ ッ プ と は 別 に , 時 刻 群 と 標 本 群 の 位 置 関 係 を 表 示 す る 2 つ の 散 布 図 を 搭 載 し て い る . 時 刻 群 と 標 本 群 は そ れ ぞ れ 系 統 樹 に よ っ て 構 造 化 さ れ , 対 話 操 作 に よ る 閾 値 設 定 と と も に 階 層 型 ク ラ ス タ リ ン グ が 適 用 さ れ , そ の ク ラ ス タ リ ン グ 結 果 に 沿 っ て ヒ ー ト マ ッ プ が 更 新 さ れ る 仕 組 み と な っ て い る . ま た ク ラ ス タ 形 成 の 過 程 は 散 布 図 上 に も 表 示 さ れ る . 図 8 応 用:異 常 値 を 含 む 標 本 間 の 相 関 の 可 視 化現 在 の 実 装 で は 相 関 係 数 か ら 算 出 し た 距 離 に も と づ く ク ラ ス タ リ ン グ を 適 用 す る こ と で , ノ イ ズ と な る 時 刻 を 割 愛 し , 相 関 の あ る 標 本 群 を ク ラ ス タ と し て 表 示 し て い る . 今 後 の 課 題 と し て , そ れ 以 外 の 距 離 や ク ラ ス タ リ ン グ 手 法 の 適 用 に よ っ て , さ ら に 多 彩 な 数 値 特 性 を 可 視 化 で き る よ う に し た い . 特 に , 異 常 値 の 見 ら れ る 標 本 群 ど う し に ど の よ う な 相 関 が 見 ら れ る か , あ る い は ど の 時 刻 が 重 要 で あ る か , と い っ た 点 に つ い て さ ら に 考 察 を 深 め た い .
参 考 文 献
[1] S. Yagi, Y. Uchida, T. Itoh, A Polyline-Based Visualization Technique for Tagged Time-Varying Data, 16th International Conference on Information Visualisation (IV2012), 106-111, 2012.
[2]
M. Imoto, T. Itoh, A 3D Visualization Technique for Large Scale Time-Varying Data, 14th International Conference on Information Visualisation (IV2010), 17-22, 2010.[3] A. Hayashi, T. Itoh, S. Nakamura, A Visual Analytics Tool for System Logs Adopting Variable Recommendation and Feature-Based Filtering, 17th International Conference on Information Visualisation (IV2013), 1-10, 2013.
[4] H. Suematsu, S. Yagi, T. Itoh, Y. Motohashi, K. Aoki, S. Morinaga, A Heatmap-Based Time-Varying Multi-Variate Data Visualization Unifying Numeric and Categorical Variables, 18th International Conference on Information Visualisation (IV2014), 84-87, 2014.
[5] X. Yuan, D. Ren, Z. Wang, C. Guo, Dimension Projection Matrix/Tree: Interactive Subspace Visual Exploration and Analysis of High Dimensional Data, IEEE Transactions on Visualization and Computer Graphics, 19(12), 2625-2633, 2013.
[6] Z. Zhang, K. T. McDonnel, E. Zadak, K. Muller, Visual Correlation Analysis of Numerical and Categorical Data on the Correlation Map, IEEE Transactions on Visualization and Computer Graphics , 21(2), 289–303, 2015.