• 検索結果がありません。

クラスタリングとヒートマップによる高次元データ可視化

N/A
N/A
Protected

Academic year: 2021

シェア "クラスタリングとヒートマップによる高次元データ可視化"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

DEIM Forum 2016 F4-3

クラスタリングとヒートマップによる時系列データ可視化

熊谷 沙津希

伊藤 貴之

本橋 陽介

梅津 圭介

高塚 正浩

‡‡

†お茶の水女子大学大学院

人間文化創成科学研科 〒112-0012 東京文京区大塚 2-1-1

‡日本電気株式会社情報・ナレッジ研究所

〒211-8666 神奈川県川崎市中原区下沼部 1753

‡‡

The University of Sydney, Faculty of Engineering and Information Technologies J12 School of IT Building, The University of Sydney NSW 2006 Australia

E-mail: †{satsuki, itot}@itolab.is.ocha.ac.jp, ‡y-motohashi@bk.jp.nec.com, ‡k-umezu@ak.nec.com,

‡‡masa.takatsuka@sydneyu.edu.au

あらまし 時系列データの可視化には折れ線グラフと並んでヒートマップがよく用いられる.ヒートマップは標本 数の多い時系列データにおいて大きな画面空間を要することから,重要でない標本や時刻のフィルタリングが重要 となる.本報告ではヒートマップを用いた時間列データ可視化の一手法として,標本群や時刻群の位置関係を表現 するために散布図表示を併用し,さらに標本と時刻をフィルタリングするためのGUIを搭載した手法を提案する. 我々の実装では,任意の2標本間または2時刻間の距離を定義し,その距離を用いて標本群や時刻群の系統樹を構築 し,それに沿ってヒートマップのデザインを決定する.それと同時に,標本群および時刻群の位置関係を2つの散布 図で表示することで,標本群や時刻群の分布を可視化する. キーワード ヒートマップ,可視化,クラスタリング

1. 概 要

ヒ ー ト マ ッ プ は , 時 系 列 デ ー タ 可 視 化 の た め の 効 果 的 な 表 現 の 一 つ で あ り , 折 れ 線 グ ラ フ と 同 様 に 広 く 用 い ら れ て い る 手 法 で あ る . し か し な が ら , 入 力 デ ー タ が 変 数 や 時 刻 を 多 数 含 む と き , 表 示 の た め の 画 面 領 域 を 大 幅 に 必 要 と す る 場 合 が あ る . 我 々 は , 時 系 列 デ ー タ 可 視 化 に お い て ヒ ー ト マ ッ プ を 適 切 に 形 成 す る と と も に , 重 要 で は な い 標 本 や 時 刻 を 対 話 的 に フ ィ ル タ リ ン グ す る こ と が 重 要 で あ る と 考 え る . 本 報 告 で は , 変 数 と 時 刻 の 有 意 義 な 表 示 を 可 能 に し , ユ ー ザ が 対 話 的 に 操 作 で き る 時 系 列 デ ー タ の た め の ヒ ー ト マ ッ プ ベ ー ス な 可 視 化 手 法 に つ い て 議 論 す る . 我 々 が 開 発 し て い る ヒ ー ト マ ッ プ ベ ー ス の 可 視 化 手 法 の 画 面 キ ャ プ チ ャ を 図 1 に 示 す . 本 手 法 で は 2 標 本 間 の 非 類 似 度 ,お よ び 2 時 刻 間 の 非 類 似 度 を 算 出 し , そ の 位 置 関 係 を2 つ の 散 布 図 で 表 示 す る . そ れ と 同 時 に , 非 類 似 度 に も と づ い て 標 本 群 の 系 統 樹 を 生 成 し , 系 統 樹 上 で の 標 本 群 の 隣 接 性 に も と づ い て ヒ ー ト マ ッ プ を 生 成 す る . 図 1 に お い て 画 面 の 左 半 分 に は ヒ ー ト マ ッ プ が 表 示 さ れ , 画 面 の 右 半 分 に は2 つ の 散 布 図 が 表 示 さ れ て い る . 画 面 の 右 端 に は 2 つ の ス ラ イ ダ ー 部 品 が 搭 載 さ れ て お り , こ れ を 操 作 す る こ と で 重 要 で な い 標 本 , ま た は 重 要 で な い 時 刻 を ヒ ー ト マ ッ プ か ら 割 愛 す る た め の 閾 値 を 調 節 す る こ と が で き る . 図 1 提 案 手 法 の 画 面 キ ャ プ チ ャ 例

2. 関 連 研 究

時 系 列 デ ー タ の 可 視 化 に は , 一 般 的 に 折 れ 線 グ ラ フ や ヒ ー ト マ ッ プ を 用 い た 可 視 化 が 利 用 さ れ て い る . 画 面 空 間 の 横 軸 に 時 刻 を 割 り 当 て る 形 式 で 時 系 列 デ ー タ を 可 視 化 す る 手 法 と し て , 折 れ 線 グ ラ フ と ヒ ー ト マ ッ プ が 広 く 用 い ら れ て い る . 折 れ 線 グ ラ フ は ヒ ー ト マ ッ プ に 比 べ て , 各 標 本 に お け る 正 確 な 数 値 を 読 み 取 り や す い , ま た 線 の 傾 き か ら 数 値 の 上 昇 や 下 降 を 読 み 取 り や す い , な ど の 利 点 が あ る . し か し , デ ー タ を 構 成 す る 標 本 数 の 増 加 と と も に , 折 れ 線 ど う し の 絡 み 合 い も 増 加 し , 視 認 性 低 下 の 原 因 と な る . こ れ ら の 問

(2)

題 を 解 決 す る た め に , 折 れ 線 の 表 示 数 を 対 話 的 に 調 節 す る 手 法 が 提 案 さ れ て い る[1].ま た ,数 値 の 範 囲 が 大 き く , か つ 数 値 分 布 が 不 均 一 で あ る 場 合 に は , 画 面 領 域 を 浪 費 す る よ う な 可 視 化 結 果 に な る こ と が 多 い , と い う 問 題 も あ る . ヒ ー ト マ ッ プ は 値 の 大 き さ を 色 で 表 示 す る 可 視 化 手 法 で あ る . ヒ ー ト マ ッ プ を 用 い た 時 系 列 デ ー タ の 可 視 化 に は , デ ー タ を 構 成 す る 標 本 を 縦 軸 に 沿 っ て 一 列 ず つ に 並 べ , 横 軸 に 何 ら か の 変 数 ( 時 系 列 デ ー タ の 場 合 に は 時 刻 ) を 割 り 当 て て , 両 軸 を 分 割 し て 得 ら れ る 各 領 域 に 色 付 け る . ヒ ー ト マ ッ プ は 標 本 数 が 大 き な デ ー タ に お い て も , 数 値 を 表 現 す る 形 状 が 画 面 上 で 重 な り 絡 み 合 う こ と が な い た め , 視 認 性 の 維 持 が 容 易 で あ る . さ ら に 折 れ 線 グ ラ フ と 比 較 し て , 数 値 の 範 囲 や 分 布 に よ り 表 示 領 域 を 浪 費 す る よ う な 可 視 化 結 果 を 生 じ る こ と も な い . ヒ ー ト マ ッ プ を 用 い た 可 視 化 で は , 標 本 や 変 数 を 縦 軸 に 沿 っ て 並 べ る 順 番 に よ っ て , そ の 効 果 が 大 き く 変 わ る . こ こ で 井 元 ら は ヒ ー ト マ ッ プ の 時 間 的 に 変 化 す る デ ー タ の 興 味 深 い 結 果 を 抽 出 す る 手 法 を 定 時 し た [2].さ ら に ,標 本 の 画 面 上 で の 配 置 順 を 決 定 す る た め の 一 手 段 と し て , 類 似 性 に も と づ い て 標 本 の 分 類 や 順 列 化 を 適 用 す る こ と が 考 え ら れ る[3,4]. し か し こ れ ら の 手 法 で は ,k-means 法 を 単 純 に 適 用 し て 標 本 を ク ラ ス タ リ ン グ し て い る た め , 類 似 性 は 低 い が 関 係 性 の 高 い 標 本 を 視 覚 的 に 比 較 す る こ と が 容 易 で は な い . 例 え ば 負 の 相 関 を 有 す る 変 数 が 同 一 の ク ラ ス タ に 属 す る こ と が な い た め , こ の よ う な 変 数 を 視 覚 的 に 比 較 す る こ と が 容 易 で は な い . 多 次 元 デ ー タ の 分 析 に お い て , 次 元 間 の 相 関 や 類 似 度 を 散 布 図 で 表 示 す る 手 法 が い く つ か 発 表 さ れ て い る . Yuan ら の 手 法 [5]や Zhang ら の 手 法 [6]で は , 多 次 元 デ ー タ を 構 成 す る 各 次 元 を , 標 本 数 だ け 次 元 が あ る ベ ク タ と し て 扱 い ,そ の 非 類 似 度 を 散 布 図 で 表 示 し て い る . 提 案 手 法 の 画 面 右 側 に あ る 2 つ の 散 布 図 も 同 様 な 考 え 方 に も と づ い て 生 成 さ れ て い る .

3. 変 数 間 距 離 に 基 づ く ヒ ー ト マ ッ プ 表 示

本 章 で は 提 案 手 法 が 前 提 と す る デ ー タ 構 造 を 定 義 し , 全 体 的 な 処 理 手 順 を 述 べ た の ち に , 具 体 的 な 実 装 方 法 に つ い て 論 じ る . 3.1 デ ー タ 構 造 と 処 理 手 順 入 力 情 報 と な る 時 系 列 デ ー タ がm 標 本 お よ び n 時 刻 を 有 す る デ ー タ で あ る と す る . こ の と き 本 報 告 で は , 標 本 群A お よ び 時 刻 群 T を 以 下 の よ う に 表 現 す る .こ こ でvij は i 番 目 の 標 本 の j 番 目 の 時 刻 に お け る 実 数 値 で あ る .

A = {𝑎

!

, … , 𝑎

!

}

𝑎

!

= {𝑣

!!

, … , 𝑣

!"

}

T = {𝑡

!

, … , 𝑡

!

}

𝑡

!

= {𝑣

!!

, … , 𝑣

!"

}

以 上 の 定 義 に よ り ,各 標 本 お よ び 各 時 刻 は ベ ク タ と し て 表 現 さ れ る . 図 2(1)の 赤 線 が 1 個 の 標 本 を , 図 2(1) の 青 線 が 1 個 の 時 刻 に 対 応 す る . 提 案 手 法 で は 任 意 の 時 刻 間 の 非 類 似 度 ( 以 下 距 離 と 称 す る ) を 算 出 し て , そ れ ら の 距 離 関 係 を 表 す 散 布 図 を 図 2(2)の よ う に 表 示 す る . 同 様 に 提 案 手 法 で は , 任 意 の 標 本 間 の 距 離 を 算 出 し て , そ れ ら の 距 離 関 係 を 表 す 散 布 図 を 図 2(3)の よ う に 表 示 す る . さ ら に 提 案 手 法 で は , 時 刻 群 と 標 本 群 に ク ラ ス タ リ ン グ を 適 用 す る こ と で , ヒ ー ト マ ッ プ 上 で の 表 示 対 象 と な る 時 刻 群 と 標 本 群 を 特 定 す る ( 図2(4)). 図 2 提 案 手 法 の 処 理 手 順 3.2 標 本 間 の 距 離 算 出 2 章 で 論 じ た ヒ ー ト マ ッ プ 型 の 時 系 列 デ ー タ 可 視 化 手 法 の 問 題 点 を 解 決 す る た め に , 変 数 間 の 類 似 性 に 着 目 す る の で は な く , 類 似 性 に 限 定 せ ず に 任 意 の 変 数 間 距 離 を 算 出 し , そ れ に 基 づ い て 生 成 さ れ た 距 離 行 列 を 用 い , 変 数 を ク ラ ス タ リ ン グ す る こ と を 考 え る . 我 々 は 正 と 負 の 相 関 に お い て 変 数 間 の 関 係 を 観 察 し た い と 考 え ,相 関 係 数 に も と づ い て 変 数 間 距 離 を 算 出 し こ れ に ク ラ ス タ リ ン グ を 適 用 す る こ と に し た .こ こ で 高 次 元 デ ー タ を 構 成 す る 変 数𝑣 = {𝑣!… 𝑣!}と し , i 番 目 の 変 数 は 数 値𝑣!= {𝑣!!… 𝑣!"}を 持 つ と す る .現 時 点 の 我 々 の 実 装 で は ケ ン ド ー ル 順 位 相 関 係 数 を 適 用 し て ,式(1)か ら i 番 目 と j 番 目 の 変 数 間 の 相 関 係 数𝑑 𝑖, 𝑗 を 算 出 す る . ま た , こ の と き P は 変 数 i に お け る 任 意 の 隣 り 合 う 2 つ の 時 刻 と , 変 数 j の こ れ に 対 応 す る 2 つ の 時 刻 に つ い て ,そ れ ぞ れ の 組 の 大 小 関 係 が 一 致 す る と き 1 を 加 算 し ,不 一 致 の と き -1 を 加 算 し た 和 と す る . 𝑑 𝑖, 𝑗 = 4𝑃 𝑛(𝑛 − 1)− 1     こ こ で 得 ら れ た 値 を 式(2)に 適 用 し , i 番 目 と j 番 目 の 変 数 間 の 距 離𝐿!,!を 得 る .

(3)

𝐿!,! = 1 − 𝑑 𝑖, 𝑗   上 記 処 理 を 全 て の 2 変 数 の ペ ア に 適 用 し , 距 離 行 列 を 得 る . 続 い て こ の 距 離 行 列 に , 以 下 を 用 い て ク ラ ス タ リ ン グ を 適 用 す る . 3.3 階 層 型 ク ラ ス タ リ ン グ と ヒ ー ト マ ッ プ デ ザ イ ン 階 層 型 ク ラ ス タ リ ン グ と は , 近 い 距 離 に あ る 標 本 を 1 個 ず つ 階 層 的 に 連 結 さ せ , 標 本 を 一 続 き に つ な げ た 系 統 樹 を 形 成 し , ク ラ ス タ を ボ ト ム ア ッ プ に 形 成 す る 手 法 で あ る . 提 案 手 法 で は 階 層 型 ク ラ ス タ リ ン グ 手 法 に よ り , 全 て の 標 本 を 連 結 す る 系 統 樹 を 構 築 し , そ の 隣 接 順 に 沿 っ て ヒ ー ト マ ッ プ 上 で の 標 本 の 並 び 順 を 決 定 す る . ま た 距 離 の 閾 値 を 与 え る こ と で , 標 本 群 の ク ラ ス タ を 形 成 す る . 提 案 手 法 に お け る ヒ ー ト マ ッ プ デ ザ イ ン の 考 え 方 を 図3 に 示 す . 図 3 系 統 樹 に も と づ く ヒ ー ト マ ッ プ デ ザ イ ン 提 案 手 法 が 表 示 す る ヒ ー ト マ ッ プ で は , 横 軸 が 時 刻 を 表 し , 標 本 群 が 画 面 の 縦 軸 に 沿 っ て 上 下 に 並 ぶ . 同 一 ク ラ ス タ に 属 す る 標 本 群 は 間 隔 を 空 け ず に ひ と 続 き に 並 べ て 表 示 し , 異 な る ク ラ ス タ に 属 す る 標 本 間 に は 境 界 線 を 表 す 灰 色 の 帯 を は さ ん で 表 示 す る . ま た 我 々 の 実 装 で は , 表 示 す る ク ラ ス タ の 構 成 標 本 数 の 下 限 値 を 設 定 し , そ れ よ り も 標 本 数 の 少 な い ク ラ ス タ は 表 示 し な い , と い う 制 約 を 設 け て い る . 我 々 の 実 装 で は 原 則 と し て2 を 下 限 値 と し て い る . い ず れ の 他 の 標 本 と も 強 い 相 関 を 有 さ な い 標 本 は 標 本 数1 の ク ラ ス タ を 構 成 す る こ と か ら , 下 限 値 を2 と す る こ と で そ の よ う な 標 本 は 可 視 化 す る 意 義 が な い と し , ヒ ー ト マ ッ プ か ら 割 愛 す る . 系 統 樹 を 構 築 す る た め の 提 案 手 法 で の 具 体 的 な 実 装 に つ い て 述 べ る . 木 構 造 に は 各 変 数 に 相 当 す る リ ー フ 部 分 と , 任 意 の 変 数 同 士 を 連 結 さ せ る 際 の 分 岐 に 当 た る ブ ラ ン チ 部 分 が あ る .構 築 さ れ た 系 統 樹 を 保 存 し , こ の ブ ラ ン チ 部 分 に 番 号 を 振 り 分 け る . よ り 下 位 層 に リ ー フ を 所 有 す る ブ ラ ン チ に 若 い 番 号 を 付 与 し , 各 階 層 に お い て 同 様 に ブ ラ ン チ に 番 号 を 付 与 す る . ヒ ー ト マ ッ プ 表 示 の 際 に は こ の 番 号 が 若 い 順 に 下 か ら 表 示 す る た め , ユ ー ザ 操 作 に よ っ て 変 わ る ク ラ ス タ リ ン グ の 表 示 結 果 の 前 後 で , 各 ク ラ ス タ の 位 置 , お よ び ク ラ ス タ 内 の 各 標 本 の 位 置 関 係 が 大 き く 入 れ 替 わ る こ と が な い . こ れ に よ り , ユ ー ザ の メ ン タ ル マ ッ プ を 保 持 し や す い 可 視 化 を 実 現 で き る . 同 一 の 入 力 デ ー タ に 対 し て ク ラ ス タ リ ン グ の 閾 値 を 調 節 し て 可 視 化 結 果 の 例 を 図 4 に 示 す . 図 4 ク ラ ス タ リ ン グ 結 果 と ヒ ー ト マ ッ プ 表 示 (左 )閾 値 0.2 (右 )閾 値 0.25 な お 我 々 の 実 装 で は , 時 刻 群 に も 同 様 に 階 層 型 ク ラ ス タ リ ン グ を 適 用 し , 表 示 す る ク ラ ス タ の 構 成 時 刻 数 の 下 限 値 を 2 と 設 定 し て い る . こ れ に よ り , 他 の い ず れ の 時 刻 と も 数 値 分 布 が 全 く 異 な る ノ イ ズ の よ う な 時 刻 を ヒ ー ト マ ッ プ か ら 割 愛 す る こ と が で き る . 3.4 カ ラ ー マ ッ プ 我 々 の 実 装 で は ヒ ー ト マ ッ プ の 色 計 算 に 以 下 の 2 種 類 の カ ラ ー マ ッ プ を 採 用 し て い る . な お 色 計 算 に は HSB 表 色 系 を 採 用 し ,入 力 値 に は vijを[0,1]の 区 間 に 正 規 化 し た 値 v’ijを 使 用 す る も の と す る . 1) 色 相 の み を 変 化 さ せ る 汎 用 的 な カ ラ ー マ ッ プ 圧 倒 的 に 多 数 の 可 視 化 ソ フ ト ウ ェ ア が 採 用 し て い る 色 計 算 . 色 相 を v’ijの 関 数 と し , 彩 度 と 明 度 を 定 数 と す る . 2) 平 均 値 と 相 対 値 に 着 目 し た カ ラ ー マ ッ プ HSB 値 を 以 下 の 式 で 算 出 す る . H = hue(𝑣! !"), 𝑆 = 𝑠𝑎𝑡𝑢𝑟𝑎𝑡𝑖𝑜𝑛 𝑣!!!" , 𝐵 = 𝑐𝑜𝑛𝑠𝑡 こ こ で hue お よ び saturation は 色 相 と 彩 度 を 算 出 す る 関 数 で あ り ,v′!" は 1 つ の 標 本 に お け る v’ijの 平 均 値 で あ る と す る . ま た𝑣′′!"= 𝑣′!"− v′!" と す る . こ の 表 現 に よ り , 色 相 に よ っ て 標 本 全 体 の 数 値 の 大 小 を 表 現 し , 彩 度 に よ っ て 単 一 の 標 本 に お け る 数 値 の 変 化 を 表 現 す る .

(4)

3.5 散 布 図 表 示 と ユ ー ザ イ ン タ フ ェ ー ス 我 々 の 実 装 で は 図 1 に 示 す 通 り , ク ラ ス タ リ ン グ の た め の 閾 値 を 設 定 す る ス ラ イ ダ ー を 搭 載 し て い る . ス ラ イ ダ ー 操 作 を 停 止 す る た び に 提 案 手 法 で は , ス ラ イ ダ ー の 位 置 に よ っ て 指 定 さ れ る 閾 値 に も と づ い て , 標 本 ま た は 時 刻 の ク ラ ス タ を 形 成 す る . ま た 我 々 の 実 装 で は , 系 統 樹 が 構 築 さ れ る 様 子 を 散 布 図 上 で 可 視 化 す る . 画 面 右 側 の 2 つ の 散 布 図 で は , 標 本 群 ま た は 時 刻 群 の 距 離 行 列 に 対 し てMDS( 多 次 元 尺 度 構 成 法 ) を 適 用 す る こ と で 各 標 本 ま た は 各 時 刻 の 散 布 図 上 の 位 置 を 算 出 し て い る . こ の 散 布 図 で は ス ラ イ ダ ー 操 作 に 連 動 し て , 同 一 ク ラ ス タ に 所 属 す る 2 標 本 ま た は 2 時 刻 を 連 結 す る 線 分 を 描 画 す る . こ の 散 布 図 表 示 に よ り , ヒ ー ト マ ッ プ 表 示 だ け で は 視 覚 的 に 把 握 し き れ な い 標 本 間 ま た は 時 刻 間 の 関 係 を 把 握 し や す く な る .

4. 実 行 例

本 章 で は 実 デ ー タ を 用 い た 提 案 手 法 の 実 行 例 を 示 す . 我 々 は 気 象 庁 AMeDAS に よ っ て 記 録 さ れ た 全 国 86 地 点 に お け る 1 ヶ 月 間( 31 日 間 )の 3 時 間 お き の 気 温 ( 測 定 値 合 計248 回 ) を 可 視 化 し た . 以 下 , ユ ー ザ の 対 話 操 作 に よ る 閾 値 設 定 と と も に 階 層 型 ク ラ ス タ リ ン グ が 適 用 さ れ , そ の ク ラ ス タ リ ン グ 結 果 に 伴 っ て 異 な る ヒ ー ト マ ッ プ が 表 示 さ れ る 様 子 を 示 す . ま た , 提 案 手 法 で 画 面 右 側 に 表 示 さ れ る 散 布 図 に つ い て も 同 時 に 解 説 す る . 提 案 手 法 に お い て ユ ー ザ の 対 話 操 作 に よ っ て 閾 値 を 調 節 し な が ら 生 成 し た ヒ ー ト マ ッ プ を 図 5 に 示 す . こ の ヒ ー ト マ ッ プ に お い て ,色 の つ い た 帯 は 標 本 群( 本 実 行 例 の 場 合AMeDAS の 観 測 地 点 群 )の ク ラ ス タ を 表 す .ま た ,こ の 操 作 に と も な っ て 標 本 群( 観 測 地 点 群 ) の 散 布 図 を 構 成 す る 点 群 を 連 結 す る 線 分 が 表 示 さ れ る 様 子 を 図 6 に 示 す . こ こ で 変 数𝑑𝑎𝑡𝑎!"#"$%は , 標 本 群 に よ っ て 構 成 さ れ る デ ン ド ロ グ ラ ム か ら ク ラ ス タ を 生 成 す る た め の 閾 値 で あ る .𝑑𝑎𝑡𝑎!"#"$%の 値 が 大 き く な る ほ ど , 図5 に 示 す ヒ ー ト マ ッ プ で は 多 く の 観 測 地 点 に お け る 気 温 が 表 示 さ れ , 図6 に 示 す 散 布 図 で は 多 く の 点 群 が 線 分 で 連 結 さ れ る . 図 6 の 赤 丸 は 線 分 が 存 在 す る 部 位 を 示 し て い る . 以 上 の 適 用 例 か ら , 我 々 は 以 下 の 現 象 を 発 見 し た . [現 象 1] 北 海 道 や 沖 縄 に 属 す る 観 測 点 は𝑑𝑎𝑡𝑎!"#"$%値 が だ い ぶ 大 き く な っ て よ う や く ヒ ー ト マ ッ プ 上 に 表 示 さ れ る . [現 象 2] 同 じ 地 域 に 属 す る 観 測 点 の 中 に も ,𝑑𝑎𝑡𝑎!"#"$% 値 が 小 さ い う ち か ら ヒ ー ト マ ッ プ 上 に 表 示 さ れ る 観 測 点 と , だ い ぶ 大 き く な っ て よ う や く ヒ ー ト マ ッ プ 上 に 表 示 さ れ る 観 測 点 が 混 在 し て い る . 図 5 AMeDAS 気 温 デ ー タ の ヒ ー ト マ ッ プ 表 示 例 図 6 AMeDAS 気 象 デ ー タ へ の 散 布 図 表 示 例 以 上 の 現 象 に つ い て , 図 7 に 示 す 日 本 地 図 と と も に 考 察 す る . [現 象 1]の 原 因 と し て ,観 測 所 間 の 物 理 的 距 離 が 考 え ら れ る . 北 海 道 は 日 本 の 約 22%を 占 め て お り , 本 デ ー タ に お い て 約6400km2 1 観 測 所 が 割 り 当 て ら れ て い る .一 方 東 京 は 日 本 の 0.5%,つ ま り 約 2100km2に 1 観 測 所 が 割 り 当 て ら れ て い る . ま た , 沖 縄 県 は 周 辺 の 各 島 に1 観 測 所 が 割 り 当 て ら れ て い る . よ っ て 北 海 道 や 沖 縄 で は 観 測 所 間 の 気 象 傾 向 の 差 異 が 大 き い た め , 𝑑𝑎𝑡𝑎!"#"$%値 が だ い ぶ 大 き く な っ て よ う や く ヒ ー ト マ ッ プ 上 に 現 れ る . 続 い て[現 象 2]に つ い て 考 察 す る . [現 象 2]が 見 ら れ る 具 体 的 な 観 測 点 の 例 と し て , 中 国 地 方 に お け る 広 島

(5)

と 岡 山 , 鳥 取 と 松 江 , の2 組 が あ げ ら れ る . こ れ ら の 地 域 は 同 じ 中 国 地 方 で あ り な が ら , そ の 間 に 山 脈 が 立 ち は だ か っ て い る た め , 観 測 所 間 の 気 象 傾 向 の 差 が 大 き い .こ の た め 同 じ 地 域 に 属 し て い な が ら ,𝑑𝑎𝑡𝑎!"#"$%値 が だ い ぶ 大 き く な っ て よ う や く 同 一 ク ラ ス タ に 属 す る よ う に な る . 図 7 日 本 の 山 脈 地 図 (【 世 界 地 図 |SEKAICHIZU】の 日 本 地 図 を 元 に 著 者 が 手 を 加 え 作 成 し た . http://www.sekaichizu.jp/atlas/japan/p500_japan.html, 2016/02/12) 本 章 で 紹 介 し た AMeDAS 気 温 デ ー タ で の 実 行 例 と そ の 考 察 か ら , 提 案 手 法 に よ る 可 視 化 結 果 に は あ る 程 度 妥 当 性 が あ る と 考 え ら れ る . し か し な が ら 本 実 行 例 は , そ の 数 値 分 布 が す で に 十 分 解 明 さ れ て い る デ ー タ を 用 い る こ と で 可 視 化 結 果 の 妥 当 性 を 示 し た に 過 ぎ な い . 提 案 手 法 に 限 ら ず 可 視 化 技 術 が 本 来 目 指 す べ き 用 途 は , そ の 特 徴 が 明 ら か に な っ て い な い デ ー タ の 特 徴 を 視 覚 的 に 発 見 し , そ れ を 第 三 者 に 対 し て 表 現 す る 点 に あ る . そ こ で 今 後 の 課 題 と し て , ま だ 数 値 分 布 が 明 ら か に な っ て い な い デ ー タ を 可 視 化 し て , そ の 特 徴 を 発 見 す る タ ス ク を も っ て , 提 案 手 法 の 有 用 性 を 検 証 し た い .

5. 応 用 : 異 常 値 を 含 む 標 本 間 の 相 関 の 可 視

本 報 告 の 提 案 手 法 の 応 用 と し て 我 々 は 現 在 , 時 系 列 デ ー タ 中 で 異 常 値 を 含 む 標 本 を 抽 出 し , そ の 標 本 間 の 相 関 を 可 視 化 す る ツ ー ル を 開 発 し て い る . 3.1 節 と 同 様 に , 入 力 情 報 と な る 時 系 列 デ ー タ が m 標 本 お よ び n 時 刻 を 有 す る も の と す る . こ の と き 我 々 の 実 装 で は ,標 本 群

A = {𝑎

!

, … , 𝑎

!

}

の 中 か ら 異 常 値 を 含 む 上 位 m’個 の 標 本 を 抽 出 す る . 以 降 こ れ を

A′ = {𝑎

!

, … , 𝑎

!!

}

と 記 述 す る . 我 々 の 現 在 の 実 装 で は 単 純 に ,i 番 目 の 標 本 を 構 成 す る 各 時 刻 の 実 数 値 に 対 し て

(𝑣

!"

− 𝜇

!

)/𝜎

! を 算 出 し ,そ の 最 大 値 が 上 位 で あ る m’個 の 標 本 を 抽 出 し て い る . こ こ で

𝜇

!は i 番 目 の 標 本 に お け る 実 数 値 の 平 均 値 ,

𝜎

!は i 番 目 の 標 本 に お け る 実 数 値 の 標 準 偏 差 で あ る . こ れ 以 外 の 異 常 値 検 出 方 法 を 適 用 す る こ と も 可 能 で あ る . 以 上 の 処 理 に よ っ て 抽 出 さ れ た 標 本 群 A’に 提 案 手 法 を 適 用 す る こ と で , 異 常 値 を 含 む 標 本 間 の 相 関 を 可 視 化 で き る . こ の よ う な 可 視 化 は 例 え ば , 「 同 じ 時 期 に 異 常 に よ く 売 れ る 商 品 間 の 売 上 の 相 関 を 可 視 化 す る 」 「 同 じ 時 期 に 異 常 に よ く ア ク セ ス さ れ る ウ ェ ブ ペ ー ジ 間 の ア ク セ ス 数 の 相 関 を 可 視 化 す る 」 と い っ た 用 途 に 有 効 で あ る . 図 5 に そ の 例 を 示 す . な お , こ の 応 用 例 に 関 す る 実 装 で は , 散 布 図 の 表 示 を 割 愛 し て い る . か わ り に こ の 実 装 で は , ユ ー ザ に よ る ヒ ー ト マ ッ プ 上 で の マ ウ ス ク リ ッ ク 操 作 に 対 応 す る 箇 所 の 詳 細 情 報 を 表 示 す る テ キ ス ト 表 示 欄 を ウ ィ ン ド ウ 右 下 部 に 表 示 し て い る .

6. ま と め と 今 後 の 課 題

本 報 告 で は , ヒ ー ト マ ッ プ を 用 い た 時 系 列 デ ー タ 可 視 化 の 一 手 法 を 提 案 し た . 提 案 手 法 で は 時 間 軸 を 横 軸 と し て 標 本 群 を 縦 軸 に 並 べ る 一 般 的 な ヒ ー ト マ ッ プ と は 別 に , 時 刻 群 と 標 本 群 の 位 置 関 係 を 表 示 す る 2 つ の 散 布 図 を 搭 載 し て い る . 時 刻 群 と 標 本 群 は そ れ ぞ れ 系 統 樹 に よ っ て 構 造 化 さ れ , 対 話 操 作 に よ る 閾 値 設 定 と と も に 階 層 型 ク ラ ス タ リ ン グ が 適 用 さ れ , そ の ク ラ ス タ リ ン グ 結 果 に 沿 っ て ヒ ー ト マ ッ プ が 更 新 さ れ る 仕 組 み と な っ て い る . ま た ク ラ ス タ 形 成 の 過 程 は 散 布 図 上 に も 表 示 さ れ る . 図 8 応 用:異 常 値 を 含 む 標 本 間 の 相 関 の 可 視 化

(6)

現 在 の 実 装 で は 相 関 係 数 か ら 算 出 し た 距 離 に も と づ く ク ラ ス タ リ ン グ を 適 用 す る こ と で , ノ イ ズ と な る 時 刻 を 割 愛 し , 相 関 の あ る 標 本 群 を ク ラ ス タ と し て 表 示 し て い る . 今 後 の 課 題 と し て , そ れ 以 外 の 距 離 や ク ラ ス タ リ ン グ 手 法 の 適 用 に よ っ て , さ ら に 多 彩 な 数 値 特 性 を 可 視 化 で き る よ う に し た い . 特 に , 異 常 値 の 見 ら れ る 標 本 群 ど う し に ど の よ う な 相 関 が 見 ら れ る か , あ る い は ど の 時 刻 が 重 要 で あ る か , と い っ た 点 に つ い て さ ら に 考 察 を 深 め た い .

参 考 文 献

[1] S. Yagi, Y. Uchida, T. Itoh, A Polyline-Based Visualization Technique for Tagged Time-Varying Data, 16th International Conference on Information Visualisation (IV2012), 106-111, 2012.

[2]

M. Imoto, T. Itoh, A 3D Visualization Technique for Large Scale Time-Varying Data, 14th International Conference on Information Visualisation (IV2010), 17-22, 2010.

[3] A. Hayashi, T. Itoh, S. Nakamura, A Visual Analytics Tool for System Logs Adopting Variable Recommendation and Feature-Based Filtering, 17th International Conference on Information Visualisation (IV2013), 1-10, 2013.

[4] H. Suematsu, S. Yagi, T. Itoh, Y. Motohashi, K. Aoki, S. Morinaga, A Heatmap-Based Time-Varying Multi-Variate Data Visualization Unifying Numeric and Categorical Variables, 18th International Conference on Information Visualisation (IV2014), 84-87, 2014.

[5] X. Yuan, D. Ren, Z. Wang, C. Guo, Dimension Projection Matrix/Tree: Interactive Subspace Visual Exploration and Analysis of High Dimensional Data, IEEE Transactions on Visualization and Computer Graphics, 19(12), 2625-2633, 2013.

[6] Z. Zhang, K. T. McDonnel, E. Zadak, K. Muller, Visual Correlation Analysis of Numerical and Categorical Data on the Correlation Map, IEEE Transactions on Visualization and Computer Graphics , 21(2), 289–303, 2015.

参照

関連したドキュメント

CONCLUSIONS: We recommend using the precuneus and hippocampus as ROIs without modulation and smoothing for DARTEL-based voxel-based morphometry as a tool for diagnosing

 Following some incidents of abuse of power, including allegations of custodial death, inhuman treatment 35 and torture 36 , Bangladesh Legal Aid and Services Trust (BLAST),

The connection weights of the trained multilayer neural network are investigated in order to analyze feature extracted by the neural network in the learning process. Magnitude of

Regional Clustering and Visualization of Industrial Structure based on Principal Component Analysis for Input-output Table Data.. Division of Human and Socio-Environmental

This section will show how the proposed reliability assessment method for cutting tool is applied and how the cutting tool reliability is improved using the proposed reliability

Based on the stability theory of fractional-order differential equations, Routh-Hurwitz stability condition, and by using linear control, simpler controllers are designed to

A class of nonlinear fourth-order telegraph-di ff usion equations TDE for image restoration are proposed based on fourth-order TDE and bilateral filtering.. The proposed model

These authors make the following objection to the classical Cahn-Hilliard theory: it does not seem to arise from an exact macroscopic description of microscopic models of