• 検索結果がありません。

データ解析システムの設計と実装

次に,このシステムの概念図を以下の図5.4に示す.

AP 生ログデータ

データ

選定 解析 可視化 サービス

観光客 観光提供側

提供 本システム 今後の展望

図 5.4: システム概念図

このシステムは観光地にて現地を回遊する観光客に対して提供されている無料サー ビスであるKurashiki Free Wi-Fiに,観光客が接続した時のAPの生ログデータを取 得している.

本システムにおいてはその中から観光客である確度の高いデータを選定する前処理 を行った上で解析を行い,観光行動情報の可視化を行う.その可視化結果をサービス に落とし込み,地方自治体や地方のビジネス主体などの観光提供側,そして観光客と いったステークホルダーに役立つものを設計することを最終的な目標としている.

図5.5において,システムの概要図を示す.

AP 生ログデータ

クリーニング モジュール

観光客ログ抽出 モジュール DB

データの選定部

共起行列 モジュール 集計 モジュール 解析部

エリア

ヒートマップ スポット 時間ごとのグラフ 可視化部

図 5.5: システム概要図

同じように得た生ログデータから,今回の分析に使用するログデータの選定を行っ た.セッションが確立した時に生じるログのみをまず抽出する.その後,1時間以内に 同じAPに接続したログの合ったMACアドレスについては,そのAPに接続した回数 を1とみなすユニーク処理のクリーニングを行なった.それをデータベースに格納し,

観光客ログを抽出するモジュールに移行する.

住民や地域ビジネスの主体,運搬業者や通りすがりの観光をしていない人のログデー タを削除するため,13ヶ月の中で2AP以上への接続が認められ,かつ13ヶ月の中で 接続が一度でもあった月が4ヶ月未満であるMACアドレスを抽出した.その後,その MACアドレスが最初に接続したログが認められた時間のタイムスタンプと最後に接続 したログのタイムスタンプの差分が15分未満であるものは,観光をしていないか観光 客ではないとみなし削除する処理を行なった.

以上のクリーニングを行なってから,共起行列とMicrosoft Excelを用いて解析を行 い,可視化をした.共起行列は,AP毎に前後にどのAPに繋げられている事が多いか を表せる行列である.まずジャンルによってAPを4つにグループ分けし,アクセス数 の合計を時間軸で折れ線グラフにして表示した。次にそのグループと他のグループと の間での流入流出をSankey Diagramにて可視化した.そしてグループの中のAP毎に 他のAPとの繋がりの太さをChord Diagramを用い可視化した.

続いてExcelを用い,時間ごとのアクセス数の推移をヒートマップにして表示を行

なった.

第 6

美観地区における実証実験

 本章では,倉敷美観地区において行った実証実験について記述する.