[1] [8] [2] [3] [4] [5] [6] [2] 5 [3] Crop() Forest( ) Grass( ) Urban( ) Water( ) Csurka [5] BoF Bag-of-Features BoF [6] Exif Flickr rest

(1)

DEIM Forum 2015 F6-1

ジオタグ写真を用いたユーザの訪問地のカテゴリ推定に基づく

ユーザの移動への意味付け

小松雅弥

†

廣田雅春

††

石川

博

†††

横山昌平

††††

†

静岡大学情報学部〒 432–8011 静岡県浜松市中区城北 3–5–1

††

首都大学東京システムデザイン研究科/日本学術振興会特別研究員 PD 〒 191–0065 東京都日野市旭が丘 6–6

†††

首都大学東京システムデザイン学部情報通信システムコース〒 191–0065 東京都日野市旭が丘 6–6

††††

静岡大学大学院情報学研究科〒 432–8011 静岡県浜松市中区城北 3–5–1

E-mail:

†

††

†††

††††

あらまし近年，Flickr などのソーシャルメディアでは写真が大量にアップロードされている．これらの写真には，テ

キストタグやジオタグなど写真の内容を表す重要な情報（メタデータ）が付与されている．本手法では，それらのメ

タデータを利用し，ジオタグが指し示すスポットのカテゴリ (レストラン，ホテル，観光スポット，交通機関) の推定

を行う．従来のカテゴリ推定は，画像や色の見た目の特徴量に着目している．そこで，本研究では，写真に付与され

ているテキストタグ，ジオタグから写真の撮影スポットのカテゴリを推定する．また，推定したカテゴリを用いて，

ユーザが任意に選択した 2 つのスポット間の移動中にどのようなカテゴリをもつスポットを経由するか，どこにどの

ようなカテゴリをもったスポットが存在するかを閲覧可能にするシステムを構築する．

キーワード

カテゴリ推定，情報抽出，移動軌跡，Flickr

1. はじめに

近年，GPS機能を持つスマートフォンやデジタルカメラの普及により，写真にジオタグなどの情報を容易に付与できるようになった．それらの写真はFlickr（注 1）やPanoramio（注 2）などのソーシャルメディアで多くのユーザによって大量に共有されている．また，これらの写真には，テキストタグやジオタグなど写真の内容を表す重要な情報が付与されている．本研究において，テキストタグとは，Flickr上でユーザが写真に付与できる任意の文字列である．ジオタグとは，その写真の撮影地点を表す緯度・経度情報である．加えて，ユーザは，興味のある場所やものを撮影すると考えられる．そのため，ソーシャルメディア上で共有されている写真や写真に付与されているジオタグなどのメタデータを利用し，観光ルートの推薦[1]やカテゴリ推定を用いた観光マップの作成[2]などの旅行支援の研究が増加している．これまでに，カテゴリ推定を用いた観光マップを作成するための研究[2] [3]がされている．それらの研究では，テキストタグは用いておらず，風景写真の画像特徴量や色特徴量を用いて，山や水辺などの風景のカテゴリを推定している．既存研究でテキストタグを扱わないのは，写真にテキストタグが付与されていない場合や，「city」と「town」のようにテキストタグの表記ゆれがあることが理由として挙げられている[2]．今回，約2億件からなるデーセットを構築し，その中で，（注1）：https://www.flickr.com/ （注2）：http://www.panoramio.com/ 表 1 収集した写真枚数とテキストタグが付与されている写真枚数場所写真枚数テキストタグ付き写真割合ロンドン 5,299,186 4,351,823 82.1% ニューヨーク 4,555,430 3,677,365 80.7% パリ 2,711,295 2,154,950 79.5% ロンドン，ニューヨーク，パリの3都市で撮影された写真枚数と，テキストタグの付与された写真枚数をそれぞれ表1に示す．表1において，写真が大量にある場所でのジオタグが付与されている写真には，おおよそ80%程度のテキストタグが付与されていることが確認できた．また，テキストタグはユーザが任意に決められるため，表記ゆれが生じてしまう．しかし，本研究ではテキストタグの共起を利用し，どのようなテキストタグが出現するかに着目することでカテゴリを推定するため，テキストタグ自体の意味は考慮しない．そのため，表記ゆれが生じた場合でもカテゴリの推定への影響は少ないと考えられる．本研究では，テキストタグやジオタグなどのメタデータを利用し，ジオタグが指し示す撮影スポットをレストラン，ホテル，観光スポット，交通機関の4つのカテゴリの推定を行い，可視化するシステムの構築を行う．本研究において，撮影スポットとは写真の撮影地点とその周辺の領域を意味する．また，推定したカテゴリを用いて，ユーザが任意に選択した2つのスポット間の移動中にどのようなカテゴリをもつスポットを経由するか，どこにどのようなカテゴリをもったスポットが存在するかを閲覧可能にするシステムを構築する．本論文で構築するシステムでは，ユーザが2つのスポットを選択することにより，選択した2つのスポットを同日に訪問しているユーザのスポット

(2)

間の移動軌跡から立ち寄った撮影スポットを抽出し，抽出した撮影スポットのカテゴリ推定を行う．移動軌跡は，あるユーザがアップロードした写真に付与されている撮影日時を時系列的に追うことで抽出する．本論文の構成は，以下のようになっている．第2章では，これまでに提案されているカテゴリ推定の手法など関連研究について述べる．第3章では，本論文で構築したシステムについて述べる．第4章では，評価実験を行い，提案システムの評価とシステムの結果，考察について述べる．第5章では，本論文で得られた成果とともに，今後の課題について述べる．

2.

3. 提案システム

本章では，メタデータが付与されている写真を用いて撮影スポットのカテゴリを推定する手法について述べる．撮影スポットは，抽出したユーザの移動軌跡に対して階層的クラスタリングを行い発見する．移動軌跡は，写真に付与されている撮影日時を時系列的に追うことで抽出する．カテゴリ推定には共起タグを利用し，レストラン，ホテル，観光スポット，交通機関の 4つのカテゴリを推定する．本論文で構成するシステムの概要を図1に示す．本システムはサーバサイドとクライアントサイドで構成されている．サーバサイドでは，ユーザが選択した２つのスポット間(e.g.，

Buckingham Palace，King’s Cross station)で経由しているスポットのカテゴリの推定を行う．はじめに，テキストタグが付与されていない写真の除去を行う．次に，階層的クラスタリングを行い撮影スポットを発見する．次に，各カテゴリに関連があると考えられるテキストタグと一緒に付与されているテキストタグのリストをカテゴリごとに作成しておき，それらを用いて，発見した撮影スポットのカテゴリを推定する．クライアントサイドでは，ユーザが候補地から選択した２つのスポットをサーバサイドへ送信する．そして，サーバサイドから受け取ったカテゴリ推定の結果をGoogle Maps（注 3）を用いて地図上に可視化する． 3. 1 撮影スポットの抽出はじめに，本論文で構築するシステムは，ユーザが選択した 2つのスポットS，G間の撮影スポットを抽出する．このとき， S，Gは異なる場所とする．次に，指定されたS，Gの両方を同日に訪問しているユーザを写真に付与されているメタデータを用いて抽出する．加えて，そのユーザが撮影した写真の撮影日時を利用し，時系列的に追うことで，S，G間の移動軌跡の抽出も行う．次に，抽出した移動軌跡に対し，クラスタリングを行い，撮影スポットの抽出を行う．奥山らの研究[8]では，2つの撮影地点間の距離に基づいた階層的クラスタリング手法を用いて撮影スポットの抽出を行っており，本研究でもこれを用いて撮影スポットの抽出を行なう．理由は，密度ベースのクラスタリングなどでは，写真が多く撮（注3）：https://maps.google.com/

(3)

表 2 各カテゴリに関連すると考えられるテキストタグカテゴリ関連すると考えられるテキストタグレストラン restaurant，cafe，bar，snack，food，dinner， lunch，breakfast ホテル hotel，accommodation，stay 観光スポット museum，gallery，tourism，attraction， scenery，building，structure 交通機関 station，airport，busstop，train，plane，bus，taxi 影されている場合には有効であると考えられるが，写真枚数が少ない場合もあり，その場合は距離に基づくクラスタリングの方が有効であると考えたためである．階層的クラスタリングの手法を以下に示す． (1)すべての写真の撮影地点をそれぞれクラスタとする． (2)最も距離が近い2つのクラスタをまとめて1つのクラスタとする．このとき，新たなクラスタの位置はクラスタに含まれる撮影地点の重心とする． (3) 2つのクラスタの最短距離が閾値以上になるまで，クラスタをまとめる作業を繰り返す． 2つの撮影地点間の距離を算出するとき，地球は楕円体のため，ユークリッド距離のように平面上の距離ではなく，楕円体を考慮した距離を計算する必要がある．そのため，本研究では，ヒュベニの公式を用いて，2つの撮影地点間の距離の計算を行う．式を以下に示す． D =√(dyM )2+ (dxN cos uy)2 (1) Dは2点間の距離(m)，dxは経度の差，dyは緯度の差，M は子午線曲率半径，N は卯酉線曲率半径，uyは緯度の平均値である． 3. 2 テキストタグリストの作成レストラン，ホテル，観光スポット，交通機関の4つのカテゴリごとにテキストタグリストを作成する．作成方法は，そのカテゴリに関連があると考えられるテキストタグを決め打ちし，そのテキストタグと一緒に付与されているテキストタグをリスト化する．決め打ちしたテキストタグと，どのカテゴリに関連していると思われるかを表2に示す．テキストタグリストを作成する理由は，抽出した撮影スポットで撮影された写真に付与されているテキストタグと比較し，そのテキストタグが、どのカテゴリのテキストタグリストにどのくらい含まれているかでカテゴリを推定するためである．テキストタグリストを作成するとき，テキストタグを1種類ずつ確認していき，そのテキストタグを何人のユーザが付与しているかを調べる．ユーザ数が1人以下の場合，そのテキストタグは，そのカテゴリでは特殊なものであると判断し，推定には不要であると考え，除去を行う． 3. 3 カテゴリの推定本研究では，撮影スポットをレストラン，ホテル，観光スポット，交通機関の4つのカテゴリに分類することを目指す．推定方法は，はじめに，抽出した撮影スポットを中心とした周囲100m以内で撮影された写真に付与されているテキストタグを収集する．次に，各テキストタグリストの出現回数を0から 1の間の値となるように正規化を行なう．正規化に用いた式を以下に示す． P (v) = (v− vmin) (vmax− vmin) (2) P (v)は正規化の結果（0∼1），vはテキストタグの出現回数， vminはテキストタグリスト中の最小出現回数，vmaxはテキストタグリスト中の最大出現回数である．また，正規化の結果はそのカテゴリでの，そのテキストタグの点数として扱う．次に，収集したテキストタグと，正規化したテキストタグリストを比較する．テキストタグリスト中に収集したテキストタグが付与されていた場合，そのカテゴリの得点として正規化の結果を加算し，最終的に最も得点の高いカテゴリをその撮影スポットでのカテゴリとする． 3. 4 インタフェース本節ではクライアントサイドのシステムについてのインターフェースについて述べる．インターフェースを図2に示す．システムの概要は，2つの候補地を表3より選択し，2つの候補地間を移動中に経由している撮影スポットをマップ上に可視化する．青色の枠の入力フォームで2つの候補地を選択する．選択した2つの候補地はサーバサイドへ送られる．緑の枠の部分は，サーバサイドへ送った2つの候補地間の移動軌跡にクラスタリングを行い，抽出した撮影スポットを地図上に可視化する．地図上のマーカーは撮影スポットの重心を示している．また，カテゴリのタイプに合わせてマーカーの色を変化させている．マーカーは赤，青，緑，黄の4色あり，それぞれ，レストラン，ホテル，観光スポット，交通機関のカテゴリを示している．紫色の枠の部分は，地図上にプロットされているマーカーを選択すると表示される．紫色の枠内の円グラフは，その撮影スポットがどの位の割合で各カテゴリの可能性があるかを示しているかを推定した結果である．また，円グラフの下にはrestaurant などカテゴリ名が表示されている．これらのカテゴリ名を選択すると，ピンク色の枠の部分で，その撮影スポット内で選択したカテゴリと思われるテキストタグが付与されている写真を表示する．

4. 実行結果

本章では，本論文で構築したシステムの実行例を示す．加えてカテゴリの推定結果について評価実験を行い，評価結果を示すとともに考察を行う． 4. 1 データセット本論文では，写真を収集した3都市のうち，ロンドン市内で撮影された写真の枚数が一番多く，テキストタグが付与されている割合も高かったため，本研究では，ロンドン市内の撮影スポットのカテゴリ推定を行う．はじめに，システムに与える2 つのスポットS，Gはロンドン市内の主要な観光地から選出する．S，Gの候補地を表3に示す．候補地は，London navi（注4），（注4）：http://london.navi.com/

(4)

図 2 インタフェース (a) 閾値 200m (b) 閾値 400m 図 3 クラスタリング結果旅コム（注5）_， Flyteam（注 6）を利用し，主要だと考えられる観光地や駅，空港などを選出した．また，データセットとして，Flickr API（注 7）_{を用いて収集した，ロンドン市内で撮影されたテキス} トタグ付き写真4,351,823枚を用いた．また，表2で示したテキストタグを用いて抽出したカテゴリごとの写真枚数を表4に示す． 4. 2 撮影スポットの抽出結果クラスタ間の距離をそれぞれ200mと400mの閾値としたと

き，Buckingham PalaceとKensington Palace間の撮影スポットのクラスタリング結果を図3に示す．同日にBuckingham PalaceとKensington Palaceの両方に訪れたユーザの移動軌跡を抽出したところ，写真総数は133件あり，クラスタ間の距離が200mの場合に抽出できた撮影スポット数は23個，400m の場合は11個抽出することができた． 4. 3 テキストタグリストの作成結果各カテゴリのテキストタグリストのうち，出現回数が最も多い上位10件をそれぞれ，表5，表6，表7，表8に示す．表5，表6，表7，表8において，どのカテゴリのテキストタグリストの上位10件にlondon，uk，englandが含まれている．また，テキストタグリストの上位には，unitedkingdom， nikon，canon，2012なども含まれている．これらのテキスト（注5）：http://tabi.com/ （注6）：http://flyteam.jp/ （注7）：http://www.flickr.com/services/api/ タグは，地名や撮影年，撮影に使用したカメラのメーカーなどを意味するものであり，カテゴリとは関係ない．このことから，テキストタグリストには，そのカテゴリに関係ないテキストタグも含まれていることがわかる． 4. 4 システムの実行例

スポットをBuckingham PalaceとKing’s Cross stationの

2つの候補地を選択したときの結果を図4に示す．マーカーの各色はそれぞれカテゴリのタイプを意味する．赤色はレストラン，青色はホテル，緑色は観光スポット，黄色は交通機関を意味している．なお，観光スポットは観光や買い物などを意味しており，交通機関は駅，バス停，港とする．図4中の，赤色のマーカーが指し示す場所を拡大してみるとマーカーの周辺には，レストランやホテルなど様々なカテゴリを持つスポットが存在しており，なかでも，この撮影スポット内ではレストランが多く存在している．そのため，この撮影スポットのカテゴリはレストランで正しいことがわかる．一方で，図4の左下に存在している緑のマーカーの周辺を拡大してみると，その撮影スポット内では，レストラン，ホテル，駅が多く存在している．しかし，推定結果のカテゴリは観光スポットを示している．原因はこの撮影スポット内で撮影された写真を確認すると，イルミネーションの写真が多く存在しており，このようなイベントなどの影響により普段とは異なるカテゴリが推定されたと考えられる．

図4のKing’s Cross stationの場所を拡大したものを図5，図6に示す．図5では，図4中でKing’s Cross stationと示さ

れている撮影スポット内で交通機関と推定されるテキストタグを含んだ写真を表示しており，図6では，観光スポットと推定されるテキストタグを含む写真を表示している．King’s Cross stationは，駅として利用されることはもちろんのこと，ある映画で登場した場所が観光スポットとなっているため，1つの場所で2つのカテゴリをもっている．図5と図6の写真を確認すると，図5の交通機関と推定されるテキストタグを含む写真は被写体が電車の写真が多く存在する．図6の観光スポットと推定されるテキストタグを含む写真では，電車が撮影されてい

(5)

表 3 カテゴリ別候補地

候補地カテゴリのタイプ ALAIN DUCASSE AT THE DORCHESTER レストラン

Arbutus レストラン Club Gascon レストラン Gordon Ramsay レストラン Helene Darroze at The Connaught レストラン Hibiscus レストラン Lima レストラン Quilon レストラン Sketch レストラン 41 london Hotel ホテル Apex Temple Court Hotel ホテル Sofitel St James Hotel ホテル The Soho Hotel ホテル The Egerton House Hotel ホテル The Ritz London Hotel ホテル The Soho Hotel ホテル

Big Ben 観光スポット British Museum 観光スポット Buckingham Palace 観光スポット Kensington Palace 観光スポット Natural History Museum 観光スポット National Gallery 観光スポット Palace of Westminster 観光スポット Royal Albert Hall 観光スポット St-Paul’s Cathedral 観光スポット Tate Modern 観光スポット Tower of London 観光スポット Trafalgar Square 観光スポット Westminster Abbey 観光スポット Euston station 交通機関 King’s Cross station 交通機関 Liverpool Street station 交通機関 Lodon Bridge station 交通機関 London Victoria station 交通機関 Paddington Station 交通機関 St Pancras station 交通機関 Waterloo Underground Station 交通機関 Heathrow airport 交通機関 London City Airport 交通機関

表 4 カテゴリごとの写真枚数カテゴリ写真枚数レストラン 54,830 ホテル 9,112 観光スポット 158,694 交通機関 124,616 る写真が少なくなり，映画で登場した場所など観光スポットとしてのカテゴリをもつスポット写真が多く表示されている．このことから，1つの場所で2つのカテゴリをもつようなスポットでも，そのカテゴリごとに写真を分けて表示できていることが確認できる．表 5 カテゴリ（レストラン）のテキストタグリスト上位 10 件カテゴリ（レストラン）テキストタグ出現回数 london 35,734 food 25,132 uk 10,150 restaurant 9,935 bar 9,639 england 8,815 cafe 7,233 dinner 5,716 lunch 4,297 unitedkingdom 3,107 表 6 カテゴリ（ホテル）のテキストタグリスト上位 10 件カテゴリ（ホテル）テキストタグ出現回数 hotel 8,320 london 7,214 uk 2,441 england 2,333 unitedkingdom 1,272 wedding 857 architecture 832 nikon 766 accommodation 734 britain 716 表 7 カテゴリ（観光スポット）のテキストタグリスト上位 10 件カテゴリ（観光スポット）テキストタグ出現回数 london 133,457 museum 71,704 uk 62,983 england 48,382 building 42,266 gallery 35,154 architecture 23,305 british 21,116 art 18,590 unitedkingdom 17,280 4. 5 評価実験本論文では，Flickrから収集した写真に対して提案システムを適用し，カテゴリの推定結果についての評価を行う．提案システムによるカテゴリの推定結果とテキストタグリストを正規化せずにカテゴリを推定した結果と人手により判断されたカテゴリを比較することで提案システムの評価を行う．テキストタグリストを正規化を行わない場合は，全てのテキストタグの得点を1点として扱い，カテゴリの推定を行なう．正規化を行う場合は正規化の結果をそのテキストタグの得点とし，推定を行う．使用する写真はデータセットで示したロンドン市内で撮影されたテキストタグ付き写真4,351,823枚である．正解データは本システムで抽出した撮影スポットに対し，Google Maps，

(6)

表 8 カテゴリ（交通機関）のテキストタグリスト上位 10 件カテゴリ（交通機関）テキストタグ出現回数 london 82,906 bus 47,435 station 34,617 uk 30,303 train 26,855 england 26,084 railway 16,327 airport 13,719 buses 12,748 underground 11,663

図 4 システム実行例（Buckingham Palace，King’s Cross sta-tion 間）

図 5 King’s Cross station (交通機関と推定された写真を表示)

図 6 King’s Cross station (観光スポットと推定された写真を表示)

Google Street View（注8）_{，撮影スポット内で撮影された写真を}

用いて，撮影スポット内で撮影されている写真や周辺の風景，（注8）：https://www.google.com/maps/views/ 表 9 提案システムによるカテゴリの正答率正答率（上位 1 位）正答率（上位１，2 位）正規化前 26.91% 50.22% 正規化後 51.12% 73.54% 周辺に何が存在するかを考慮することで，その撮影スポットのカテゴリを決定した．考えられるカテゴリが複数存在する場合は，その撮影スポット内でのカテゴリの順位付けを行った．ここで，提案システムによるカテゴリの推定結果とテキストタグリストを正規化せずにカテゴリを推定した結果が人手により判断されたカテゴリとの正答率を表9に示す．ロンドンは観光スポットやレストランなど様々なカテゴリを持ったスポットが密集している．そのため，撮影スポット内での4つのカテゴリの割合をもとめ，推定結果の上位2つの差が1%以内だった場合は，上位2つを推定結果とする．表9において，正規化を行わなかった結果と正規化を行なった結果を比較すると，正答率は，正規化を行った推定の方が正規化を行わなかった結果よりも上回っていることがわかる．正規化を行い，上位２つを用いた推定結果の各カテゴリの正答率を表10に示す．表10において，カテゴリごとの正答率を確認すると，レストラン，観光スポットに関しては70%以上で推定ができていることがわかる．しかし，ホテルと交通機関は，レストラン，観光スポットと比較して，正答率が低く70%未満である．これについては，ホテルのテキストタグリストを作成するときにカテゴリに関連あると思われる決め打ちしたテキストタグが少なかったことが原因だと考えられる．また，交通機関については，バスなど移動中に撮影されている写真が大量にあったことが原因だと考えられる．カテゴリが交通機関と推定された実行例を図7，図8に示す．図7では，写真の被写体にバスが多く存在している．しかし，この場所はバス停などがあるわけではなく，バスを使用しない時に停めておく場所であるが，バスが撮影された写真が多いために交通機関とカテゴリを推定されてしまっている．図8では，London bridgeのカテゴリが交通機関と推定されている．しかし，撮影スポット内の写真を確認するとLondon bridgeを走行しているバスの写真や， London bridgeの下を航行している船の写真が多く，これらの写真が原因でカテゴリの推定結果が交通機関になったと考えられる．

図9に，2つの候補地をEuston stationとSofitel St James

Hotelとしたときの結果を部分的に拡大したものを示す．図9 中の撮影スポットは観光スポットと推定されており，マーカー周辺ではホテルやレストランが存在している．また，この撮影スポット内でパレードのようなイベントがあったと見られる写真が多く存在している．それに比べて，マーカー付近のレストランやホテル，St. James’s Squareで撮影されている写真は少ない．そのため，この推定結果はイベントの影響を受けていることが考えられる．このことから，撮影された写真枚数が少ない撮影スポットでは，イベントのように写真が多く撮影されるようなことがあると，撮影スポット内はそのイベントに関連した写真が多くなり，カテゴリの推定に影響を受けてしまうこと

(7)

表 10 カテゴリごとの正答率（正規化後上位１，２位）レストランホテル観光スポット交通機関正答率 71.42% 67.39% 80.26% 64.29%

図 7 システム実行例（Euston station，Sofitel St James Hotel 間部分拡大)

図 8 システム実行例（King’s Cross station，Natural History Mu-seum 間部分拡大)

図 9 システム実行例（Euston station，Sofitel St James Hotel 間部分拡大) が考えられる．以上より，本システムでは写真に付与されているテキストタグを利用することで，70%以上で抽出した撮影スポットのカテゴリを推定できることがわかった．しかし，イベントへの対応などを行う必要性があることがわかった．イベントの対応は撮影スポット内の写真数の増加と一定の期間や決まった月でしか使用されていないテキストタグを除去することで対応できると考えられる．

5. おわりに

本論文では，Flickrなどのソーシャルメディアに投影された写真に付与されているジオタグに基づいて，撮影スポットを抽出し，テキストタグを用いて，スポットをレストラン，ホテル，観光スポット，交通機関の４つのカテゴリに推定し，推定したカテゴリを地図上に可視化するシステムの構築の方法を示した．提案システムでは，画像特徴量などを用いず，共起タグを用いてテキストタグのみからカテゴリの推定を行った．また，

Buckingham PalaceとKing’s Cross stationの2つのスポットを入力としたときの提案システムの実行例を示した．撮影スポットは撮影地点間の距離に基づく階層的クラスタリング手法により抽出した．また，カテゴリの推定は，共起タグを利用し，そのカテゴリで付与されると考えられるようなテキストタグを収集し，出現回数の正規化を行い，それらを用いることで行った．また，推定した結果に対して評価実験を行い，考察をした．今後の課題として，カテゴリ推定の正答率の向上が考えられる．ホテルと交通機関の正答率が他のカテゴリと比較して低かったことから，この２つのカテゴリ推定の正答率の向上が考えられる．また，イベントなど，本来はその撮影スポットには存在しないものの考慮が必要である．イベントなどの対応は，決まった月や日などの一定の期間しか現れないテキストタグを除去することで対応できると期待される．また，カテゴリの推定をする際に正規化だけではなく，テキストタグの共起度を考慮することや，テキストタグリストの作成時にlondonやnikon といった全てのテキストタグリストに一定数以上で存在し，関係ないテキストタグを除去することで，正答率の向上が期待される．加えて，ロンドン以外での場所でも本システムは有効であるか検証する必要がある．例えば，ロンドン同様に複数のスポットが密集している場所や，スポットが離れている場所での検証が必要であると考えている．さらに，カテゴリの細分化が考えられる．例を挙げると，観光スポットは，買い物，風景，建造物などへとカテゴリを細分化できる．細分化することで，ユーザに，より直観的に分かりやすいマップを提示できると考えている．文献 [1] 倉島健，岩田具冶，入江豪，藤村考，“ ソーシャルメディアを用いた個人向け旅行プランの自動生成 ”，電子情報通信学会技術研究報告，2011 [2] 王佳な，野田雅文，高橋友和，出口大輔，井手一郎，村瀬洋， “ Web 上の大量の写真を画像分類して提示する観光マップの提案”，電子情報通信学会技術研究報告，2011 [3] 尾崎竜史，岩田健司，岩尾弘毅，小島功，“ 風景画像データのカテゴリー推定”，精密工学会誌，2014 [4] Wang Jiani，野田雅文，高橋友和，出口大輔，井手一郎，村瀬洋,“ ジオタグ付き写真を用いた風景カテゴリマップ作成手法の検討 ”，電子情報通信学会マルチメディア・仮想環境基礎研究会， MVE2010-66，pp.7984，Oct. 2010.

[5] G. Csurka，C. Bray，C. Dance, and L. Fan，J. Willam-owski，“ Visual categorization with bags of keypoints ”， Proc.ECCV International Workshop on Statistical Learn-ing in Computer Vision， pp.122， Feb. 2004.

(8)

用いた土地被覆の分析と可視化 ”，第 6 回データ工学と情報マネジメントに関するフォーラム，2014 [7] 石野亜耶，藤井一輝，藤原泰士，前田剛，難波英嗣，竹澤寿幸， “ 旅行ブログエントリと質疑応答コンテンツを利用した観光ガイドブックの情報拡張 ”，WebDB Forum，2014 [8] 奥山幸也，柳井啓司，“ 写真撮影の位置軌跡を利用した旅行支援システム ”，第 3 回データ工学と情報マネジメントに関するフォーラム，2011

[1] [8] [2] [3] [4] [5] [6] [2] 5 [3] Crop() Forest( ) Grass( ) Urban( ) Water( ) Csurka [5] BoF Bag-of-Features BoF [6] Exif Flickr rest

DEIM Forum 2015 F6-1

ジオタグ写真を用いたユーザの訪問地のカテゴリ推定に基づく

ユーザの移動への意味付け

小松 雅弥

廣田 雅春

石川

博

横山 昌平

†

静岡大学情報学部 〒 432–8011 静岡県浜松市中区城北 3–5–1

††

首都大学東京システムデザイン研究科/日本学術振興会特別研究員 PD 〒 191–0065 東京都日野市旭が丘 6–6

†††

首都大学東京システムデザイン学部情報通信システムコース 〒 191–0065 東京都日野市旭が丘 6–6

††††

静岡大学大学院情報学研究科 〒 432–8011 静岡県浜松市中区城北 3–5–1

E-mail:

†

[email protected],

††

[email protected],

†††

[email protected],

††††

[email protected]

あらまし 近年，Flickr などのソーシャルメディアでは写真が大量にアップロードされている．これらの写真には，テ

キストタグやジオタグなど写真の内容を表す重要な情報（メタデータ）が付与されている．本手法では，それらのメ

タデータを利用し，ジオタグが指し示すスポットのカテゴリ (レストラン，ホテル，観光スポット，交通機関) の推定

を行う．従来のカテゴリ推定は，画像や色の見た目の特徴量に着目している．そこで，本研究では，写真に付与され

ているテキストタグ，ジオタグから写真の撮影スポットのカテゴリを推定する．また，推定したカテゴリを用いて，

ユーザが任意に選択した 2 つのスポット間の移動中にどのようなカテゴリをもつスポットを経由するか，どこにどの

ようなカテゴリをもったスポットが存在するかを閲覧可能にするシステムを構築する．

キーワード

カテゴリ推定，情報抽出，移動軌跡，Flickr

1.

は じ め に

2.

関 連 研 究

3.

提案システム

4.

実 行 結 果

5.

お わ り に

小松雅弥

廣田雅春

横山昌平

静岡大学情報学部〒 432–8011 静岡県浜松市中区城北 3–5–1

首都大学東京システムデザイン学部情報通信システムコース〒 191–0065 東京都日野市旭が丘 6–6

静岡大学大学院情報学研究科〒 432–8011 静岡県浜松市中区城北 3–5–1

あらまし近年，Flickr などのソーシャルメディアでは写真が大量にアップロードされている．これらの写真には，テ

はじめに

関連研究

実行結果

おわりに