• 検索結果がありません。

[1] [8] [2] [3] [4] [5] [6] [2] 5 [3] Crop() Forest( ) Grass( ) Urban( ) Water( ) Csurka [5] BoF Bag-of-Features BoF [6] Exif Flickr rest

N/A
N/A
Protected

Academic year: 2021

シェア "[1] [8] [2] [3] [4] [5] [6] [2] 5 [3] Crop() Forest( ) Grass( ) Urban( ) Water( ) Csurka [5] BoF Bag-of-Features BoF [6] Exif Flickr rest"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

DEIM Forum 2015 F6-1

ジオタグ写真を用いたユーザの訪問地のカテゴリ推定に基づく

ユーザの移動への意味付け

小松 雅弥

廣田 雅春

††

石川

†††

横山 昌平

††††

静岡大学情報学部 〒 432–8011 静岡県浜松市中区城北 3–5–1

††

首都大学東京システムデザイン研究科/日本学術振興会特別研究員 PD 〒 191–0065 東京都日野市旭が丘 6–6

†††

首都大学東京システムデザイン学部情報通信システムコース 〒 191–0065 東京都日野市旭が丘 6–6

††††

静岡大学大学院情報学研究科 〒 432–8011 静岡県浜松市中区城北 3–5–1

E-mail:

[email protected],

††

[email protected],

†††

[email protected],

††††

[email protected]

あらまし 近年,Flickr などのソーシャルメディアでは写真が大量にアップロードされている.これらの写真には,テ

キストタグやジオタグなど写真の内容を表す重要な情報(メタデータ)が付与されている.本手法では,それらのメ

タデータを利用し,ジオタグが指し示すスポットのカテゴリ (レストラン,ホテル,観光スポット,交通機関) の推定

を行う.従来のカテゴリ推定は,画像や色の見た目の特徴量に着目している.そこで,本研究では,写真に付与され

ているテキストタグ,ジオタグから写真の撮影スポットのカテゴリを推定する.また,推定したカテゴリを用いて,

ユーザが任意に選択した 2 つのスポット間の移動中にどのようなカテゴリをもつスポットを経由するか,どこにどの

ようなカテゴリをもったスポットが存在するかを閲覧可能にするシステムを構築する.

キーワード

カテゴリ推定,情報抽出,移動軌跡,Flickr

1.

は じ め に

近年,GPS機能を持つスマートフォンやデジタルカメラの普 及により,写真にジオタグなどの情報を容易に付与できるよう になった.それらの写真はFlickr(注 1)やPanoramio(注 2)などの ソーシャルメディアで多くのユーザによって大量に共有されて いる.また,これらの写真には,テキストタグやジオタグなど 写真の内容を表す重要な情報が付与されている.本研究におい て,テキストタグとは,Flickr上でユーザが写真に付与できる 任意の文字列である.ジオタグとは,その写真の撮影地点を表 す緯度・経度情報である.加えて,ユーザは,興味のある場所 やものを撮影すると考えられる.そのため,ソーシャルメディ ア上で共有されている写真や写真に付与されているジオタグな どのメタデータを利用し,観光ルートの推薦[1]やカテゴリ推 定を用いた観光マップの作成[2]などの旅行支援の研究が増加 している. これまでに,カテゴリ推定を用いた観光マップを作成するた めの研究[2] [3]がされている.それらの研究では,テキストタ グは用いておらず,風景写真の画像特徴量や色特徴量を用いて, 山や水辺などの風景のカテゴリを推定している. 既存研究でテキストタグを扱わないのは,写真にテキスト タグが付与されていない場合や,「city」と「town」のようにテ キストタグの表記ゆれがあることが理由として挙げられてい る[2].今回,約2億件からなるデーセットを構築し,その中で, (注1):https://www.flickr.com/ (注2):http://www.panoramio.com/ 表 1 収集した写真枚数とテキストタグが付与されている写真枚数 場所 写真枚数 テキストタグ付き写真 割合 ロンドン 5,299,186 4,351,823 82.1% ニューヨーク 4,555,430 3,677,365 80.7% パリ 2,711,295 2,154,950 79.5% ロンドン,ニューヨーク,パリの3都市で撮影された写真枚数 と,テキストタグの付与された写真枚数をそれぞれ表1に示す. 表1において,写真が大量にある場所でのジオタグが付与され ている写真には,おおよそ80%程度のテキストタグが付与され ていることが確認できた.また,テキストタグはユーザが任意 に決められるため,表記ゆれが生じてしまう.しかし,本研究 ではテキストタグの共起を利用し,どのようなテキストタグが 出現するかに着目することでカテゴリを推定するため,テキス トタグ自体の意味は考慮しない.そのため,表記ゆれが生じた 場合でもカテゴリの推定への影響は少ないと考えられる. 本研究では,テキストタグやジオタグなどのメタデータを利 用し,ジオタグが指し示す撮影スポットをレストラン,ホテル, 観光スポット,交通機関の4つのカテゴリの推定を行い,可視 化するシステムの構築を行う.本研究において,撮影スポット とは写真の撮影地点とその周辺の領域を意味する.また,推定 したカテゴリを用いて,ユーザが任意に選択した2つのスポッ ト間の移動中にどのようなカテゴリをもつスポットを経由する か,どこにどのようなカテゴリをもったスポットが存在するか を閲覧可能にするシステムを構築する.本論文で構築するシス テムでは,ユーザが2つのスポットを選択することにより,選 択した2つのスポットを同日に訪問しているユーザのスポット

(2)

間の移動軌跡から立ち寄った撮影スポットを抽出し,抽出した 撮影スポットのカテゴリ推定を行う.移動軌跡は,あるユーザ がアップロードした写真に付与されている撮影日時を時系列的 に追うことで抽出する. 本論文の構成は,以下のようになっている.第2章では,こ れまでに提案されているカテゴリ推定の手法など関連研究につ いて述べる.第3章では,本論文で構築したシステムについて 述べる.第4章では,評価実験を行い,提案システムの評価と システムの結果,考察について述べる.第5章では,本論文で 得られた成果とともに,今後の課題について述べる.

2.

関 連 研 究

写真や,写真に付与されるメタデータ(テキストタグ,ジオ タグ,撮影日時,タイトルなど)を用いる研究として,人々が 興味・関心を持つ場所を発見,旅行を支援する研究[1] [8],写 真の分類や写真のカテゴリ推定を行う研究[2] [3] [4] [5] [6]など があげられる.王らの研究[2]では,写真の画像特徴に加え色 特徴量を抽出し,風景写真を町,水辺,山,森,平地の5つの カテゴリに分類した.それらの分類した写真の撮影地点に各 カテゴリに対応したマーカーをプロットすることで観光マップ を作成した.尾崎らの研究[3]では,写真の画像特徴から風景

写真をCrop(耕作地),Forest(森林),Grass(草原),Urban(都 市,居住地),Water(水地,海,湖など)のカテゴリに分類し た.Csurkaらの研究[5]では,BoF(Bag-of-Features)を用い て各写真の画像特徴から風景カテゴリを分類した.BoFは,画 像を局所特徴量の集合とみなし,局所特徴量のヒストグラムを その画像の特徴量としてカテゴリ分類する手法である.これら の研究では風景写真のカテゴリ推定を写真の画像特徴や色特徴 量により推定しており,テキストタグは扱われていない.本研 究では,画像特徴量などではなく,テキストタグを用いて撮影 スポットのカテゴリ推定することを目指す.加えて,本研究で は,風景写真に限らず全ての写真を用いてカテゴリの推定を目 指す.大羽らの研究[6]では,多量の写真の画像特徴量,Exif, ジオタグを用いて,撮影場所付近の土地被覆を判別する手法を 提案した.はじめに,キーワードを用いて,Flickrから写真を 取得する.次に,収集した各写真の画像特徴を抽出し土地被覆 の判別を行なった.本研究でも,「restaurant」などのキーワー ドを用いて写真の収集を行う.石野らの研究[7]では,テキス ト情報と画像情報を用いて旅行ガイドブックのページ,旅行ブ ログエントリ,質疑応答コンテンツのタイプ分類を行い,旅行 ガイドブックのページへの,旅行ブログエントリと質疑応答コ ンテンツの対応付けを行っている.タイプは,「見る」,「体験す る」,「買う」,「食べる」,「泊まる」,「その他」の6個を定義し た.テキスト情報を用いる場合,旅行ガイドブックを1ページ ずつ解析し,ページ内に展示,見る,見学,見どころ,博物館 などの単語が含まれていれば,そのページのタイプを「見る」 と分類をした.本研究でも,各タイプに特有の単語を手掛かり 語とする.また,手掛かり語を用いて,テキストタグリストを 生成する. 図 1 システム構成

3.

提案システム

本章では,メタデータが付与されている写真を用いて撮影ス ポットのカテゴリを推定する手法について述べる.撮影スポッ トは,抽出したユーザの移動軌跡に対して階層的クラスタリン グを行い発見する.移動軌跡は,写真に付与されている撮影日 時を時系列的に追うことで抽出する.カテゴリ推定には共起タ グを利用し,レストラン,ホテル,観光スポット,交通機関の 4つのカテゴリを推定する. 本論文で構成するシステムの概要を図1に示す.本システ ムはサーバサイドとクライアントサイドで構成されている. サーバサイドでは,ユーザが選択した2つのスポット間(e.g.,

Buckingham Palace,King’s Cross station)で経由しているス ポットのカテゴリの推定を行う.はじめに,テキストタグが付 与されていない写真の除去を行う.次に,階層的クラスタリン グを行い撮影スポットを発見する.次に,各カテゴリに関連が あると考えられるテキストタグと一緒に付与されているテキス トタグのリストをカテゴリごとに作成しておき,それらを用い て,発見した撮影スポットのカテゴリを推定する.クライアン トサイドでは,ユーザが候補地から選択した2つのスポットを サーバサイドへ送信する.そして,サーバサイドから受け取っ たカテゴリ推定の結果をGoogle Maps(注 3)を用いて地図上に可 視化する. 3. 1 撮影スポットの抽出 はじめに,本論文で構築するシステムは,ユーザが選択した 2つのスポットSG間の撮影スポットを抽出する.このとき, SGは異なる場所とする.次に,指定されたSGの両方を 同日に訪問しているユーザを写真に付与されているメタデータ を用いて抽出する.加えて,そのユーザが撮影した写真の撮影 日時を利用し,時系列的に追うことで,SG間の移動軌跡の 抽出も行う.次に,抽出した移動軌跡に対し,クラスタリング を行い,撮影スポットの抽出を行う. 奥山らの研究[8]では,2つの撮影地点間の距離に基づいた 階層的クラスタリング手法を用いて撮影スポットの抽出を行っ ており,本研究でもこれを用いて撮影スポットの抽出を行なう. 理由は,密度ベースのクラスタリングなどでは,写真が多く撮 (注3):https://maps.google.com/

(3)

表 2 各カテゴリに関連すると考えられるテキストタグ カテゴリ 関連すると考えられるテキストタグ レストラン restaurant,cafe,bar,snack,food,dinner, lunch,breakfast ホテル hotel,accommodation,stay 観光スポット museum,gallery,tourism,attraction, scenery,building,structure 交通機関 station,airport,busstop,train,plane,bus,taxi 影されている場合には有効であると考えられるが,写真枚数が 少ない場合もあり,その場合は距離に基づくクラスタリングの 方が有効であると考えたためである.階層的クラスタリングの 手法を以下に示す. (1)すべての写真の撮影地点をそれぞれクラスタとする. (2)最も距離が近い2つのクラスタをまとめて1つのクラス タとする.このとき,新たなクラスタの位置はクラスタに含ま れる撮影地点の重心とする. (3) 2つのクラスタの最短距離が閾値以上になるまで,クラ スタをまとめる作業を繰り返す. 2つの撮影地点間の距離を算出するとき,地球は楕円体のた め,ユークリッド距離のように平面上の距離ではなく,楕円体 を考慮した距離を計算する必要がある.そのため,本研究では, ヒュベニの公式を用いて,2つの撮影地点間の距離の計算を行 う.式を以下に示す. D =(dyM )2+ (dxN cos uy)2 (1) Dは2点間の距離(m)dxは経度の差,dyは緯度の差,M は子午線曲率半径,N は卯酉線曲率半径,uyは緯度の平均値 である. 3. 2 テキストタグリストの作成 レストラン,ホテル,観光スポット,交通機関の4つのカテ ゴリごとにテキストタグリストを作成する.作成方法は,その カテゴリに関連があると考えられるテキストタグを決め打ちし, そのテキストタグと一緒に付与されているテキストタグをリス ト化する.決め打ちしたテキストタグと,どのカテゴリに関連 していると思われるかを表2に示す.テキストタグリストを作 成する理由は,抽出した撮影スポットで撮影された写真に付与 されているテキストタグと比較し,そのテキストタグが、どの カテゴリのテキストタグリストにどのくらい含まれているかで カテゴリを推定するためである. テキストタグリストを作成するとき,テキストタグを1種類 ずつ確認していき,そのテキストタグを何人のユーザが付与し ているかを調べる.ユーザ数が1人以下の場合,そのテキスト タグは,そのカテゴリでは特殊なものであると判断し,推定に は不要であると考え,除去を行う. 3. 3 カテゴリの推定 本研究では,撮影スポットをレストラン,ホテル,観光ス ポット,交通機関の4つのカテゴリに分類することを目指す. 推定方法は,はじめに,抽出した撮影スポットを中心とした周 囲100m以内で撮影された写真に付与されているテキストタグ を収集する.次に,各テキストタグリストの出現回数を0から 1の間の値となるように正規化を行なう.正規化に用いた式を 以下に示す. P (v) = (v− vmin) (vmax− vmin) (2) P (v)は正規化の結果(0∼1),vはテキストタグの出現回数, vminはテキストタグリスト中の最小出現回数,vmaxはテキ ストタグリスト中の最大出現回数である.また,正規化の結果 はそのカテゴリでの,そのテキストタグの点数として扱う.次 に,収集したテキストタグと,正規化したテキストタグリスト を比較する.テキストタグリスト中に収集したテキストタグが 付与されていた場合,そのカテゴリの得点として正規化の結果 を加算し,最終的に最も得点の高いカテゴリをその撮影スポッ トでのカテゴリとする. 3. 4 インタフェース 本節ではクライアントサイドのシステムについてのインター フェースについて述べる.インターフェースを図2に示す.シ ステムの概要は,2つの候補地を表3より選択し,2つの候補 地間を移動中に経由している撮影スポットをマップ上に可視化 する.青色の枠の入力フォームで2つの候補地を選択する.選 択した2つの候補地はサーバサイドへ送られる.緑の枠の部分 は,サーバサイドへ送った2つの候補地間の移動軌跡にクラス タリングを行い,抽出した撮影スポットを地図上に可視化する. 地図上のマーカーは撮影スポットの重心を示している.また, カテゴリのタイプに合わせてマーカーの色を変化させている. マーカーは赤,青,緑,黄の4色あり,それぞれ,レストラン, ホテル,観光スポット,交通機関のカテゴリを示している.紫 色の枠の部分は,地図上にプロットされているマーカーを選択 すると表示される.紫色の枠内の円グラフは,その撮影スポッ トがどの位の割合で各カテゴリの可能性があるかを示している かを推定した結果である.また,円グラフの下にはrestaurant などカテゴリ名が表示されている.これらのカテゴリ名を選択 すると,ピンク色の枠の部分で,その撮影スポット内で選択し たカテゴリと思われるテキストタグが付与されている写真を表 示する.

4.

実 行 結 果

本章では,本論文で構築したシステムの実行例を示す.加え てカテゴリの推定結果について評価実験を行い,評価結果を示 すとともに考察を行う. 4. 1 データセット 本論文では,写真を収集した3都市のうち,ロンドン市内で 撮影された写真の枚数が一番多く,テキストタグが付与されて いる割合も高かったため,本研究では,ロンドン市内の撮影ス ポットのカテゴリ推定を行う.はじめに,システムに与える2 つのスポットSGはロンドン市内の主要な観光地から選出す る.SGの候補地を表3に示す.候補地は,London navi(注4), (注4):http://london.navi.com/

(4)

図 2 インタフェース (a)  閾値 200m (b)  閾値 400m 図 3 クラスタリング結果 旅コム(注5) Flyteam(注 6)を利用し,主要だと考えられる観光地 や駅,空港などを選出した.また,データセットとして,Flickr API(注 7)を用いて収集した,ロンドン市内で撮影されたテキス トタグ付き写真4,351,823枚を用いた.また,表2で示したテ キストタグを用いて抽出したカテゴリごとの写真枚数を表4に 示す. 4. 2 撮影スポットの抽出結果 クラスタ間の距離をそれぞれ200mと400mの閾値としたと

き,Buckingham PalaceとKensington Palace間の撮影スポッ トのクラスタリング結果を図3に示す.同日にBuckingham PalaceとKensington Palaceの両方に訪れたユーザの移動軌 跡を抽出したところ,写真総数は133件あり,クラスタ間の距 離が200mの場合に抽出できた撮影スポット数は23個,400m の場合は11個抽出することができた. 4. 3 テキストタグリストの作成結果 各カテゴリのテキストタグリストのうち,出現回数が最も多 い上位10件をそれぞれ,表5,表6,表7,表8に示す. 表5,表6,表7,表8において,どのカテゴリのテキスト タグリストの上位10件にlondon,uk,englandが含まれてい る.また,テキストタグリストの上位には,unitedkingdom, nikon,canon,2012なども含まれている.これらのテキスト (注5):http://tabi.com/ (注6):http://flyteam.jp/ (注7):http://www.flickr.com/services/api/ タグは,地名や撮影年,撮影に使用したカメラのメーカーなど を意味するものであり,カテゴリとは関係ない.このことから, テキストタグリストには,そのカテゴリに関係ないテキストタ グも含まれていることがわかる. 4. 4 システムの実行例

スポットをBuckingham PalaceとKing’s Cross stationの

2つの候補地を選択したときの結果を図4に示す.マーカーの 各色はそれぞれカテゴリのタイプを意味する.赤色はレストラ ン,青色はホテル,緑色は観光スポット,黄色は交通機関を意 味している.なお,観光スポットは観光や買い物などを意味し ており,交通機関は駅,バス停,港とする.図4中の,赤色の マーカーが指し示す場所を拡大してみるとマーカーの周辺に は,レストランやホテルなど様々なカテゴリを持つスポットが 存在しており,なかでも,この撮影スポット内ではレストラン が多く存在している.そのため,この撮影スポットのカテゴリ はレストランで正しいことがわかる.一方で,図4の左下に存 在している緑のマーカーの周辺を拡大してみると,その撮影ス ポット内では,レストラン,ホテル,駅が多く存在している. しかし,推定結果のカテゴリは観光スポットを示している.原 因はこの撮影スポット内で撮影された写真を確認すると,イル ミネーションの写真が多く存在しており,このようなイベント などの影響により普段とは異なるカテゴリが推定されたと考え られる.

図4のKing’s Cross stationの場所を拡大したものを図5, 図6に示す.図5では,図4中でKing’s Cross stationと示さ

れている撮影スポット内で交通機関と推定されるテキストタグ を含んだ写真を表示しており,図6では,観光スポットと推定 されるテキストタグを含む写真を表示している.King’s Cross stationは,駅として利用されることはもちろんのこと,ある 映画で登場した場所が観光スポットとなっているため,1つの 場所で2つのカテゴリをもっている.図5と図6の写真を確認 すると,図5の交通機関と推定されるテキストタグを含む写真 は被写体が電車の写真が多く存在する.図6の観光スポットと 推定されるテキストタグを含む写真では,電車が撮影されてい

(5)

表 3 カテゴリ別候補地

候補地 カテゴリのタイプ ALAIN DUCASSE AT THE DORCHESTER レストラン

Arbutus   レストラン Club Gascon   レストラン Gordon Ramsay   レストラン Helene Darroze at The Connaught   レストラン Hibiscus   レストラン Lima レストラン Quilon レストラン Sketch レストラン 41 london Hotel ホテル Apex Temple Court Hotel ホテル Sofitel St James Hotel ホテル The Soho Hotel ホテル The Egerton House Hotel ホテル The Ritz London Hotel ホテル The Soho Hotel ホテル

Big Ben 観光スポット British Museum 観光スポット Buckingham Palace 観光スポット Kensington Palace 観光スポット Natural History Museum 観光スポット National Gallery 観光スポット Palace of Westminster 観光スポット Royal Albert Hall 観光スポット St-Paul’s Cathedral 観光スポット Tate Modern 観光スポット Tower of London 観光スポット Trafalgar Square 観光スポット Westminster Abbey 観光スポット Euston station 交通機関 King’s Cross station 交通機関 Liverpool Street station 交通機関 Lodon Bridge station 交通機関 London Victoria station 交通機関 Paddington Station 交通機関 St Pancras station 交通機関 Waterloo Underground Station 交通機関 Heathrow airport 交通機関 London City Airport 交通機関

表 4 カテゴリごとの写真枚数 カテゴリ 写真枚数 レストラン 54,830 ホテル 9,112 観光スポット 158,694 交通機関 124,616 る写真が少なくなり,映画で登場した場所など観光スポットと してのカテゴリをもつスポット写真が多く表示されている.こ のことから,1つの場所で2つのカテゴリをもつようなスポッ トでも,そのカテゴリごとに写真を分けて表示できていること が確認できる. 表 5 カテゴリ(レストラン)のテキストタグリスト 上位 10 件 カテゴリ(レストラン) テキストタグ 出現回数 london 35,734 food 25,132 uk 10,150 restaurant 9,935 bar 9,639 england 8,815 cafe 7,233 dinner 5,716 lunch 4,297 unitedkingdom 3,107 表 6 カテゴリ(ホテル)のテキストタグリスト 上位 10 件 カテゴリ(ホテル) テキストタグ 出現回数 hotel 8,320 london 7,214 uk 2,441 england 2,333 unitedkingdom 1,272 wedding 857 architecture 832 nikon 766 accommodation 734 britain 716 表 7 カテゴリ(観光スポット)のテキストタグリスト 上位 10 件 カテゴリ(観光スポット) テキストタグ 出現回数 london 133,457 museum 71,704 uk 62,983 england 48,382 building 42,266 gallery 35,154 architecture 23,305 british 21,116 art 18,590 unitedkingdom 17,280 4. 5 評 価 実 験 本論文では,Flickrから収集した写真に対して提案システム を適用し,カテゴリの推定結果についての評価を行う.提案シ ステムによるカテゴリの推定結果とテキストタグリストを正規 化せずにカテゴリを推定した結果と人手により判断されたカテ ゴリを比較することで提案システムの評価を行う.テキストタ グリストを正規化を行わない場合は,全てのテキストタグの得 点を1点として扱い,カテゴリの推定を行なう.正規化を行う 場合は正規化の結果をそのテキストタグの得点とし,推定を行 う.使用する写真はデータセットで示したロンドン市内で撮影 されたテキストタグ付き写真4,351,823枚である.正解データ は本システムで抽出した撮影スポットに対し,Google Maps,

(6)

表 8 カテゴリ(交通機関)のテキストタグリスト 上位 10 件 カテゴリ(交通機関) テキストタグ 出現回数 london 82,906 bus 47,435 station 34,617 uk 30,303 train 26,855 england 26,084 railway 16,327 airport 13,719 buses 12,748 underground 11,663

図 4 シ ス テ ム 実 行 例(Buckingham Palace,King’s Cross sta-tion 間)

図 5 King’s Cross station (交通機関と推定された写真を表示)

図 6 King’s Cross station (観光スポットと推定された写真を表示)

Google Street View(注8),撮影スポット内で撮影された写真を

用いて,撮影スポット内で撮影されている写真や周辺の風景, (注8):https://www.google.com/maps/views/ 表 9 提案システムによるカテゴリの正答率 正答率(上位 1 位) 正答率(上位1,2 位) 正規化前 26.91%  50.22% 正規化後 51.12%  73.54% 周辺に何が存在するかを考慮することで,その撮影スポットの カテゴリを決定した.考えられるカテゴリが複数存在する場合 は,その撮影スポット内でのカテゴリの順位付けを行った. ここで,提案システムによるカテゴリの推定結果とテキスト タグリストを正規化せずにカテゴリを推定した結果が人手によ り判断されたカテゴリとの正答率を表9に示す.ロンドンは観 光スポットやレストランなど様々なカテゴリを持ったスポット が密集している.そのため,撮影スポット内での4つのカテゴ リの割合をもとめ,推定結果の上位2つの差が1%以内だった 場合は,上位2つを推定結果とする.表9において,正規化を 行わなかった結果と正規化を行なった結果を比較すると,正答 率は,正規化を行った推定の方が正規化を行わなかった結果よ りも上回っていることがわかる. 正規化を行い,上位2つを用いた推定結果の各カテゴリの正 答率を表10に示す.表10において,カテゴリごとの正答率を 確認すると,レストラン,観光スポットに関しては70%以上で 推定ができていることがわかる.しかし,ホテルと交通機関は, レストラン,観光スポットと比較して,正答率が低く70%未満 である.これについては,ホテルのテキストタグリストを作成 するときにカテゴリに関連あると思われる決め打ちしたテキス トタグが少なかったことが原因だと考えられる.また,交通機 関については,バスなど移動中に撮影されている写真が大量に あったことが原因だと考えられる.カテゴリが交通機関と推定 された実行例を図7,図8に示す.図7では,写真の被写体に バスが多く存在している.しかし,この場所はバス停などがあ るわけではなく,バスを使用しない時に停めておく場所である が,バスが撮影された写真が多いために交通機関とカテゴリを 推定されてしまっている.図8では,London bridgeのカテゴ リが交通機関と推定されている.しかし,撮影スポット内の写 真を確認するとLondon bridgeを走行しているバスの写真や, London bridgeの下を航行している船の写真が多く,これらの 写真が原因でカテゴリの推定結果が交通機関になったと考えら れる.

図9に,2つの候補地をEuston stationとSofitel St James

Hotelとしたときの結果を部分的に拡大したものを示す.図9 中の撮影スポットは観光スポットと推定されており,マーカー 周辺ではホテルやレストランが存在している.また,この撮影 スポット内でパレードのようなイベントがあったと見られる写 真が多く存在している.それに比べて,マーカー付近のレスト ランやホテル,St. James’s Squareで撮影されている写真は少 ない.そのため,この推定結果はイベントの影響を受けている ことが考えられる.このことから,撮影された写真枚数が少な い撮影スポットでは,イベントのように写真が多く撮影される ようなことがあると,撮影スポット内はそのイベントに関連し た写真が多くなり,カテゴリの推定に影響を受けてしまうこと

(7)

表 10 カテゴリごとの正答率(正規化後上位1,2位) レストラン ホテル 観光スポット 交通機関 正答率 71.42% 67.39% 80.26% 64.29%

図 7 システム実行例(Euston station,Sofitel St James Hotel 間 部分拡大)

図 8 システム実行例(King’s Cross station,Natural History Mu-seum 間 部分拡大)

図 9 システム実行例(Euston station,Sofitel St James Hotel 間 部分拡大) が考えられる. 以上より,本システムでは写真に付与されているテキストタ グを利用することで,70%以上で抽出した撮影スポットのカテ ゴリを推定できることがわかった.しかし,イベントへの対応 などを行う必要性があることがわかった.イベントの対応は撮 影スポット内の写真数の増加と一定の期間や決まった月でしか 使用されていないテキストタグを除去することで対応できると 考えられる.

5.

お わ り に

本論文では,Flickrなどのソーシャルメディアに投影された 写真に付与されているジオタグに基づいて,撮影スポットを抽 出し,テキストタグを用いて,スポットをレストラン,ホテル, 観光スポット,交通機関の4つのカテゴリに推定し,推定した カテゴリを地図上に可視化するシステムの構築の方法を示し た.提案システムでは,画像特徴量などを用いず,共起タグを 用いてテキストタグのみからカテゴリの推定を行った.また,

Buckingham PalaceとKing’s Cross stationの2つのスポッ トを入力としたときの提案システムの実行例を示した.撮影ス ポットは撮影地点間の距離に基づく階層的クラスタリング手法 により抽出した.また,カテゴリの推定は,共起タグを利用し, そのカテゴリで付与されると考えられるようなテキストタグを 収集し,出現回数の正規化を行い,それらを用いることで行っ た.また,推定した結果に対して評価実験を行い,考察をした. 今後の課題として,カテゴリ推定の正答率の向上が考えられ る.ホテルと交通機関の正答率が他のカテゴリと比較して低 かったことから,この2つのカテゴリ推定の正答率の向上が考 えられる.また,イベントなど,本来はその撮影スポットには 存在しないものの考慮が必要である.イベントなどの対応は, 決まった月や日などの一定の期間しか現れないテキストタグを 除去することで対応できると期待される.また,カテゴリの推 定をする際に正規化だけではなく,テキストタグの共起度を考 慮することや,テキストタグリストの作成時にlondonやnikon といった全てのテキストタグリストに一定数以上で存在し,関 係ないテキストタグを除去することで,正答率の向上が期待さ れる.加えて,ロンドン以外での場所でも本システムは有効で あるか検証する必要がある.例えば,ロンドン同様に複数のス ポットが密集している場所や,スポットが離れている場所での 検証が必要であると考えている.さらに,カテゴリの細分化が 考えられる.例を挙げると,観光スポットは,買い物,風景, 建造物などへとカテゴリを細分化できる.細分化することで, ユーザに,より直観的に分かりやすいマップを提示できると考 えている. 文 献 [1] 倉島健,岩田具冶,入江豪,藤村考,“ ソーシャルメディアを用 いた個人向け旅行プランの自動生成 ”,電子情報通信学会技術研 究報告,2011 [2] 王佳な,野田雅文,高橋友和,出口大輔,井手一郎,村瀬洋, “ Web 上の大量の写真を画像分類して提示する観光マップの提 案”,電子情報通信学会技術研究報告,2011 [3] 尾崎竜史,岩田健司,岩尾弘毅,小島功,“ 風景画像データのカ テゴリー推定”,精密工学会誌 ,2014 [4] Wang Jiani,野田雅文,高橋友和,出口大輔,井手一郎,村瀬 洋,“ ジオタグ付き写真を用いた風景カテゴリマップ作成手法の 検討 ”,電子情報通信学会マルチメディア・仮想環境基礎研究会, MVE2010-66,pp.7984,Oct. 2010.

[5] G. Csurka,C. Bray,C. Dance, and L. Fan,J. Willam-owski,“ Visual categorization with bags of keypoints ”, Proc.ECCV International Workshop on Statistical Learn-ing in Computer Vision, pp.122, Feb. 2004.

(8)

用いた土地被覆の分析と可視化 ”,第 6 回データ工学と情報マネ ジメントに関するフォーラム,2014 [7] 石野亜耶,藤井一輝,藤原泰士, 前田剛,難波英嗣,竹澤寿幸, “ 旅行ブログエントリと質疑応答コンテンツを利用した観光ガイ ドブックの情報拡張 ”,WebDB Forum,2014 [8] 奥山幸也, 柳井啓司,“ 写真撮影の位置軌跡を利用した旅行支 援システム ”,第 3 回データ工学と情報マネジメントに関する フォーラム,2011

図 4 の King’s Cross station の場所を拡大したものを図 5 , 図 6 に示す.図 5 では,図 4 中で King’s Cross station と示さ れている撮影スポット内で交通機関と推定されるテキストタグ を含んだ写真を表示しており,図 6 では,観光スポットと推定 されるテキストタグを含む写真を表示している. King’s Cross station は,駅として利用されることはもちろんのこと,ある 映画で登場した場所が観光スポットとなっているため, 1 つの 場所で 2
表 4 カテゴリごとの写真枚数 カテゴリ 写真枚数 レストラン 54,830 ホテル 9,112 観光スポット 158,694 交通機関 124,616 る写真が少なくなり,映画で登場した場所など観光スポットと してのカテゴリをもつスポット写真が多く表示されている.こ のことから, 1 つの場所で 2 つのカテゴリをもつようなスポッ トでも,そのカテゴリごとに写真を分けて表示できていること が確認できる. 表 5 カテゴリ(レストラン)のテキストタグリスト 上位 10 件カテゴリ(レストラン)テキストタグ出
図 4 シ ス テ ム 実 行 例(Buckingham Palace,King’s Cross sta- sta-tion 間)
表 10 カテゴリごとの正答率(正規化後上位1,2位)

参照

関連したドキュメント

出典: ランドブレイン株式会社HP「漁村の元気は日本元気」, http://www.landbrains.co.jp/gyoson/approach/toshigyoson_h21_mie.html,

戦前期、碓氷国道が舗装整備。旧軽井沢、南が丘、南原、千ヶ滝地区などに別荘地形成(現在の別荘地エリアが形成) 昭和 17

施設 平成17年 平成18年 平成19年 平成20年 平成21年 平成22年 平成23年 平成24年 平成25年 平成26年 10年比 松島海岸 㻟㻘㻠㻝㻥㻘㻜㻜㻜

観光協会・温泉組合等 + A旅館 Bホテル Cホテル D旅館

このため本プランでは、 「明示性・共感性」 「実現性・実効性」 「波及度」の 3

湯野浜温泉 うしお荘 庄内観光物産館 味街道 庄内観光物産館 庄内庵.

⾜ᴦᆅ䛸䛧䛶▱䜙䜜䛶䛚䜚䚸 䛭䛾ᵝᏊ䛿ḷᕝᗈ㔜䜢䛿䛨䜑ከ䛟䛾ᾋୡ⤮ᖌ䛻䜘䛳䛶⏕䛝⏕䛝 䛸ᥥ䛛䜜䛶䛔䜎䛩䚹 ⌧ᅾ䜒䚸 ㇏䛛䛺⮬↛䜔Ṕྐ䛻⫱䜎䜜䛶䛝䛯⏘ᴗ䚸 ᩥ໬