97 自由論題
観光地域戦略のためのオンラインレビュー分析
Analysis of Online Reviews for Competitive Strategies of Tourism Destination
鈴木英之
合同会社ファイン・アナリシス Hideyuki SUZUKI Fine Analysis, LLC. [email protected] 抄録:近年、情報技術の進展は目覚ましく、膨大な情報の収集やそれらを容易に取り扱うことが可能となる環境が用意さ れつつある。そうした情報技術はビジネスや公益に資するものとして利活用の検討が現在進行中である。本研究は、観光 地域を対象としたビッグデータの収集・分析によって観光地診断(地域分析と地域振興に向けた提言)を補助することを 目的とし、その分析手法と活用法とを検討し提案する。具体的には、分析対象データとして、観光客による観光地に対す るレビューデータを用い、分析手法として、Word2vec 等の現今の人工知能技法を利用する。これらの分析を観光地域戦略 (マーケティングの STP、資源の再発見、及び顧客理解)策定・見直しの観点から活用する方法を提案する。Key Words: 観光地診断 人工知能 地域ブランディング DMO テキストマイニング Word2vec 1.背景 本報告は、前報「観光診断に資するビッグデータ研究 の内外動向」に引き続き、エビデンスに基づいた意思決 定が適切に行われることが期待される観光(地)経営に 資するビッグデータの利活用促進を意図した継続研究の 中間報告である。 2.研究目的 観光戦略を策定もしくは検討する上で、有用な調査・ 分析・診断技法の発展に貢献することをこの研究の趣旨 とし、そのために新たな調査法・分析方法の検討と提案 を行うことが本報の目的である。 新たな調査法とは従来の質問紙調査法等ではなく、近 年その取り扱い方が容易となった大規模データを用いる 方法を想定する(本報ではインターネット上に公開され ている観光地に対するレビューデータを対象とする)。ま た新たな分析法とは、大規模データの取扱を容易にする 人工知能(機械学習)技法である。こうした新しいデー タを用いた観光マーケティング活動(SNS 活用形のプロ モーション)や観光研究(観光地レコメンデーションや 渋滞防止等の観光行動の最適化等)は既に実用化されて いるが、その多くは、地域診断や観光診断が扱う中長期 的・戦略的な視座を持つものではなく、オペレーション や観光戦術的施策にかかるものがほとんどであり、本研 究とは方向性が異なる。 3.先行調査事例 研究をすすめる上で、いずれも大手コンサルティング ファームが実施した以下の先行調査報告2報を参考にす る。 3—1 愛媛県(2017)「ビッグデータを活用した観光戦 略等検討委託事業報告書」 愛媛県による当該報告書は、デロイトトーマツコンサ ルティング社が受託し、調査・分析を行ったものである。 2017 年に策定された『愛媛県観光振興基本計画』のエビ デンス資料として添付されており、地域における戦略策 定に大きな影響を与えたものと考えられる。分析方針と して、観光テーマ(トピック)の把握が中心に据えられ ている。また広域ルート別に観光テーマ(トピック)を 集計することにより、異なる観光地区(市町村)に対し、 横断的・統一性をもった大テーマを掲げることに成功し ている。このことから観光開発における広域的な連携促 進を意図するものとして調査設計がなされたのであろう と推察される。 観光資源のテーマ別分類技法は、テキストマイニング (確率的潜在意味解析法)にかかる同社野守氏の長年に わたる継続的な研究が基盤を為している。 3-2 観光庁(2020)「AI(人工知能)等導入による旅 行サービスの高度化事業調査報告書」 観光庁による当該報告書は、アクセンチュア社が受託 して作成したレポートである。民間観光セクターによる AI ツールの活用推進を後押しするための模範例的な分 析トライヤルである。分析目的は、将来の観光開発のた めの潜在的観光資源(未開発の観光スポット)のリステ ィングにある。また地域の将来有望観光カテゴリーを選 定する。 潜在的観光資源もしくは有望な観光カテゴリーの選定 には、自由記述データから機械学習的な手法によって算 出し得られた評価スコアが用いられる。評価数が少かつ 評価スコアが高い観光資源や観光カテゴリーが有望と判 断される。 アルゴリズムは同社独自の特許技術によるものであり、 北海道観光振興機構等の地域観光戦略策定において多く の実績を有する。主として重点プロモーションの絞り込
98 み検討の用途において利用されてきたものとみられる。 3-3 観光戦略をテーマとしたこれら先行分析の傾向 さて以後の検討を進めるために、以上の先行調査を整 理する。まず観光地戦略的な見地からは、下表の 3 種類 の分析テーマを見出すことができよう。 ① STP の検討材料 競争戦略を策定する上で、多くのマーケティング戦略 的視点において共通して重視される STP(セグメンテー ション・ポジショニング・ターゲティング)を取り上げる。 調査データやデータ分析から得られた知見を活用するこ とで STP を(再)検討するという手法は、従来多用され てきた。伝統的な多変量解析では、市場のセグメンテー ション解釈を可能とするためのクラスタリング手法や、 またポジショニング解釈を可能とするための多次元尺度 構成法等の次元縮約法がそれに相当する。先行の 2 つの 調査は、これら伝統的マーケティング戦略分析技法の延 長線上に位置する報告として捉えることが出来る。これ までと異なるのは、扱うデータの幅が広がり、様々な画 像・動画データや SNS に対して個人が書き込んだ雑駁な 自由記述テキストのような非構造化データであること、 それにこれまで考えられなかったような大規模なデータ が低コストで収集可能となっていることである。 *AI:機械学習的手法の有効な適用分野 愛媛県(2017)は非構造的な自由記述テキストのテーマ 分類のために AI を用いる。従来の多変量解析で同様のこ とをおこなうとすれば、事前調査の上で観光地の多様な テーマや属性を予め想定した上で、それらについて測定 尺度を構成する等の調査設計による大規模な質問紙調査 を実施し、そこから得られた回答の集計データに対して、 何らか潜在クラス分析等の適用によって、ようやくその 目的を果たすことが出来る。 質問紙に依らず、SNS やレビューに書き込まれた自由 記述テキストを分析する場合には、ノイズ(スパム広告 等の分析上有害な書き込み)の除去や表現のゆらぎ(同 じ趣旨の内容が様々な表記の仕方で記述されている)の 標準化、また分析上無視できない新語・造語・絵文字等 口語表現の置換等、データの前処理に際して、人の目と 手を介して、膨大な労力が必要とされる。AI を利用することで、このような扱いにくい非 構造的でバギーなデータを容易に分析の俎上 に乗せることが出来る。 一方、観光庁(2020)は、自由記述テキス トの文面から評価スコアを推定することを目 的に AI を用いる。E コマースサイトやレビュ ーサイトの多くには、レビュアーによる評価 スコア(点数)が付せられるため平均点を比 較するなどして観光地や観光施設を相互に比 較評価することが出来る。一方インスタグラ ムやツイッターのような一般的な SNS にはこ うした評価スコアは書き込まれないものの、 レストランや観光地に対する有用なレビュー文が数多く 書き込まれている。これら評価スコアが付せられていな いテキストの内容を AI が「読解」して、評価スコア(点 数)を推定するというのがここでの分析テーマである。 *分析の限界 両者とも実際的かつ有用な示唆に富む分析調査事例で あり、後続の調査分析に対して、大きな影響を与える参 考資料となるであろうことは間違いない。ただし、調査 分析から導出された知見の限界については指摘する必要 がある。 具体的には、今後の観光業において市場環境は大きく 変化することが予想される。これまでの知見に基づいた 既存の分析フレームは時代遅れになる可能性がある。例 えば、コロナ禍後の世界で、消費者が求める観光テーマ の認知フレームは大きく変化するだろう。ソーシャルデ ィスタンシング的な生活様態が定着した後は、過疎なら ぬ「適疎(適度な疎らさ)」が魅力的な地域コンセプトと して希求されるようになる可能性がある。また安全・安 心や衛生といった価値観は、観光目的地の選択において。 これまで以上に重要視される可能性がある。 過渡期においては、過去のデータから得られたとされ る固定的な分析枠組みから一旦は離れて、虚心坦懐にデ ータを見つめ直す等、探索的な検討が求められるものと 思われる。 ②資源の再発見支援 観光地域戦略の策定において内部資源分析の観点も重 視される。地域内部の人間が見落としていた潜在的な観 光資源(未開発の観光スポットなど)を外部の視点から 再発見し、資本を投じて開発し観光地の振興に役立てよ うとするものである。 近年、観光地域においてインバウンド旅行者の誘致施 策を有効に推進するために、外国人に対するアンケート やグループインタビュー等のマーケティング調査が盛ん に行われるようになっている。SNS やレビューサイト上 の外国人の投稿分析の目的もその延長上にある。従来型 表 1 先行調査分析のテーマとその限界
99 のマーケティング調査に比して実施コストの面で有利と いえる。 ・AI(機械学習)的手法の有効な適用分野 詳細は確認していないが、分析データの前処理におい て、分析対象を地域外部からの旅行者または外国人に絞 る用途で、居住地または国籍を判別するアルゴリズムが 有効に利用されている可能性がある。 観光庁(2020)では、評価スコアリングアルゴリズム を中国語および英語の投稿に対して適用している。異な る文化の間で評価スコアを比較することの理論的な妥当 性はともかくも、観光地評価に対して簡易な国籍別比較 の目安を示すことが出来たのは大きな成果であろう。 ・分析の限界 当然ながら、分析対象として誰(旅行者、外客)を選 ぶかで、結果は異なる。また旅行者や外客ばかりが適切 な分析対象という事もできない。国内の位置情報を用い た研究分野に「穴場」スポットの探索がある。移動経路 や滞在時間にかかる位置情報から、主として住人の行動 に着目し、コアな地元民のみが通う知られざる名所(多 くの観光客にとって未知なスポットである)を発見する という分析テーマが典型である。こうして発掘された「穴 場」はもちろん潜在的な観光資源候補の一つに加えられ るべきだと思われる。 闇雲に収集したデータをアルゴリズムに投げ入れれば、 某らの答えが出てくるわけではあるが、それを信じたと ころで、地域の振興が約束されるわけではない。分析を 開始するまでに、誰を対象に何を導き出すのか、導き出 されたアウトプットからは何が言えて、何が言えないか という最も基本的な調査設計上の問いについて、データ 分析者だけではなく、それを利用する様々な立場のステ ークホルダー間で一定のコンセンサスが準備されなけれ ば、分析レポートが、観光地経営を偏った方向へ誘導す る可能性がある。 ③顧客理解の支援 顧客インサイトの理解は、マーケティングリサーチの 主要テーマといえる。 ・分析の限界 一般的なマーケティングリサーチの報告書では、デモ グラフィック(とりわけ性別および年齢帯別)で層別に なされた集計表に多くの紙数を費やす。それら与えられ た膨大な資料から地域経営戦略にとって、それを転換す るきっかけとなるような新知見を見出す読者がいないと は言えないが、それには読者個人の資質すなわち地域経 営の現場経験や想像力それにデータの読解力に大きく頼 らざるを得ないものと思われる。 4.試行 以上、観光戦略をテーマとした2つの先行分析を検討 し、AI 的手法の有効な適用分野とその限界を見てきた。 今後、市場環境が大きく変化することが予想される観光 地経営においては、確定的な「予言」を占うのではなく、 新たな戦略方向性を見定めるための検討材料を与え、施 策計画のための仮説設定を後押しすることにあるのでは ないかと考える。 そこで先行分析のように、個別的な分析テーマを定め、 そこに到達するための固定的な分析フレームを予め決定 する方法は避けることとした。 4-1方法 従来方法で扱いにくい大規模な非構造化データに対し て AI 的手法を用いた処理はするが、分析フレームや最終 的な分析目的を予め定めることはしない。それは、現場 のプランナーやコンサルタント等の施策検討者が、今回 試行作成した中間データを用いて、その後に、様々な目 的に応じて自由に探索的なデータ解析を可能にするため である。 ①データについて 国内観光スポット(観光資源)に対する日本語による 口コミレビューを用いる。2019 年 7 月に TripAdvisor か ら取得した閲覧可能な公開データである。収集した口コ ミは約 150 万件になる。これらの口コミは観光スポット (約 5 万件の観光資源)毎に、テキストを連結して用い る。 ②前処理 それぞれのテキストは、形態素解析(mecab を使用) により単語に分解し、その後の処理に供する。 ③ベクトルの生成付与:Word2vec について それぞれの観光スポットに対して、テキスト内の単語 の出現状況を手がかりに、その特徴を表現する 50 次元の ベクトルを生成付与する。ここでは AI 的手法のひとつで ある Word2vec アルゴリズムを用いる。Word2vec は、 Google の Mikolov(2014)らによって開発されたニューラ ルネットワークを用いたアルゴリズムであり、自然言語 にベクトルを付与する方法の一つである。著者らによれ ば、これまでの同目的の様々なアルゴリズムと比較して 精度高く、単語や文章をベクトル化することが可能だと される。 今回はpython の機械学習ライブラリー gensim に実装 されている Word2vec クラスを利用する。 4-2結果 ・生成付与されたベクトルについて 約 5 万件の観光スポットに対するベクトル付与は、一 般的なビジネス PC において実用的な時間(数分から数十 分)内に終了することが確認された。 50 次元のベクトルに対して ward 法でクラスタリング を行った結果は、ジャンルやカテゴリー(お城や海水浴 場等)が似通った観光スポットに整然と分類されており、 50 次元のベクトルにはそれぞれの観光地が有する個別 的特徴の様々な側面を表現していることを確認した。 ・個別の観光地について 個別の観光スポットについて、付与されたベクトルに 基づき類似の観光スポットのリスティングを試みた。表
100 2 は、大阪市阿倍野区内の観光スポットに対して類似性 の高い(ベクトルの為す角度の近い)他の観光スポット を類似度の高い順に並べたものである。人気のある行楽 地である「天王寺動物園」(レビュー数 730 件)からマイ ナーな「寺西家阿倍野長屋」、「飛田新地」(レビュー数 4 件)まで5件の観光スポットを表記している。 ここで個別詳細な分析・解釈には踏み込まないが、レ ビュー件数の少ない観光スポットに対しても、それなり に雰囲気や傾向が似通った他スポットがリストアップさ れていることを特筆する。寺西家阿倍野長屋は、昭和初 期の長屋住宅をリノベーションした飲食店街である。類 似スポットのリストには、レトロな雰囲気や昭和的な懐 古趣味の感覚を連想するスポットが多く挙げられている。 また飛田地区は元遊郭地区のやはりレトロな飲食街であ る。同じレトロと言っても寺西家長屋とはまた違った怪 しさやいかがわしいサブカル的な雰囲気の漂うスポット が挙げられていることを指摘する。 5 考察 一般的な統計解析では 4 件のローデータ(レビューテ キスト)から何らかの有意義な解釈をもたらすことは普 通しない。本試行で、こうした新しい手法が有益な知見 をもたらす可能性があることを確認した。 さて、本試行の後これに引き続く個別の応用分析の方 向性について検討してみたい。 【STP の検討材料として】 生成されたベクトルから観光スポットに対して妥当性 のあるクラスタリングが可能であることが確認された。 (2017)と同様に観光資源のテーマ分類や観光地域(市 町村や広域ルート)毎に観光資源のテーマ別構成比を示 すことは十分に可能である。また今回のデータのように レビュアーによるスコアが付与されているデータでは、 (2020)と同様に投稿数と平均スコアを用いて、ポジシ ョニングマップを作成することは十分に可能である。 また今回の試行で、類似スポットの実用的なリスティ ングが可能であることが確認された。類似スポットは、 顧客から見た場合に訴求価値が近似であり、潜在的な競 合関係にあると考えることが出来る。これら類似スポッ トにおける顧客満足度、顧客単価および投資対効果等を 調査するなどして、ベンチマーキングに利用する用法や、 先進事例や失敗事例の収集先として捉える用法にも観光 地域の戦略策定上、大きな意味があるものと考える。 【資源の再発見支援】 今回の試行は日本語によるレビューのみを分析対象と しているが、外客目線ということであれば、外国語レビ ューを対象にした同様の分析を行った上で、日本語レビ ューのものと比較し、その乖離が大きいスポットを潜在 資源候補として着眼する方法もひとつ考えられる。 今回使用したデータは昨年度収集したものであり、コ ロナ禍を経た直近足元のデータで同様の分析を行い、過 去のデータとの間のベクトル空間の差異は将来の経営を 占う上で大きな参照資料となろう。 【顧客理解の支援】 今回は、観光スポットをその集計単位として分析を進 めた。顧客のより深い理解のためには、顧客セグメント 間の異質性を前提にし、レビュアーを集計単位として分 析することも一法であろう。レビュアー(旅行者)のタ イプを類型化する、またはタイプ別の消費価値観や認知 や行動のパターンを描写することも、顧客を深く理解す る上で意義を有するものと思われる。 6 今後にむけて 今後、旅行者そして住民の意識と行動の変化を踏まえ た観光(地)診断が求められるものと思われる。足元の レビューデータの収集し同様の分析を実施することを予 定している。また、居住者・住民の観光(客)によるネ ガティブな意識等についてもデータの収集を進め、併せ て次回の報告としたい。 謝辞: 本報の作成にあたっては、有限会社サカエマチ中央ビ ル 山川雅行社長に多大なるご助言ご指導を頂いた。記 して謝意を表する。 文献 野守耕爾,神津友武(2014)「観光クチコミデータを用いた類似 観光地の発見と満足形成要素の分析」,サービス学会第 2 回国 内大会講演論文集,pp.95-100 愛媛県(2017)「ビッグデータを活用した観光戦略等検討委託事 業報告書」 北海道観光振興機構(2017)「平成 28 年度北海道外国人観光客 再訪促進事業調査事業報告書」 観光庁(2020)「AI(人工知能)等導入による旅行サービスの高 度化事業調査報告書」
Q.Le, T.Mikolov (2014) Distributed Representations of Sentences and Documents
表 2 観光スポットとその類似スポット 天王寺動物園(730件,40,127文字) 寺西家阿倍野長屋(7件,623文字) 類似観光スポット コサイン類似度 類似観光スポット コサイン類似度 神戸市立王子動物園 0.867 Wマーケット 0.875 到津の森公園 0.862 懐かし横丁 0.870 福山市立動物園 0.861 城東商店街 0.864 千葉市動物公園 0.852 覚王山アパート 0.864 セルコホーム ズーパラダイス八木山 0.851 花やしき通り 0.860 大牟田市動物園 0.846 鳩の街通り商店街 0.859 豊橋総合動植物公園 のんほいパーク 0.844 御屋敷再生複合ショップ 練 0.857 池田動物園 0.839 ララガーデン 0.855 千葉市動物公園ふれあい動物の里 0.838 ハミングロード新天町 0.853 羽村市動物公園 0.834 渋谷のんべい横丁 0.846 安倍晴明神社(33件,3103文字) 飛田新地(7件,431文字) 晴明神社 0.785 占い館愛梨 カモメ市場本館 0.858 西院春日神社 0.752 日光人形の美術館 0.855 猿田彦神社 0.746 沢田マンション 0.850 賀志波比売神社 0.743 ミニギャラリースペース 0.845 上神明天祖神社 0.740 本多劇場 0.843 装束稲荷神社 0.740 アンティークライフジン2 0.842 黒田節誕生の地 0.740 Shop&Gallery SOMETHING 0.841 姫嶋神社 0.738 日向新しき村 0.839 八宮神社 0.737 占いどころ 服部宝観 0.838 西出鎮守稲荷神社 0.736 クラシックヴィンテージ 0.838 大阪市立阿倍野防災センター(21件,1902文字) 神奈川県総合防災センター 0.919 栃木県防災館 0.871 防災体験学習施設 そなエリア東京 0.838 札幌市民防災センター 0.828 東京臨海広域防災公園 0.826 おぢや震災ミュージアムそなえ館 0.825 東京都北区防災センター (地震の科学館) 0.818 野島断層保存館 0.815 人と防災未来センター 0.799 大阪ガス ガス科学館 0.792