SNSを活用した観光経営情報の形態素解析

(1)

SNSを活用した観光経営情報の形態素解析

キーワード：ソーシャルネットワーク，SNS，マイニング，観光，経営 新潟経営大学　特任教授

　藪下　保弘　

新潟経営大学　助手

　落合　　純　

経営情報学部　３年

　阿部　彩奈　

はじめに ２．研究の背景と先行研究 ３．キーワード「燕三条」の評価分析 　３－１　方法と手続き 　３－２　結　果 ４．考　察 　４－１　Twitter投稿にうかがう「工場の祭典」の話題 　４－２　観光資源としての「ラーメン」 むすびにかえて はじめに 　インターネットに介在する情報は、膨大かつ瞬時性、多様性に富んでいるため、社会動向の調査目的に有用な情報源になりうる。　近時、ソーシャル・ネットワーキング・サービス（SNS）の急速な普及と並行して自然言語処理技術が進展している。今後も、未知の可能性を内包するSNS 情報には、より高い期待が集まろう。　ところが、当該サービスのうち幅広く多くのユーザーを有するTwitterTM1_{から得られる情報は、テキス} ト・データであり、情報として構造化されていないところが難点である。つまり、秩序だったデータ群から一定の法則をもって回帰式を導出し、「過去の事象から未来を予測する」という伝統的な統計学の技法がダイレクトに適応しないのである。　しかし、昨今では「デジタル・マーケティング」の名のもとでさまざまな方法により抽出、整理、分析する手法が開発されている。このうち、「テキスト・マイニング（超高速文字検索処理）」は、この解析技術の筆頭にあげられる技法である。本研究では、 Twitterの投稿文を言葉の最小単位である品詞に分解して解析する「形態素分析」を用いた。　また、自然言語には同じ意味や内容の記述の際に、多様多彩な表現が存在することに加え、とりわけ Twitterの場合には投稿文中のハッシュタグ（#）や URLの除去をはじめ、半角全角文字の正規化など、同サービスに独自の前処理が必要となる。　本研究では、こうした条件を一つひとつクリアしながら、目視による主観を排除するために前処理プログラムを組んで対処するなど、随時制約条件を確認しながら進めた。よって、本研究は最新の技法を駆使しておらず、SNS情報から観光および経営に資する情報を得るための実証的手法（empirical approach）の試行研究の範囲にとどまる。　なお、研究の背景やキーワード選択に至る経緯などについては、２章に詳細を譲る。

(2)

２．研究の背景と先行研究 （落合　　純） 　2000年代以降、わが国では一般家庭においてインターネットが急速に普及した。総務省によれば、わが国におけるインターネットの人口普及率は、平成25年末時点で82.8％に達している（総務省、2015b）。大多数の国民が多様な情報を取得・発信できるようになった現在、著名人や専門家ではなく、一般ユーザーが発信する情報を企業活動に積極的に活用しようという動きが盛んに行われている。一般ユーザーが発信する情報というものは、いわば消費者の「生の声」であるため、それを分析することは、製品やサービスの改善点、新たな顧客獲得や市場開拓に関するヒントといった、企業の発展に必要な材料の獲得につながるのである。　こうした動きは、製造業や飲食産業などの特定の業種にとってだけでなく、観光業にとっても意味があると考えられる。観光業は、わが国の成長戦略の１つと位置づけられており、「訪日外国人旅行者数を平成32 年初めまでに2,500万人とすることを念頭に、平成28 年までに1,800万人にする」といった目標が新たに掲げられるなど、今後ますますの活性化が期待される産業分野である（観光庁、2015）。こうした現状において、観光客がウェブ上でどのような発言をしているのか調査分析を行い、その国・土地が彼らにとってどういう所だったのかを明らかにすることは、観光立国を目指すわが国にとって貴重な情報を提供してくれるものと考えられる。事実、観光庁によれば、訪日外国人の出発前の旅行情報源は個人のブログ（Weblog）が24.1％と最も多い回答であった（観光庁、2014）。また、沖縄県観光における情報通信技術の利活用の可能性を調べた調査では、国内外の観光客の５割近くがブログや口コミサイトなどの情報に基づき観光地や店舗等に来訪していることが報告されており（南西地域産業活性化センター、2013）、ウェブを通じて個人が発信する情報が持つ観光地への誘引力は大きいといえる。　こうしたアンケート調査に加え、観光に関連するウェブ上の発言に焦点を当てた研究もいくつか行われている。そこでは主に「テキスト・マイニング」と呼ばれる分析手法を用いている。「テキスト・マイニング」とは、テキスト・データを分析する方法で、コンピュータによってデータの中から自動的に言葉を取出し、様々な統計的手法を用いて探索的な分析を行い、それによりパターンやルール、知識の発見を目指すものである（樋口、2014）。　たとえば,Wenger（2008）は外国のブロガーがオーストリア観光をどのように発信しているか、114のブログを収集し、分析した。その結果、概ねポジティブな評価であり、いずれも類似した特徴・内容であったことを報告している。　国内では、三田村・岩佐・湯川・大堀（2008）は、国内のさまざまなブログを収集し、それらの中に観光に関するキーワードがどの程度出現するかを調査した。その結果、温泉や銭湯に関するキーワードが多く出現する傾向が判明した。また、「流氷」や「ジンギスカン」といった北海道に特有のキーワードも出現する傾向も確認され、国内旅行者がどのようなものごとに興味を持って観光を行っているのかを明らかにしている。　村上・川村（2011）は、2000年から2011年にかけてアップロードされた日本旅行に関する120の海外ブログの記事を対象に、海外から日本（東京・北海道・石川）がどう見られているのかについて調査分析を行った。その結果、“love”“enjoy”“beautiful”などのポジティブな単語が比較的多く抽出され、いずれの地域においても海外ブロガーから肯定的な印象を持たれていたことが判明した。次いで、著者らが収集した記事すべてに目を通して印象判断を行った。その結果、東京では長期旅行者が多い印象、北海道は食や雪のイベントを楽しんだ心地よい旅がなされた印象、石川は兼六園や陶芸など日本の文化や歴史、情緒的なものを楽しんだという印象と、地域によって異なる特徴があったことを報告している。　加藤（2013）は、有名な観光都市であるモナコ公国に対し、日本のブロガーがどのような点に関心を持っているのか分析した。その結果、食事や家族と過ごす時間、穏やかな天候に魅力を感じていることが示された。また、モナコに心理的癒しを求めていることなども明らかになった。

(3)

　このように、観光に関するブログの解析した研究は国内外において行われており、知見が蓄積しつつある。しかしながら、今や情報発信のためのプラットフォームはブログだけではない。他にも、ホームページ（HP）や掲示板（BBS）など異なるプラットフォームが存在している。近年では、スマートフォンのような携帯型情報端末の急速な普及に伴い、Twitterに代表されるマイクロブログによる情報発信が盛んに行われてきている。Twitterは、HPやブログとは異なり、発信者がほぼリアルタイムで情報を発信できるという特徴がある。言い換えれば、Twitterの発言は、発信者がその時に感じたことやその時に示した興味関心であると考えることができる。ゆえに、Twitterでの特定のキーワードを含んだ発言の分析は、観光業に限らず多くの分野において貴重な情報をもたらすものと考えられる。事実、すでにTwitterを対象にしたテキスト・マイニング研究がいくつか報告されている。

　たとえば、Park, Ok, & Chae（2015）は、クルージング旅行に関するTwitter上の発言を分析している。その結果、感情や産業、目的地や旅行に関連する単語だけでなく、有名人やプロのブロガー、船旅会社、旅行代理店なども比較的高い頻度で話題に上がっていることが分かった。　一方、わが国では、石井（2012）がTwitter上のメッセージによる複数の国のイメージ測定を行っている。その結果、好感度が最も低いのが中国で、次いでアメリカ、ロシア、韓国といった国が低かった。また、メッセージ内容を複数のカテゴリに分けて分析した結果、韓国に関して国民性や道徳に関するメッセージがきわめて多いことが判明した。さらに、国名と結びつきの強い単語を分析したところ、台湾・韓国・ドイツとは時事ニュースに関連する単語（義捐金、竹島、原発など）が結びついており、一方で中国やインド、イタリアなどとは有名な食べ物（烏龍茶、カレー、パスタなど）が強く結びついている傾向が示された。　先述のように、Twitterの発言には価値ある情報が含まれていると考えられるが、比較的最近になって普及してきたサービスということもあり、国内外でこれを利用した研究の数はあまり多くない。また、最近では観光による地方活性化にも注目が集まっているが、特定の地方・地域に焦点を当てたテキスト・マイニング研究はほとんどない。そこで、本研究では、新潟県の「燕三条」地域をキーワードとしてTwitter上の発言を収集・分析し、地方観光に関する新たな知見を提供すべく調査を行った。なお、キーワードの選定理由については、国だけでなく、新潟県も平成25年より「新潟県観光立県推進計画」を推進していくという現状や「燕三条」地域が世界レベルの高い水準をもつ金属加工技術などを備えていること、「燕三条」という単語が本地域に特有のものであることなどを総合的に勘案してキーワードとして選定した。 ３．キーワード「燕三条」の評価分析 ３－１方法と手続き （阿部　彩奈） 収集方法 　Twitterの公式Webサイトから、本実証の基礎となる語「燕三条」をキーワードとしてTwitter投稿（以下、「Tweet」）を収集した。収集期間は、2014年９月１日から2015年８月31日（１年間）である。収集に際しては、ブラウザに表示される全Tweetをコピーし2_、解析に不要な用語、文字列を自作「解析前処理プログラム3_{」にて一括削除した。テキスト・マイニングには「KH} Coder4_{」を用いた。} 　図表３－１は解析前の処理条件である。　テキスト・マイニングに際し、Twitterは個人の感 3 このように，観光に関するブログの解析した研究は国内外において行われており，知見が蓄積しつつある。しかしながら，今や情報発信のためのプラットフォームはブログだけではない。他にも，ホームページ（HP）や掲示板（BBS）など異なるプラットフォームが存在している。近年では，スマートフォンのような携帯型情報端末の急速な普及に伴い，Twitter に代表されるマイクロブログによる情報発信が盛んに行われてきている。Twitter は，ＨＰやブログとは異なり，発信者がほぼリアルタイムで情報を発信できるという特徴がある。言い換えれば，Twitter の発言は，発信者がその時に感じたことやその時に示した興味関心であると考えることができる。ゆえに，Twitter での特定のキーワードを含んだ発言の分析は，観光業に限らず多くの分野において貴重な情報をもたらすものと考えられる。事実，すでに Twitter を対象にしたテキスト・マイニング研究がいくつか報告されている。

たとえば，Park, Ok, & Chae（2015）は，クルージング旅行に関する Twitter 上の発言を分析している。その結果，感情や産業，目的地や旅行に関連する単語だけでなく，有名人やプロのブロガー，船旅会社，旅行代理店なども比較的高い頻度で話題に上がっていることが分かった。一方，わが国では，石井（2012）が Twitter 上のメッセージによる複数の国のイメージ測定を行っている。その結果，好感度が最も低いのが中国で，次いでアメリカ，ロシア，韓国といった国が低かった。また，メッセージ内容を複数のカテゴリに分けて分析した結果，韓国に関して国民性や道徳に関するメッセージがきわめて多いことが判明した。さらに，国名と結びつきの強い単語を分析したところ，台湾・韓国・ドイツとは時事ニュースに関連する単語（義捐金，竹島，原発など）が結びついており，一方で中国やインド，イタリアなどとは有名な食べ物（烏龍茶，カレー，パスタなど）が強く結びついている傾向が示された。先述のように，Twitter の発言には価値ある情報が含まれていると考えられるが，比較的最近になって普及してきたサービスということもあり，国内外でこれを利用した研究の数はあまり多くない。また，最近では観光による地方活性化にも注目が集まっているが，特定の地方・地域に焦点を当てたテキスト・マイニング研究はほとんどない。そこで，本研究では，新潟県の「燕三条」地域をキーワードとして Twitter 上の発言を収集・分析し，地方観光に関する新たな知見を提供すべく調査を行った。なお，キーワードの選定理由については，国だけでなく，新潟県も平成 25 年より「新潟県観光立件推進計画」を推進していくという現状や「燕三条」地域が世界レベルの高い水準をもつ金属加工技術などを備えていること，「燕三条」という単語が本地域に特有のものであることなどを総合的に勘案してキーワードとして選定した。

3. キーワード「燕三条」の評価分析

3-1

方法と手続き

（阿部彩奈）収集方法 Twitterの公式 Web サイトから，本実証の基礎となる語「燕三条」をキーワードとして Twitter 投稿（以下，「Tweet」）を収集した。収集期間は，2014 年 9 月 1日から 2015 年 8 月 31 日（１年間）である。収集に際しては，ブラウザに表示される全 Tweet をコピーし 2，解析に不要な用語，文字列を自作「解析前処理プログラム3」にて一括削除した。テキスト・マイニングには「KHCoder4」を用いた。図表 3-1 は解析前の処理条件である。図表 3-1 解析前の処理条件条件処理除外Tweet (1)重複Tweet (2)リツィート (3)広告 (4)自動で Tweet されるもの（いわゆる「bot」） (5)別サービスやアプリから投稿された Tweet（例えば、「ブログからの自動 Tweet」「Instagram5」「Foursquare6」

「Swarm7」など）

数字正規化全角数字は、半角数字に強制置換 Tweet区切り文字列処理による8

解析に際し，Tweet は個人の感情や自己表現を発信

(4)

情や自己表現を発信するSNSサービスであるとの観点から、図表３－１の仕様にもとづき、解析前処理プログラムを通した後に、最終的にはプログラムで処理しきれないTweetを目視および手作業により除外した9_。　この結果、全検索Tweet40,991件のうち、純粋に個人が発したと思われるTweet14,592件を解析対象として抽出した。　形態素解析は、文を最小単位にして分析できる形にし、複数の品詞で構成される固有名詞が品詞単位に分解される場合を回避する必要がある。たとえば、「経営大学」のように「経営」「大学」で１つの語になる場合である。補足として、KH Coderは「茶筌10_」を形態素解析システムに採用しており、品詞体系は図表３－２に示すとおり、相当に細かい仕様になっている。　具体的な対処として、イベント名「工場の祭典」、新幹線駅名「燕三条」、高速道路IC名「三条燕」を複数の品詞に分解しないようにKH Coderの機能で設定した。さらに、「背」「脂」と「背」「油」が連続している場合は強制的にそれぞれ「背脂」「背油」となるように設定した11_。 ３－２結果 基礎データ 　KHCoderのファイルチェックの結果、文字化けを含む行が31行、望ましくない半角記号が含まれている行が5,169行ある。　これらは、顔文字やUnicodeなどの文字コードに起因するエラーだと考えられる。本分析においては、当該エラーを無条件に削除してもさしあたり問題はないと考えられるため、KH Coderの機能で自動修正し「前処理12_{」を実行した。} 　　前処理後の語と文および段落の数は、図表３－３で示すとおりであるが、抽出後のTweet14,592件と段落数14,978件がほぼ一致している点に着目したい。両者の差異が小さい理由は、解析前の条件処理によりハイパーリンクや画像のみのデータを予め除去した効果だと思われる。　図表３－４「頻出語上位150語」から、基礎となる語「燕三条」は全Tweetに含まれているため除外して観察すると、「新潟」「ラーメン」「駅」「行く」「系」が、際立って頻出している様子が読み取れる。前節で示した、形態素分析の品詞の分解という特性に起因して、たとえば「系」という語は単独で用いられるケースが少なく、「新幹線」の系統として用いられているのか「燕三条系ラーメン」として用いられているのかここでは判別できない。　よって、別途Tweetを確認し修正しながら解析を進める必要がある。 4 する SNS サービスであるとの観点から，以下の制約条件で解析前処理プログラムを通した後に，最終的には目視により制約条件に合致するTweetを除外した9。この結果，全検索 Tweet40,991 件のうち，純粋に個人が発したと思われる Tweet14,592 件を解析対象として抽出した。図表 3-2 KHCoder の品詞体系品詞茶筌出力の品詞名名詞名詞―般（漢字を含む 2 文字以上の語）名詞B （平仮名のみの語）名詞C （漢字1 文字の語）サ変名詞名詞―サ変接続形容動詞名詞―形容動詞語幹固有名詞名詞―固有名詞一般組織名名詞―固有名詞―組織人名名詞―固有名詞―人名地名名詞―固有名詞―地域ナイ形容名詞―ナイ形容詞語幹副詞可能名詞―副詞可能未知語未知語感動詞感動詞またはフィラータグタグ動詞動詞―自立（漢字を含む語）動詞B 動詞―自立（平仮名のみの語）形容詞形容詞（漢字を含む語）形容詞B 形容詞（平仮名のみの語）副詞副詞（漢字を含む語）副詞B 副詞（平仮名のみの語）否定助動詞助動詞「ない」「まい」「ぬ」「ん」形容詞（非自立）形容詞―非自立（「がたい」「つらい」「にくい」等）その他上記以外のもの形態素解析は，文を最小単位にして分析できる形にし，複数の品詞で構成される固有名詞が品詞単位に分解される場合を回避する必要がある。たとえば，「経営大学」のように「経営」「大学」で 1 つの語になる場合である。補足として，KHCoder は「茶筌10」を形態素解析システムに採用しており，品詞体系は図表 3-2 に示すとおり，相当に細かい仕様になっている。具体的な対処として，イベント名「工場の祭典」，新幹線駅名「燕三条」，高速道路 IC 名「三条燕」を複数の品詞に分解しないように KHCoder で設定した。さらに，「背」「脂」と「背」「油」が連続している場合は強制的にそれぞれ「背脂」「背油」となるように設定した11。

3-2

結果

基礎データ KHCoderのファイルチェックの結果，文字化けを含む行が 31 行，望ましくない半角記号が含まれている行が 5,169 行ある。これらは，顔文字や Unicode などの文字コードに起因するエラーだと考えられる。本分析においては，当該エラーを無条件に削除してもさしあたり問題はないと考えられるため，KH Coder 機能で自動修正し「前処理12」を実行した。図表 3-3 前処理後の結果項目数値総抽出語数 (使用) 385,179 (167,183) 異なり語数 (使用) 23,534 (21,109) 文 23,359 段落 14,978 前処理後の語と文および段落の数は，図表 3-3 で示すとおりであるが，抽出後の Tweet14,592 件と段落数 14,978件がほぼ一致している点に着目したい。両者の差異が小さい理由は，解析前の条件処理によりハイパーリンクや画像のみのデータを予め除去した効果だと思われる。図表 3-4「頻出語上位 150 語」から，基礎となる語「燕三条」は全 Tweet に含まれているため除外して観察すると，「新潟」「ラーメン」「駅」「行く」「系」が，際立って頻出している様子が読み取れる。前節で示した，品詞の分解という特性からたとえば，「系」という語は単独で用いられるケースが少なく，「新幹線」の系統として用いられているのか「燕三条系ラーメン」として用いられているのかここでは分からない。したがって，別途 Tweet を確認し修正しながら解析を進める必要があろう。 4 する SNS サービスであるとの観点から，以下の制約条件で解析前処理プログラムを通した後に，最終的には目視により制約条件に合致するTweetを除外した9。この結果，全検索 Tweet40,991 件のうち，純粋に個人が発したと思われる Tweet14,592 件を解析対象として抽出した。図表 3-2 KHCoder の品詞体系品詞茶筌出力の品詞名名詞名詞―般（漢字を含む 2 文字以上の語）名詞B （平仮名のみの語）名詞C （漢字1 文字の語）サ変名詞名詞―サ変接続形容動詞名詞―形容動詞語幹固有名詞名詞―固有名詞一般組織名名詞―固有名詞―組織人名名詞―固有名詞―人名地名名詞―固有名詞―地域ナイ形容名詞―ナイ形容詞語幹副詞可能名詞―副詞可能未知語未知語感動詞感動詞またはフィラータグタグ動詞動詞―自立（漢字を含む語）動詞B 動詞―自立（平仮名のみの語）形容詞形容詞（漢字を含む語）形容詞B 形容詞（平仮名のみの語）副詞副詞（漢字を含む語）副詞B 副詞（平仮名のみの語）否定助動詞助動詞「ない」「まい」「ぬ」「ん」形容詞（非自立）形容詞―非自立（「がたい」「つらい」「にくい」等）その他上記以外のもの形態素解析は，文を最小単位にして分析できる形にし，複数の品詞で構成される固有名詞が品詞単位に分解される場合を回避する必要がある。たとえば，「経営大学」のように「経営」「大学」で 1 つの語になる場合である。補足として，KHCoder は「茶筌10」を形態素解析システムに採用しており，品詞体系は図表 3-2 に示すとおり，相当に細かい仕様になっている。具体的な対処として，イベント名「工場の祭典」，新幹線駅名「燕三条」，高速道路 IC 名「三条燕」を複数の品詞に分解しないように KHCoder で設定した。さらに，「背」「脂」と「背」「油」が連続している場合は強制的にそれぞれ「背脂」「背油」となるように設定した11。

3-2

結果

基礎データ KHCoderのファイルチェックの結果，文字化けを含む行が 31 行，望ましくない半角記号が含まれている行が 5,169 行ある。これらは，顔文字や Unicode などの文字コードに起因するエラーだと考えられる。本分析においては，当該エラーを無条件に削除してもさしあたり問題はないと考えられるため，KH Coder 機能で自動修正し「前処理12」を実行した。図表 3-3 前処理後の結果項目数値総抽出語数 (使用) 385,179 (167,183) 異なり語数 (使用) 23,534 (21,109) 文 23,359 段落 14,978 前処理後の語と文および段落の数は，図表 3-3 で示すとおりであるが，抽出後の Tweet14,592 件と段落数 14,978件がほぼ一致している点に着目したい。両者の差異が小さい理由は，解析前の条件処理によりハイパーリンクや画像のみのデータを予め除去した効果だと思われる。図表 3-4「頻出語上位 150 語」から，基礎となる語「燕三条」は全 Tweet に含まれているため除外して観察すると，「新潟」「ラーメン」「駅」「行く」「系」が，際立って頻出している様子が読み取れる。前節で示した，品詞の分解という特性からたとえば，「系」という語は単独で用いられるケースが少なく，「新幹線」の系統として用いられているのか「燕三条系ラーメン」として用いられているのかここでは分からない。したがって，別途 Tweet を確認し修正しながら解析を進める必要があろう。図表３－２　KH Coderの品詞体系図表３－３　前処理後の結果 5 図表 3-4 頻出 150 語リスト順位抽出語出現回数順位抽出語出現回数順位抽出語出現回数順位抽出語出現回数順位抽出語出現回数 1 燕三条 15,340 31 醤油 310 61 無い 179 91 煮る 131 121 ホーム 102 2 新潟 2,836 32 出る 303 62 仕事 175 92 潤 131 122 終わる 102 3 ラーメン 2,537 33 帰る 300 63 上越新幹線 175 93 出来る 129 123 極太 101 4 駅 1,898 34 買う 284 64 多い 172 94 地域 129 124 最高 101 5 行く 1,539 35 スープ 277 65 上越 171 95 大宮 125 125 地場 101 6 系 1,300 36 燕 274 66 入る 170 96 通過 125 126 北陸 100 7 新幹線 927 37 前 274 67 到着 168 97 飯店 125 127 付近 99 8 笑 918 38 行う 259 68 聞く 168 98 本日 125 128 陣 98 9 食べる 906 39 良い 246 69 限定 167 99 油 125 129 金物 96 10 背脂 881 40 バス 242 70 ホテル 165 100 話 125 130 潟 95 11 三条 837 41 知る 229 71 食う 165 101 職人 124 131 乗車 95 12 麺 745 42 カレー 220 72 向かう 162 102 初めて 123 132 年 95 13 思う 732 43 子 213 73 味 162 103 イオン 122 133 分かる 95 14 今日 623 44 次 211 74 背油 156 104 イベント 122 134 ク 94 15 燕 607 45 中華 210 75 電車 154 105 お願い 118 135 東三条 94 16 来る 523 46 近く 209 76 気 153 106 玉ねぎ 116 136 いま 93 17 言う 485 47 降りる 208 77 違う 151 107 名前 114 137 飲む 93 18 長岡 479 48 円 207 78 行ける 150 108 杭州 113 138 タイトー 92 19 見る 445 49 雪 206 79 車 149 109 高崎 113 139 駅名 92 20 煮干 428 50 越後湯沢 203 80 包丁 148 110 浦佐 112 140 県 92 21 東京 390 51 着く 198 81 食 144 111 移動 111 141 工場 92 22 市 388 52 作る 195 82 遠い 142 112 産業 110 142 最近 92 23 人 369 53 感じ 193 83 地元 142 113 自分 110 143 少し 92 24 乗る 367 54 高速 191 84 有名 142 114 止まる 109 144 高い 91 25 店 362 55 使う 191 85 楽しい 140 115 駅前 106 145 旨い 91 26 今 360 56 好き 189 86 昨日 140 116 太 105 146 久しぶり 90 27 長岡 328 57 燕 187 87 夜 140 117 辺り 105 147 刃物 90 28 美味しい 324 58 近い 185 88 美味い 138 118 スる 103 148 街 89 29 明日 322 59 弥彦線 181 89 予定 138 119 早い 103 149 今回 89 30 時間 317 60 月 180 90 弥彦 136 120 センター 102 150 見える 88 図表 3-5A は語の出現回数、図表 3-5B は語の出現頻度の分布をプロットしたものである13。視覚的にはべき乗分布にしたがっており，一定の出現率の高い語が多く用いられているが，データの構成は出現率の低い語が多く，いわゆるロングテールになっていると推察される。図表 3-5A 出現回数の集計表統計項目値語数(n) 21,146 出現回数の平均 7.80 出現回数の標準偏差 115.93 図表 3-5B 出現回数の記述統計量

(5)

　図表３－５Ａは語の出現回数、図表３－５Ｂは語の出現頻度の分布をプロットしたものである13_。視覚的には、べき分布にしたがっており、一部の出現率の高い語に出現率が偏り、いわゆるロングテールになっていると推察される。 5 図表 3-4 頻出 150 語リスト順位抽出語出現回数順位抽出語出現回数順位抽出語出現回数順位抽出語出現回数順位抽出語出現回数 1 燕三条 15,340 31 醤油 310 61 無い 179 91 煮る 131 121 ホーム 102 2 新潟 2,836 32 出る 303 62 仕事 175 92 潤 131 122 終わる 102 3 ラーメン 2,537 33 帰る 300 63 上越新幹線 175 93 出来る 129 123 極太 101 4 駅 1,898 34 買う 284 64 多い 172 94 地域 129 124 最高 101 5 行く 1,539 35 スープ 277 65 上越 171 95 大宮 125 125 地場 101 6 系 1,300 36 燕 274 66 入る 170 96 通過 125 126 北陸 100 7 新幹線 927 37 前 274 67 到着 168 97 飯店 125 127 付近 99 8 笑 918 38 行う 259 68 聞く 168 98 本日 125 128 陣 98 9 食べる 906 39 良い 246 69 限定 167 99 油 125 129 金物 96 10 背脂 881 40 バス 242 70 ホテル 165 100 話 125 130 潟 95 11 三条 837 41 知る 229 71 食う 165 101 職人 124 131 乗車 95 12 麺 745 42 カレー 220 72 向かう 162 102 初めて 123 132 年 95 13 思う 732 43 子 213 73 味 162 103 イオン 122 133 分かる 95 14 今日 623 44 次 211 74 背油 156 104 イベント 122 134 ク 94 15 燕 607 45 中華 210 75 電車 154 105 お願い 118 135 東三条 94 16 来る 523 46 近く 209 76 気 153 106 玉ねぎ 116 136 いま 93 17 言う 485 47 降りる 208 77 違う 151 107 名前 114 137 飲む 93 18 長岡 479 48 円 207 78 行ける 150 108 杭州 113 138 タイトー 92 19 見る 445 49 雪 206 79 車 149 109 高崎 113 139 駅名 92 20 煮干 428 50 越後湯沢 203 80 包丁 148 110 浦佐 112 140 県 92 21 東京 390 51 着く 198 81 食 144 111 移動 111 141 工場 92 22 市 388 52 作る 195 82 遠い 142 112 産業 110 142 最近 92 23 人 369 53 感じ 193 83 地元 142 113 自分 110 143 少し 92 24 乗る 367 54 高速 191 84 有名 142 114 止まる 109 144 高い 91 25 店 362 55 使う 191 85 楽しい 140 115 駅前 106 145 旨い 91 26 今 360 56 好き 189 86 昨日 140 116 太 105 146 久しぶり 90 27 長岡 328 57 燕 187 87 夜 140 117 辺り 105 147 刃物 90 28 美味しい 324 58 近い 185 88 美味い 138 118 スる 103 148 街 89 29 明日 322 59 弥彦線 181 89 予定 138 119 早い 103 149 今回 89 30 時間 317 60 月 180 90 弥彦 136 120 センター 102 150 見える 88 図表 3-5A は語の出現回数、図表 3-5B は語の出現頻度の分布をプロットしたものである13。視覚的にはべき乗分布にしたがっており，一定の出現率の高い語が多く用いられているが，データの構成は出現率の低い語が多く，いわゆるロングテールになっていると推察される。図表 3-5A 出現回数の集計表統計項目値語数(n) 21,146 出現回数の平均 7.80 出現回数の標準偏差 115.93 図表 3-5B 出現回数の記述統計量図表３－４　頻出150語リスト 5 図表 3-4 頻出 150 語リスト順位抽出語出現回数順位抽出語出現回数順位抽出語出現回数順位抽出語出現回数順位抽出語出現回数 1 燕三条 15,340 31 醤油 310 61 無い 179 91 煮る 131 121 ホーム 102 2 新潟 2,836 32 出る 303 62 仕事 175 92 潤 131 122 終わる 102 3 ラーメン 2,537 33 帰る 300 63 上越新幹線 175 93 出来る 129 123 極太 101 4 駅 1,898 34 買う 284 64 多い 172 94 地域 129 124 最高 101 5 行く 1,539 35 スープ 277 65 上越 171 95 大宮 125 125 地場 101 6 系 1,300 36 燕 274 66 入る 170 96 通過 125 126 北陸 100 7 新幹線 927 37 前 274 67 到着 168 97 飯店 125 127 付近 99 8 笑 918 38 行う 259 68 聞く 168 98 本日 125 128 陣 98 9 食べる 906 39 良い 246 69 限定 167 99 油 125 129 金物 96 10 背脂 881 40 バス 242 70 ホテル 165 100 話 125 130 潟 95 11 三条 837 41 知る 229 71 食う 165 101 職人 124 131 乗車 95 12 麺 745 42 カレー 220 72 向かう 162 102 初めて 123 132 年 95 13 思う 732 43 子 213 73 味 162 103 イオン 122 133 分かる 95 14 今日 623 44 次 211 74 背油 156 104 イベント 122 134 ク 94 15 燕 607 45 中華 210 75 電車 154 105 お願い 118 135 東三条 94 16 来る 523 46 近く 209 76 気 153 106 玉ねぎ 116 136 いま 93 17 言う 485 47 降りる 208 77 違う 151 107 名前 114 137 飲む 93 18 長岡 479 48 円 207 78 行ける 150 108 杭州 113 138 タイトー 92 19 見る 445 49 雪 206 79 車 149 109 高崎 113 139 駅名 92 20 煮干 428 50 越後湯沢 203 80 包丁 148 110 浦佐 112 140 県 92 21 東京 390 51 着く 198 81 食 144 111 移動 111 141 工場 92 22 市 388 52 作る 195 82 遠い 142 112 産業 110 142 最近 92 23 人 369 53 感じ 193 83 地元 142 113 自分 110 143 少し 92 24 乗る 367 54 高速 191 84 有名 142 114 止まる 109 144 高い 91 25 店 362 55 使う 191 85 楽しい 140 115 駅前 106 145 旨い 91 26 今 360 56 好き 189 86 昨日 140 116 太 105 146 久しぶり 90 27 長岡 328 57 燕 187 87 夜 140 117 辺り 105 147 刃物 90 28 美味しい 324 58 近い 185 88 美味い 138 118 スる 103 148 街 89 29 明日 322 59 弥彦線 181 89 予定 138 119 早い 103 149 今回 89 30 時間 317 60 月 180 90 弥彦 136 120 センター 102 150 見える 88 図表 3-5A は語の出現回数、図表 3-5B は語の出現頻度の分布をプロットしたものである13。視覚的にはべき乗分布にしたがっており，一定の出現率の高い語が多く用いられているが，データの構成は出現率の低い語が多く，いわゆるロングテールになっていると推察される。図表 3-5A 出現回数の集計表統計項目値語数(n) 21,146 出現回数の平均 7.80 出現回数の標準偏差 115.93 図表 3-5B 出現回数の記述統計量 5 図表 3-4 頻出 150 語リスト順位抽出語出現回数順位抽出語出現回数順位抽出語出現回数順位抽出語出現回数順位抽出語出現回数 1 燕三条 15,340 31 醤油 310 61 無い 179 91 煮る 131 121 ホーム 102 2 新潟 2,836 32 出る 303 62 仕事 175 92 潤 131 122 終わる 102 3 ラーメン 2,537 33 帰る 300 63 上越新幹線 175 93 出来る 129 123 極太 101 4 駅 1,898 34 買う 284 64 多い 172 94 地域 129 124 最高 101 5 行く 1,539 35 スープ 277 65 上越 171 95 大宮 125 125 地場 101 6 系 1,300 36 燕 274 66 入る 170 96 通過 125 126 北陸 100 7 新幹線 927 37 前 274 67 到着 168 97 飯店 125 127 付近 99 8 笑 918 38 行う 259 68 聞く 168 98 本日 125 128 陣 98 9 食べる 906 39 良い 246 69 限定 167 99 油 125 129 金物 96 10 背脂 881 40 バス 242 70 ホテル 165 100 話 125 130 潟 95 11 三条 837 41 知る 229 71 食う 165 101 職人 124 131 乗車 95 12 麺 745 42 カレー 220 72 向かう 162 102 初めて 123 132 年 95 13 思う 732 43 子 213 73 味 162 103 イオン 122 133 分かる 95 14 今日 623 44 次 211 74 背油 156 104 イベント 122 134 ク 94 15 燕 607 45 中華 210 75 電車 154 105 お願い 118 135 東三条 94 16 来る 523 46 近く 209 76 気 153 106 玉ねぎ 116 136 いま 93 17 言う 485 47 降りる 208 77 違う 151 107 名前 114 137 飲む 93 18 長岡 479 48 円 207 78 行ける 150 108 杭州 113 138 タイトー 92 19 見る 445 49 雪 206 79 車 149 109 高崎 113 139 駅名 92 20 煮干 428 50 越後湯沢 203 80 包丁 148 110 浦佐 112 140 県 92 21 東京 390 51 着く 198 81 食 144 111 移動 111 141 工場 92 22 市 388 52 作る 195 82 遠い 142 112 産業 110 142 最近 92 23 人 369 53 感じ 193 83 地元 142 113 自分 110 143 少し 92 24 乗る 367 54 高速 191 84 有名 142 114 止まる 109 144 高い 91 25 店 362 55 使う 191 85 楽しい 140 115 駅前 106 145 旨い 91 26 今 360 56 好き 189 86 昨日 140 116 太 105 146 久しぶり 90 27 長岡 328 57 燕 187 87 夜 140 117 辺り 105 147 刃物 90 28 美味しい 324 58 近い 185 88 美味い 138 118 スる 103 148 街 89 29 明日 322 59 弥彦線 181 89 予定 138 119 早い 103 149 今回 89 30 時間 317 60 月 180 90 弥彦 136 120 センター 102 150 見える 88 図表 3-5A は語の出現回数、図表 3-5B は語の出現頻度の分布をプロットしたものである13。視覚的にはべき乗分布にしたがっており，一定の出現率の高い語が多く用いられているが，データの構成は出現率の低い語が多く，いわゆるロングテールになっていると推察される。図表 3-5A 出現回数の集計表統計項目値語数(n) 21,146 出現回数の平均 7.80 出現回数の標準偏差 115.93 図表 3-5B 出現回数の記述統計量図表３－５Ａ　出現回数の集計表図表３－５Ｂ　出現回数の記述統計量

(6)

共起ネットワーク 　共起ネットワークは、「出現パターンの似通った語、すなわち共起の程度が強い語を線で結んだネットワーク（樋口（2014）、p.157）」である。node（語）間の共起関係はedge（線）で描かれており、可視性の高いグラフである。ただし、ここで用いる共起ネットワークは、node間に距離と方向を持たない「無向共起」であり、語と語の関係を数学で説明できない点に留意が必要である。　ネットワーク図を得るための設定としてKH Coder で、最小出現語数を150、現在の設定で利用できる語の数を90にした。 6 共起ネットワーク共起ネットワークは，「出現パターンの似通った語，すなわち共起の程度が強い語を線で結んだネットワーク(樋口(2014)，p.157)」である。node(語)間の共起関係を edge(線)で描かれており可視性の高いグラフである。ただし，ここで用いる共起ネットワークは，node 間に距離と方向を持たない「無向共起」であり，語と語の関係を数学で説明できない点に留意が必要である。図表 3-6 node―共起関係(edge)情報項目値 node（語） 34 edge（線） 60 density（密度）14 0.107 Min.Jaccard15 0.77 ネットワーク図を得るための設定として KH Coder で，最小出現語数を 150，現在の設定で利用できる語の数を 90 にした。図表 3-7「燕三条」の共起ネットワーク図ララララ醤醤煮煮スラス中中バス高高限限越越越越長長新新新新新燕三三東東長長燕上越燕三三背背三三燕行く食べべ乗べ駅系麺背醤美美しし市燕ニニ子美図表３－６　node―共起関係（edge）情報図表３－７「燕三条」の共起ネットワーク図 6 共起ネットワーク共起ネットワークは，「出現パターンの似通った語，すなわち共起の程度が強い語を線で結んだネットワーク(樋口(2014)，p.157)」である。node(語)間の共起関係を edge(線)で描かれており可視性の高いグラフである。ただし，ここで用いる共起ネットワークは，node 間に距離と方向を持たない「無向共起」であり，語と語の関係を数学で説明できない点に留意が必要である。図表 3-6 node―共起関係(edge)情報項目値 node（語） 34 edge（線） 60 density（密度）14 0.107 Min.Jaccard15 0.77 ネットワーク図を得るための設定として KH Coder で，最小出現語数を 150，現在の設定で利用できる語の数を 90 にした。図表 3-7「燕三条」の共起ネットワーク図ララララ醤醤煮煮スラス中中バス高高限限越越越越長長新新新新新燕三三東東長長燕上越燕三三背背三三燕行く食べべ乗べ駅系麺背醤美美しし市燕ニニ子美

(7)

　図表３－６はネットワーク図の基礎数値の要約、図表３－７は、本解析の基礎となる「共起ネットワーク図」である。図表３－７から、「燕三条」を起点として、「ラーメン」「新潟」「駅」との共起関係がみられる。さらに、「駅」から派生して「新幹線」との関連を示しているが、この共起関係とは離れて「越後湯沢」を中心に「東京」「長岡」「上越」でネットワークを形成している。なお、図表３－４にて出現回数1,300回が確認された「系」については、「駅」「新幹線」など「鉄道」に関連するものなのか、「燕三条系ラーメン」に関連するものなのかが定かではなかったが、共起ネットワーク図を見る限り後者との共起関係が強いものと理解できる。　このほか、「三条燕」を起点とする「高速道路」に関連するネットワークが形成されている。　この結果から、共起ネットワーク分析に限っていえば、「新幹線の駅名」、「高速道路」、「ラーメン」というように大きく３つの共起ネットワークでTweetが構成されている様子がうかがえる。　特に、ラーメンに関連する「node word16_」に関しては、「麺」「背脂」「煮干」「醤油」が「中心性17_」をもちながら強いedgeで結ばれている。 ４．考　察 （阿部　彩奈） 　本研究の所期の目的に立ち返れば、観光経営に資するヒントをSNSから探り出すことにあった。　周知のとおり、「燕三条」は江戸時代から続く金属加工業の集積地であり、日本を代表する産業クラスタを形成している。こうした特徴から、観光活性と親和性が高いと考えられる「産業観光」「クラフト・ツーリズム」「伝統産業」などに関連する「ものづくり」を想起させる語の出現回数が目立って多くない点は、一般的な含意においては想定外の結果であろう。 ４－１　Twitter投稿にうかがう「工場の祭典」の話題 　ここで、改めて近年燕三条地区で行政と民間が連携して力を入れている「工場の祭典」について、本研究で用いたTweetデータを活用して実証的に考量をすすめたい。　実証に際し、node word「工場の祭典」の月次出現回数を説明変数として、月ごとのTweetの偏りをχ2 分布を用いて分析する。　図表４－１にもとづき、図表４－２に基本統計量および検定統計量を整理する。　図表４－２に示すように、月次ごとのTweet数について有意差がみられた（χ2_{（11, N＝85）237.588 , p} ＜.01）。よって、少なくとも「燕三条」をTweetの検索キーワードとして収集され、かつ、個人投稿に限定して抽出されたTweetにおいて、node word「工場の祭典」を含む月次の投稿は月ごとに偏りがあると分析できる。もっとも、図表４－２の基本統計量からあきらかなように、最小値０、中央値1.5の差異に対して、はずれ値ともとれる最大値38が発生していることから、この結果は容易に予測できる。　なによりも、投稿数自体が少ない事実が現状である。殊にTwitterに限れば、SNS利用者層への宣伝告知活 7 図表 3-7 は，本解析の基礎となる「共起ネットワーク図」，図表 3-6 はネットワーク図の基礎数値の要約である。「燕三条」を起点として，「ラーメン」「新潟」「駅」との共起関係がみられる。さらに，「駅」から派生して「新幹線」との関連を示しているが，この共起関係とは離れて「越後湯沢」を中心に「東京」「長岡」「上越」でネットワークを形成している。なお，図表 3-4 にて出現回数 1,300 回が確認された「系」については，「駅」「新幹線」など「鉄道」に関連するものなのか，「燕三条系ラーメン」に関連するものなのかが定かではなかったが，共起ネットワーク図を見る限り後者との共起関係が強いものと理解できる。このほか，「三条燕」を起点とする「高速道路」に関連するネットワークが形成されている。この結果から，共起ネットワーク分析に限っていえば，「新幹線の駅名」，「高速道路」，「ラーメン」というように大きく3つの共起ネットワークでTweetが構成されている様子がうかがえる。特に，ラーメンに関連する「node word16」に関しては，「麺」「背脂」「煮干」「醤油」が「中心性17」をもちながら強い edge で結ばれている。

４．考察

（阿部彩奈）本研究の所期の目的に立ち返れば，観光経営に資するヒントを SNS から探り出すことにあった。周知のとおり，「燕三条」は江戸時代から続く金属加工業の集積地であり，日本を代表する産業クラスタを形成している。こうした特徴から，観光活性と親和性が高いと考えられる「産業観光」「クラフト・ツーリズム」「伝統産業」などに関連する「ものづくり」を想起させる語の出現回数が目立って多くない点は，一般的な仮定においては想定外の結果であろう。 4-1 Twitter 投稿にうかがう「工場の祭典」の話題ここで，改めて近年燕三条地区で行政と民間が連携して力を入れている「工場の祭典」について，本研究で用いた Tweet データを活用して実証的に考量をすすめたい。実証に際し，node word「工場の祭典」の月次出現回数を説明変数として，月ごとの Tweet の偏りを独立性の検定を用いて分析する。図表 4-1 「工場の祭典」月次出現回数月出現回数 9 27 10 38 11 9 12 1 1 0 2 4 3 0 4 2 5 0 6 0 7 1 8 3 合計 85 図表 4-１にもとづき，図表4-2 に基本統計量および検定統計量を整理する。図表 4-2 基本統計量および検定統計量（工場の祭典）基本統計量検定統計量項目値項目値平均値 7.1 χ2 237.588 最大値 38 自由度 11 中央値 1.5 p 値 1.103✕10-44 _** 最小値 0 n.s.: not significant *: p <0.05 **: p <0.01 標準偏差 11.042 図表 4-2 に示すように，月次ごとの Tweet 数についてχ2検定を行った結果，有意差がみられた（χ₂（11, N=85）237.588 , p<.01）。よって，少なくとも「燕三条」を Tweet の検索キーワードとして収集され，かつ，個人投稿に限定して抽出された Tweet において，node word「工場の祭典」を含む月次の投稿は月ごとに偏りがあると分析できる。もっとも，図表 3-14 の基本統計量からあきらかなように，最小値 0，中央値 1.5 の差異に対して，はずれ値ともとれる最大値 38 が発生していることから，この結果は容易に予測できる。なによりも，投稿数自体が少ない事実が厳然たる現図表４－１　「工場の祭典」月次出現回数図表４－２　基本統計量および検定統計量（工場の祭典） 7 図表 3-7 は，本解析の基礎となる「共起ネットワーク図」，図表 3-6 はネットワーク図の基礎数値の要約である。「燕三条」を起点として，「ラーメン」「新潟」「駅」との共起関係がみられる。さらに，「駅」から派生して「新幹線」との関連を示しているが，この共起関係とは離れて「越後湯沢」を中心に「東京」「長岡」「上越」でネットワークを形成している。なお，図表 3-4 にて出現回数 1,300 回が確認された「系」については，「駅」「新幹線」など「鉄道」に関連するものなのか，「燕三条系ラーメン」に関連するものなのかが定かではなかったが，共起ネットワーク図を見る限り後者との共起関係が強いものと理解できる。このほか，「三条燕」を起点とする「高速道路」に関連するネットワークが形成されている。この結果から，共起ネットワーク分析に限っていえば，「新幹線の駅名」，「高速道路」，「ラーメン」というように大きく3つの共起ネットワークでTweetが構成されている様子がうかがえる。特に，ラーメンに関連する「node word16」に関しては，「麺」「背脂」「煮干」「醤油」が「中心性17」をもちながら強い edge で結ばれている。

４．考察

（阿部彩奈）本研究の所期の目的に立ち返れば，観光経営に資するヒントを SNS から探り出すことにあった。周知のとおり，「燕三条」は江戸時代から続く金属加工業の集積地であり，日本を代表する産業クラスタを形成している。こうした特徴から，観光活性と親和性が高いと考えられる「産業観光」「クラフト・ツーリズム」「伝統産業」などに関連する「ものづくり」を想起させる語の出現回数が目立って多くない点は，一般的な仮定においては想定外の結果であろう。 4-1 Twitter 投稿にうかがう「工場の祭典」の話題ここで，改めて近年燕三条地区で行政と民間が連携して力を入れている「工場の祭典」について，本研究で用いた Tweet データを活用して実証的に考量をすすめたい。実証に際し，node word「工場の祭典」の月次出現回数を説明変数として，月ごとの Tweet の偏りを独立性の検定を用いて分析する。図表 4-1 「工場の祭典」月次出現回数月出現回数 9 27 10 38 11 9 12 1 1 0 2 4 3 0 4 2 5 0 6 0 7 1 8 3 合計 85 図表 4-１にもとづき，図表4-2 に基本統計量および検定統計量を整理する。図表 4-2 基本統計量および検定統計量（工場の祭典）基本統計量検定統計量項目値項目値平均値 7.1 χ2 237.588 最大値 38 自由度 11 中央値 1.5 p 値 1.103✕10-44 _** 最小値 0 n.s.: not significant *: p <0.05 **: p <0.01 標準偏差 11.042 図表 4-2 に示すように，月次ごとの Tweet 数についてχ2検定を行った結果，有意差がみられた（χ₂（11, N=85）237.588 , p<.01）。よって，少なくとも「燕三条」を Tweet の検索キーワードとして収集され，かつ，個人投稿に限定して抽出された Tweet において，node word「工場の祭典」を含む月次の投稿は月ごとに偏りがあると分析できる。もっとも，図表 3-14 の基本統計量からあきらかなように，最小値 0，中央値 1.5 の差異に対して，はずれ値ともとれる最大値 38 が発生していることから，この結果は容易に予測できる。なによりも，投稿数自体が少ない事実が厳然たる現

(8)

動が課題として提起される。　工場の祭典は例年10月初旬に開催され、回を重ねるごとに活況を呈し、県央地域・燕三条を代表する行事として定着しつつあるイベントである。　しかし、Twitterの投稿状況から推察する限り、開催前月の９月にわずかな投稿があるものの、開催月の 10月でさえ投稿数が極端に減少していることも事実である。直感的には、開催月を変更するか、季節ごとや月例で「ミニ工場の祭典」を開催して、話題がとぎれないように工夫するなど、改良の余地は十分にあろう。 ４－２　観光資源としての「ラーメン」 　図表４－３、図表４－４で示すように、月ごとの Tweet数について有意差がみられた（χ2_{（11 , N＝} 2,535）71.367 , p＜.01）。　ネットワーク分析において強い共起関係を形成しているとみられる「ラーメン」においても、「工場の祭典」と同様に月ごとのTweetに偏りがみられる。しかも、 10のマイナス11乗という極めて小さい期待確率を示している。この分析結果は、地域資源の発掘という観点からは看過できない。これらのTweetがラーメンを食している時につぶやかれているのか、「燕三条＝ラーメン」のイメージでつぶやかれているのか、本解析のみをもって結論付けることはできない。この点は課題として残る18_。 補　足　　ちなみに、総務省の調査によればSNS利用者層は図表４－５で示すとおりである。FacebookとTwitterともに20代で約50％、30代・40代ともに30％超で50代にいたっても25％近くがSNSを利用している。今後、さらにユビキタスが身近になり、ユニバーサルなICT社会の進展につれ年代を問わず利用者が増加することは衆目の一致するところであろう。　 むすびにかえて （解析：阿部彩奈、文責：筆頭執筆者） 　膨大なTwitter投稿から「燕三条」をキーワードに検索・抽出し、当該投稿にテキスト・マイニングを用いて解析したところが本研究の特徴である。冒頭と２章で述べたように、観光振興による地域活性化が耳目を集める中で、特定の地域をフォーカスしたテキスト・マイニング研究は多くない。こうした観点では、本研究の試みが県央地域の観光資源再発掘に資する施策提言の一助として貢献に結びつけば幸いである。 8 状である。殊に Twitter に限っていえば，SNS 利用者層への宣伝告知活動が課題として提起される。工場の祭典は例年 10 月初旬に開催され，回を重ねるごとに活況を呈し，県央地域・燕三条を代表する行事として定着しつつあるイベントである。しかし，殊にTwitter の投稿状況から推察する限り，開催前月（9 月）にわずかの投稿があるものの開催月の 10 月でさえ投稿数が極端に減少していることも事実である。直感的には，開催月を変更するか，季節ごとや月例で「ミニ工場の祭典」を開催して，話題がとぎれないように工夫するなど，十分に改良の余地はあろう。 4-2 観光資源としての「ラーメン」図表 4-3，図表 4-4 で示すように，月ごとの Tweet 数についてχ2検定を行った結果，有意差がみられた（χ2（11 , N=2,535）71.367 , p<.01）。ネットワーク分析において強い共起関係を形成しているとみられる「ラーメン」においても，「工場の祭典」と同様に月ごとの Tweet に偏りがみられる。しかも，10 のマイナス 11 乗という極めて小さい期待確率を示している。この分析結果は，地域資源の発掘という観点からは看過できない。これらの Tweet がラーメンを食べに行った際につぶやかれているのか，「燕三条＝ラーメン」のイメージでつぶやかれているのか，本解析のみをもって結論付けることはできない。この点は課題として残る18。図表4-3 「ラーメン」月次出現回数月出現回数 9 189 10 209 11 228 12 186 1 196 2 178 3 187 4 176 5 223 6 198 7 286 8 279 合計 2,535 図表4-4 基本統計量および検定統計量（ラーメン）基本統計量検定統計量項目値項目値平均値 211.25 χ2 71.367 最大値 286 自由度 11 中央値 197 p 値 6.683✕10-11 _** 最小値 176 n.s.: not significant *: p <0.05 **: p <0.01 標準偏差 35.447 補足ちなみに，総務省の調査によれば SNS 利用者層は図表 4-5 で示すとおりである。facebook と Twitter ともに 20 代で約 50%，30 代・40 代ともに 30％超で 50 代にいたっても 25%近くが SNS を利用している。今後，さらにユビキタスが身近になり，ユニバーサルな ICT社会の進展につれ年代を問わず利用者が増加することは衆目の一致するところであろう。図表4-5 SNS 利用者層出所：総務省(2015)から筆者作成むすびにかえて（解析：阿部彩奈、文責：筆頭執筆者）膨大な Twitter 投稿から「燕三条」をキーワードに検索・抽出し，当該投稿にテキスト・マイニングを用いて解析したところが本研究の特徴である。冒頭と 2 章で述べたように，観光振興による地域活性化が耳目を集める中で，特定の地域をフォーカスしたテキスト・マイニング研究は多くない。こうした観点では，本研究の試みが県央地域の観光資源再発掘に資する施策提言一助として貢献に結びつけば幸いである。図表４－３　「ラーメン」月次出現回数図表４－４　基本統計量および検定統計量（ラーメン） 8 状である。殊に Twitter に限っていえば，SNS 利用者層への宣伝告知活動が課題として提起される。工場の祭典は例年 10 月初旬に開催され，回を重ねるごとに活況を呈し，県央地域・燕三条を代表する行事として定着しつつあるイベントである。しかし，殊にTwitter の投稿状況から推察する限り，開催前月（9 月）にわずかの投稿があるものの開催月の 10 月でさえ投稿数が極端に減少していることも事実である。直感的には，開催月を変更するか，季節ごとや月例で「ミニ工場の祭典」を開催して，話題がとぎれないように工夫するなど，十分に改良の余地はあろう。 4-2 観光資源としての「ラーメン」図表 4-3，図表 4-4 で示すように，月ごとの Tweet 数についてχ2検定を行った結果，有意差がみられた（χ2（11 , N=2,535）71.367 , p<.01）。ネットワーク分析において強い共起関係を形成しているとみられる「ラーメン」においても，「工場の祭典」と同様に月ごとの Tweet に偏りがみられる。しかも，10 のマイナス 11 乗という極めて小さい期待確率を示している。この分析結果は，地域資源の発掘という観点からは看過できない。これらの Tweet がラーメンを食べに行った際につぶやかれているのか，「燕三条＝ラーメン」のイメージでつぶやかれているのか，本解析のみをもって結論付けることはできない。この点は課題として残る18。図表4-3 「ラーメン」月次出現回数月出現回数 9 189 10 209 11 228 12 186 1 196 2 178 3 187 4 176 5 223 6 198 7 286 8 279 合計 2,535 図表4-4 基本統計量および検定統計量（ラーメン）基本統計量検定統計量項目値項目値平均値 211.25 χ2 71.367 最大値 286 自由度 11 中央値 197 p 値 6.683✕10-11 _** 最小値 176 n.s.: not significant *: p <0.05 **: p <0.01 標準偏差 35.447 補足ちなみに，総務省の調査によれば SNS 利用者層は図表 4-5 で示すとおりである。facebook と Twitter ともに 20 代で約 50%，30 代・40 代ともに 30％超で 50 代にいたっても 25%近くが SNS を利用している。今後，さらにユビキタスが身近になり，ユニバーサルな ICT社会の進展につれ年代を問わず利用者が増加することは衆目の一致するところであろう。図表4-5 SNS 利用者層出所：総務省(2015)から筆者作成むすびにかえて（解析：阿部彩奈、文責：筆頭執筆者）膨大な Twitter 投稿から「燕三条」をキーワードに検索・抽出し，当該投稿にテキスト・マイニングを用いて解析したところが本研究の特徴である。冒頭と 2 章で述べたように，観光振興による地域活性化が耳目を集める中で，特定の地域をフォーカスしたテキスト・マイニング研究は多くない。こうした観点では，本研究の試みが県央地域の観光資源再発掘に資する施策提言一助として貢献に結びつけば幸いである。 8 状である。殊に Twitter に限っていえば，SNS 利用者層への宣伝告知活動が課題として提起される。工場の祭典は例年 10 月初旬に開催され，回を重ねるごとに活況を呈し，県央地域・燕三条を代表する行事として定着しつつあるイベントである。しかし，殊にTwitter の投稿状況から推察する限り，開催前月（9 月）にわずかの投稿があるものの開催月の 10 月でさえ投稿数が極端に減少していることも事実である。直感的には，開催月を変更するか，季節ごとや月例で「ミニ工場の祭典」を開催して，話題がとぎれないように工夫するなど，十分に改良の余地はあろう。 4-2 観光資源としての「ラーメン」図表 4-3，図表 4-4 で示すように，月ごとの Tweet 数についてχ2検定を行った結果，有意差がみられた（χ2（11 , N=2,535）71.367 , p<.01）。ネットワーク分析において強い共起関係を形成しているとみられる「ラーメン」においても，「工場の祭典」と同様に月ごとの Tweet に偏りがみられる。しかも，10 のマイナス 11 乗という極めて小さい期待確率を示している。この分析結果は，地域資源の発掘という観点からは看過できない。これらの Tweet がラーメンを食べに行った際につぶやかれているのか，「燕三条＝ラーメン」のイメージでつぶやかれているのか，本解析のみをもって結論付けることはできない。この点は課題として残る18。図表4-3 「ラーメン」月次出現回数月出現回数 9 189 10 209 11 228 12 186 1 196 2 178 3 187 4 176 5 223 6 198 7 286 8 279 合計 2,535 図表4-4 基本統計量および検定統計量（ラーメン）基本統計量検定統計量項目値項目値平均値 211.25 χ2 71.367 最大値 286 自由度 11 中央値 197 p 値 6.683✕10-11 _** 最小値 176 n.s.: not significant *: p <0.05 **: p <0.01 標準偏差 35.447 補足ちなみに，総務省の調査によれば SNS 利用者層は図表 4-5 で示すとおりである。facebook と Twitter ともに 20 代で約 50%，30 代・40 代ともに 30％超で 50 代にいたっても 25%近くが SNS を利用している。今後，さらにユビキタスが身近になり，ユニバーサルな ICT社会の進展につれ年代を問わず利用者が増加することは衆目の一致するところであろう。図表4-5 SNS 利用者層出所：総務省(2015)から筆者作成むすびにかえて（解析：阿部彩奈、文責：筆頭執筆者）膨大な Twitter 投稿から「燕三条」をキーワードに検索・抽出し，当該投稿にテキスト・マイニングを用いて解析したところが本研究の特徴である。冒頭と 2 章で述べたように，観光振興による地域活性化が耳目を集める中で，特定の地域をフォーカスしたテキスト・マイニング研究は多くない。こうした観点では，本研究の試みが県央地域の観光資源再発掘に資する施策提言一助として貢献に結びつけば幸いである。図表４－５　SNS利用者層出所：総務省（2015a）から筆者作成

SNSを活用した観光経営情報の形態素解析