• 検索結果がありません。

SNSを活用した観光経営情報の形態素解析

N/A
N/A
Protected

Academic year: 2021

シェア "SNSを活用した観光経営情報の形態素解析"

Copied!
13
0
0

読み込み中.... (全文を見る)

全文

(1)

SNSを活用した観光経営情報の形態素解析

キーワード:ソーシャルネットワーク,SNS,マイニング,観光,経営 新潟経営大学 特任教授

 藪下 保弘 

新潟経営大学 助手

 落合  純 

経営情報学部 3年

 阿部 彩奈 

はじめに 2.研究の背景と先行研究 3.キーワード「燕三条」の評価分析  3-1 方法と手続き  3-2 結 果 4.考 察  4-1 Twitter投稿にうかがう「工場の祭典」の話題  4-2 観光資源としての「ラーメン」 むすびにかえて はじめに  インターネットに介在する情報は、膨大かつ瞬時性、 多様性に富んでいるため、社会動向の調査目的に有用 な情報源になりうる。  近時、ソーシャル・ネットワーキング・サービス (SNS)の急速な普及と並行して自然言語処理技術が 進展している。今後も、未知の可能性を内包するSNS 情報には、より高い期待が集まろう。  ところが、当該サービスのうち幅広く多くのユー ザーを有するTwitterTM1から得られる情報は、テキス ト・データであり、情報として構造化されていないと ころが難点である。つまり、秩序だったデータ群から 一定の法則をもって回帰式を導出し、「過去の事象か ら未来を予測する」という伝統的な統計学の技法がダ イレクトに適応しないのである。  しかし、昨今では「デジタル・マーケティング」の 名のもとでさまざまな方法により抽出、整理、分析す る手法が開発されている。このうち、「テキスト・マ イニング(超高速文字検索処理)」は、この解析技術 の 筆 頭 に あ げ ら れ る 技 法 で あ る。 本 研 究 で は、 Twitterの投稿文を言葉の最小単位である品詞に分解 して解析する「形態素分析」を用いた。  また、自然言語には同じ意味や内容の記述の際に、 多様多彩な表現が存在することに加え、とりわけ Twitterの場合には投稿文中のハッシュタグ(#)や URLの除去をはじめ、半角全角文字の正規化など、 同サービスに独自の前処理が必要となる。  本研究では、こうした条件を一つひとつクリアしな がら、目視による主観を排除するために前処理プログ ラムを組んで対処するなど、随時制約条件を確認しな がら進めた。よって、本研究は最新の技法を駆使して おらず、SNS情報から観光および経営に資する情報を 得るための実証的手法(empirical approach)の試行 研究の範囲にとどまる。  なお、研究の背景やキーワード選択に至る経緯など については、2章に詳細を譲る。

(2)

2.研究の背景と先行研究 (落合  純)  2000年代以降、わが国では一般家庭においてイン ターネットが急速に普及した。総務省によれば、わが 国におけるインターネットの人口普及率は、平成25年 末時点で82.8%に達している(総務省、2015b)。大多 数の国民が多様な情報を取得・発信できるようになっ た現在、著名人や専門家ではなく、一般ユーザーが発 信する情報を企業活動に積極的に活用しようという動 きが盛んに行われている。一般ユーザーが発信する情 報というものは、いわば消費者の「生の声」であるた め、それを分析することは、製品やサービスの改善点、 新たな顧客獲得や市場開拓に関するヒントといった、 企業の発展に必要な材料の獲得につながるのである。  こうした動きは、製造業や飲食産業などの特定の業 種にとってだけでなく、観光業にとっても意味がある と考えられる。観光業は、わが国の成長戦略の1つと 位置づけられており、「訪日外国人旅行者数を平成32 年初めまでに2,500万人とすることを念頭に、平成28 年までに1,800万人にする」といった目標が新たに掲 げられるなど、今後ますますの活性化が期待される産 業分野である(観光庁、2015)。こうした現状において、 観光客がウェブ上でどのような発言をしているのか調 査分析を行い、その国・土地が彼らにとってどういう 所だったのかを明らかにすることは、観光立国を目指 すわが国にとって貴重な情報を提供してくれるものと 考えられる。事実、観光庁によれば、訪日外国人の出 発前の旅行情報源は個人のブログ(Weblog)が24.1% と最も多い回答であった(観光庁、2014)。また、沖 縄県観光における情報通信技術の利活用の可能性を調 べた調査では、国内外の観光客の5割近くがブログや 口コミサイトなどの情報に基づき観光地や店舗等に来 訪していることが報告されており(南西地域産業活性 化センター、2013)、ウェブを通じて個人が発信する 情報が持つ観光地への誘引力は大きいといえる。  こうしたアンケート調査に加え、観光に関連する ウェブ上の発言に焦点を当てた研究もいくつか行われ ている。そこでは主に「テキスト・マイニング」と呼 ばれる分析手法を用いている。「テキスト・マイニング」 とは、テキスト・データを分析する方法で、コンピュー タによってデータの中から自動的に言葉を取出し、 様々な統計的手法を用いて探索的な分析を行い、それ によりパターンやルール、知識の発見を目指すもので ある(樋口、2014)。  たとえば,Wenger(2008)は外国のブロガーがオー ストリア観光をどのように発信しているか、114のブ ログを収集し、分析した。その結果、概ねポジティブ な評価であり、いずれも類似した特徴・内容であった ことを報告している。  国内では、三田村・岩佐・湯川・大堀(2008)は、 国内のさまざまなブログを収集し、それらの中に観光 に関するキーワードがどの程度出現するかを調査し た。その結果、温泉や銭湯に関するキーワードが多く 出現する傾向が判明した。また、「流氷」や「ジンギ スカン」といった北海道に特有のキーワードも出現す る傾向も確認され、国内旅行者がどのようなものごと に興味を持って観光を行っているのかを明らかにして いる。  村上・川村(2011)は、2000年から2011年にかけて アップロードされた日本旅行に関する120の海外ブロ グの記事を対象に、海外から日本(東京・北海道・石 川)がどう見られているのかについて調査分析を行っ た。その結果、“love”“enjoy”“beautiful”などのポ ジティブな単語が比較的多く抽出され、いずれの地域 においても海外ブロガーから肯定的な印象を持たれて いたことが判明した。次いで、著者らが収集した記事 すべてに目を通して印象判断を行った。その結果、東 京では長期旅行者が多い印象、北海道は食や雪のイベ ントを楽しんだ心地よい旅がなされた印象、石川は兼 六園や陶芸など日本の文化や歴史、情緒的なものを楽 しんだという印象と、地域によって異なる特徴があっ たことを報告している。  加藤(2013)は、有名な観光都市であるモナコ公国 に対し、日本のブロガーがどのような点に関心を持っ ているのか分析した。その結果、食事や家族と過ごす 時間、穏やかな天候に魅力を感じていることが示され た。また、モナコに心理的癒しを求めていることなど も明らかになった。

(3)

 このように、観光に関するブログの解析した研究は 国内外において行われており、知見が蓄積しつつある。 しかしながら、今や情報発信のためのプラットフォー ムはブログだけではない。他にも、ホームページ(HP) や掲示板(BBS)など異なるプラットフォームが存在 している。近年では、スマートフォンのような携帯型 情報端末の急速な普及に伴い、Twitterに代表される マイクロブログによる情報発信が盛んに行われてきて いる。Twitterは、HPやブログとは異なり、発信者が ほぼリアルタイムで情報を発信できるという特徴があ る。言い換えれば、Twitterの発言は、発信者がその 時に感じたことやその時に示した興味関心であると考 えることができる。ゆえに、Twitterでの特定のキー ワードを含んだ発言の分析は、観光業に限らず多くの 分野において貴重な情報をもたらすものと考えられ る。事実、すでにTwitterを対象にしたテキスト・マ イニング研究がいくつか報告されている。

 たとえば、Park, Ok, & Chae(2015)は、クルージ ング旅行に関するTwitter上の発言を分析している。 その結果、感情や産業、目的地や旅行に関連する単語 だけでなく、有名人やプロのブロガー、船旅会社、旅 行代理店なども比較的高い頻度で話題に上がっている ことが分かった。  一方、わが国では、石井(2012)がTwitter上のメッ セージによる複数の国のイメージ測定を行っている。 その結果、好感度が最も低いのが中国で、次いでアメ リカ、ロシア、韓国といった国が低かった。また、メッ セージ内容を複数のカテゴリに分けて分析した結果、 韓国に関して国民性や道徳に関するメッセージがきわ めて多いことが判明した。さらに、国名と結びつきの 強い単語を分析したところ、台湾・韓国・ドイツとは 時事ニュースに関連する単語(義捐金、竹島、原発な ど)が結びついており、一方で中国やインド、イタリ アなどとは有名な食べ物(烏龍茶、カレー、パスタな ど)が強く結びついている傾向が示された。  先述のように、Twitterの発言には価値ある情報が 含まれていると考えられるが、比較的最近になって普 及してきたサービスということもあり、国内外でこれ を利用した研究の数はあまり多くない。また、最近で は観光による地方活性化にも注目が集まっているが、 特定の地方・地域に焦点を当てたテキスト・マイニン グ研究はほとんどない。そこで、本研究では、新潟県 の「燕三条」地域をキーワードとしてTwitter上の発 言を収集・分析し、地方観光に関する新たな知見を提 供すべく調査を行った。なお、キーワードの選定理由 については、国だけでなく、新潟県も平成25年より「新 潟県観光立県推進計画」を推進していくという現状や 「燕三条」地域が世界レベルの高い水準をもつ金属加 工技術などを備えていること、「燕三条」という単語 が本地域に特有のものであることなどを総合的に勘案 してキーワードとして選定した。 3.キーワード「燕三条」の評価分析 3-1方法と手続き (阿部 彩奈) 収集方法  Twitterの公式Webサイトから、本実証の基礎とな る語「燕三条」をキーワードとしてTwitter投稿(以下、 「Tweet」)を収集した。収集期間は、2014年9月1日 から2015年8月31日(1年間)である。収集に際して は、ブラウザに表示される全Tweetをコピーし2、解 析に不要な用語、文字列を自作「解析前処理プログラ ム3」にて一括削除した。テキスト・マイニングには「KH Coder4」を用いた。  図表3-1は解析前の処理条件である。  テキスト・マイニングに際し、Twitterは個人の感 3 このように,観光に関するブログの解析した研究は 国内外において行われており,知見が蓄積しつつある。 しかしながら,今や情報発信のためのプラットフォー ムはブログだけではない。他にも,ホームページ(HP) や掲示板(BBS)など異なるプラットフォームが存在 している。近年では,スマートフォンのような携帯型 情報端末の急速な普及に伴い,Twitter に代表される マイクロブログによる情報発信が盛んに行われてきて いる。Twitter は,HPやブログとは異なり,発信者 がほぼリアルタイムで情報を発信できるという特徴が ある。言い換えれば,Twitter の発言は,発信者がそ の時に感じたことやその時に示した興味関心であると 考えることができる。ゆえに,Twitter での特定のキ ーワードを含んだ発言の分析は,観光業に限らず多く の分野において貴重な情報をもたらすものと考えられ る。事実,すでに Twitter を対象にしたテキスト・マ イニング研究がいくつか報告されている。

たとえば,Park, Ok, & Chae(2015)は,クルージ ング旅行に関する Twitter 上の発言を分析している。 その結果,感情や産業,目的地や旅行に関連する単語 だけでなく,有名人やプロのブロガー,船旅会社,旅 行代理店なども比較的高い頻度で話題に上がっている ことが分かった。 一方,わが国では,石井(2012)が Twitter 上のメ ッセージによる複数の国のイメージ測定を行っている。 その結果,好感度が最も低いのが中国で,次いでアメ リカ,ロシア,韓国といった国が低かった。また,メ ッセージ内容を複数のカテゴリに分けて分析した結果, 韓国に関して国民性や道徳に関するメッセージがきわ めて多いことが判明した。さらに,国名と結びつきの 強い単語を分析したところ,台湾・韓国・ドイツとは 時事ニュースに関連する単語(義捐金,竹島,原発な ど)が結びついており,一方で中国やインド,イタリ アなどとは有名な食べ物(烏龍茶,カレー,パスタな ど)が強く結びついている傾向が示された。 先述のように,Twitter の発言には価値ある情報が 含まれていると考えられるが,比較的最近になって普 及してきたサービスということもあり,国内外でこれ を利用した研究の数はあまり多くない。また,最近で は観光による地方活性化にも注目が集まっているが, 特定の地方・地域に焦点を当てたテキスト・マイニン グ研究はほとんどない。そこで,本研究では,新潟県 の「燕三条」地域をキーワードとして Twitter 上の発 言を収集・分析し,地方観光に関する新たな知見を提 供すべく調査を行った。なお,キーワードの選定理由 については,国だけでなく,新潟県も平成 25 年より 「新潟県観光立件推進計画」を推進していくという現 状や「燕三条」地域が世界レベルの高い水準をもつ金 属加工技術などを備えていること,「燕三条」という単 語が本地域に特有のものであることなどを総合的に勘 案してキーワードとして選定した。

3.

キーワード「燕三条」の評価分析

3-1

方法と手続き

(阿部彩奈) 収集方法 Twitterの公式 Web サイトから,本実証の基礎とな る語「燕三条」をキーワードとして Twitter 投稿(以 下,「Tweet」)を収集した。収集期間は,2014 年 9 月 1日から 2015 年 8 月 31 日(1年間)である。収集に 際しては,ブラウザに表示される全 Tweet をコピーし 2,解析に不要な用語,文字列を自作「解析前処理プロ グラム3」にて一括削除した。テキスト・マイニングに は「KHCoder4」を用いた。 図表 3-1 は解析前の処理条件である。 図表 3-1 解析前の処理条件 条件 処理 除外Tweet (1)重複Tweet (2)リツィート (3)広告 (4)自動で Tweet されるもの(いわゆる 「bot」) (5)別サービスやアプリから投稿された Tweet(例えば、「ブログからの自動 Tweet」「Instagram5」「Foursquare6」

「Swarm7」など)

数字正規化 全角数字は、半角数字に強制置換 Tweet区切り 文字列処理による8

解析に際し,Tweet は個人の感情や自己表現を発信

(4)

情や自己表現を発信するSNSサービスであるとの観点 から、図表3-1の仕様にもとづき、解析前処理プロ グラムを通した後に、最終的にはプログラムで処理し きれないTweetを目視および手作業により除外した9  この結果、全検索Tweet40,991件のうち、純粋に個 人が発したと思われるTweet14,592件を解析対象とし て抽出した。  形態素解析は、文を最小単位にして分析できる形に し、複数の品詞で構成される固有名詞が品詞単位に分 解される場合を回避する必要がある。たとえば、「経 営大学」のように「経営」「大学」で1つの語になる 場合である。補足として、KH Coderは「茶筌10」を 形態素解析システムに採用しており、品詞体系は図表 3-2に示すとおり、相当に細かい仕様になっている。  具体的な対処として、イベント名「工場の祭典」、 新幹線駅名「燕三条」、高速道路IC名「三条燕」を複 数の品詞に分解しないようにKH Coderの機能で設定 した。さらに、「背」「脂」と「背」「油」が連続して いる場合は強制的にそれぞれ「背脂」「背油」となる ように設定した11 3-2結果 基礎データ  KHCoderのファイルチェックの結果、文字化けを 含む行が31行、望ましくない半角記号が含まれている 行が5,169行ある。  これらは、顔文字やUnicodeなどの文字コードに起 因するエラーだと考えられる。本分析においては、当 該エラーを無条件に削除してもさしあたり問題はない と考えられるため、KH Coderの機能で自動修正し「前 処理12」を実行した。    前処理後の語と文および段落の数は、図表3-3で 示すとおりであるが、抽出後のTweet14,592件と段落 数14,978件がほぼ一致している点に着目したい。両者 の差異が小さい理由は、解析前の条件処理によりハイ パーリンクや画像のみのデータを予め除去した効果だ と思われる。  図表3-4「頻出語上位150語」から、基礎となる 語「燕三条」は全Tweetに含まれているため除外して 観察すると、「新潟」「ラーメン」「駅」「行く」「系」が、 際立って頻出している様子が読み取れる。前節で示し た、形態素分析の品詞の分解という特性に起因して、 たとえば「系」という語は単独で用いられるケースが 少なく、「新幹線」の系統として用いられているのか「燕 三条系ラーメン」として用いられているのかここでは 判別できない。  よって、別途Tweetを確認し修正しながら解析を進 める必要がある。 4 する SNS サービスであるとの観点から,以下の制約 条件で解析前処理プログラムを通した後に,最終的に は目視により制約条件に合致するTweetを除外した9。 この結果,全検索 Tweet40,991 件のうち,純粋に個 人が発したと思われる Tweet14,592 件を解析対象と して抽出した。 図表 3-2 KHCoder の品詞体系 品詞 茶筌出力の品詞名 名詞 名詞―般(漢字を含む 2 文字以上の 語) 名詞B (平仮名のみの語) 名詞C (漢字1 文字の語) サ変名詞 名詞―サ変接続 形容動詞 名詞―形容動詞語幹 固有名詞 名詞―固有名詞一般 組織名 名詞―固有名詞―組織 人名 名詞―固有名詞―人名 地名 名詞―固有名詞―地域 ナイ形容 名詞―ナイ形容詞語幹 副詞可能 名詞―副詞可能 未知語 未知語 感動詞 感動詞またはフィラー タグ タグ 動詞 動詞―自立(漢字を含む語) 動詞B 動詞―自立(平仮名のみの語) 形容詞 形容詞(漢字を含む語) 形容詞B 形容詞(平仮名のみの語) 副詞 副詞(漢字を含む語) 副詞B 副詞(平仮名のみの語) 否定助動詞 助動詞「ない」「まい」「ぬ」「ん」 形容詞(非自立) 形容詞―非自立(「がたい」「つらい」 「にくい」等) その他 上記以外のもの 形態素解析は,文を最小単位にして分析できる形に し,複数の品詞で構成される固有名詞が品詞単位に分 解される場合を回避する必要がある。たとえば,「経営 大学」のように「経営」「大学」で 1 つの語になる場 合である。補足として,KHCoder は「茶筌10」を形態 素解析システムに採用しており,品詞体系は図表 3-2 に示すとおり,相当に細かい仕様になっている。 具体的な対処として,イベント名「工場の祭典」, 新幹線駅名「燕三条」,高速道路 IC 名「三条燕」を複 数の品詞に分解しないように KHCoder で設定した。 さらに,「背」「脂」と「背」「油」が連続している場合 は強制的にそれぞれ「背脂」「背油」となるように設定 した11。

3-2

結果

基礎データ KHCoderのファイルチェックの結果,文字化けを 含む行が 31 行,望ましくない半角記号が含まれてい る行が 5,169 行ある。 これらは,顔文字や Unicode などの文字コードに起 因するエラーだと考えられる。本分析においては,当 該エラーを無条件に削除してもさしあたり問題はない と考えられるため,KH Coder 機能で自動修正し「前 処理12」を実行した。 図表 3-3 前処理後の結果 項目 数値 総抽出語数 (使用) 385,179 (167,183) 異なり語数 (使用) 23,534 (21,109) 文 23,359 段落 14,978 前処理後の語と文および段落の数は,図表 3-3 で示 すとおりであるが,抽出後の Tweet14,592 件と段落数 14,978件がほぼ一致している点に着目したい。両者の 差異が小さい理由は,解析前の条件処理によりハイパ ーリンクや画像のみのデータを予め除去した効果だと 思われる。 図表 3-4「頻出語上位 150 語」から,基礎となる語 「燕三条」は全 Tweet に含まれているため除外して観 察すると,「新潟」「ラーメン」「駅」「行く」「系」が, 際立って頻出している様子が読み取れる。前節で示し た,品詞の分解という特性からたとえば,「系」という 語は単独で用いられるケースが少なく,「新幹線」の系 統として用いられているのか「燕三条系ラーメン」と して用いられているのかここでは分からない。 したがって,別途 Tweet を確認し修正しながら解析 を進める必要があろう。 4 する SNS サービスであるとの観点から,以下の制約 条件で解析前処理プログラムを通した後に,最終的に は目視により制約条件に合致するTweetを除外した9。 この結果,全検索 Tweet40,991 件のうち,純粋に個 人が発したと思われる Tweet14,592 件を解析対象と して抽出した。 図表 3-2 KHCoder の品詞体系 品詞 茶筌出力の品詞名 名詞 名詞―般(漢字を含む 2 文字以上の 語) 名詞B (平仮名のみの語) 名詞C (漢字1 文字の語) サ変名詞 名詞―サ変接続 形容動詞 名詞―形容動詞語幹 固有名詞 名詞―固有名詞一般 組織名 名詞―固有名詞―組織 人名 名詞―固有名詞―人名 地名 名詞―固有名詞―地域 ナイ形容 名詞―ナイ形容詞語幹 副詞可能 名詞―副詞可能 未知語 未知語 感動詞 感動詞またはフィラー タグ タグ 動詞 動詞―自立(漢字を含む語) 動詞B 動詞―自立(平仮名のみの語) 形容詞 形容詞(漢字を含む語) 形容詞B 形容詞(平仮名のみの語) 副詞 副詞(漢字を含む語) 副詞B 副詞(平仮名のみの語) 否定助動詞 助動詞「ない」「まい」「ぬ」「ん」 形容詞(非自立) 形容詞―非自立(「がたい」「つらい」 「にくい」等) その他 上記以外のもの 形態素解析は,文を最小単位にして分析できる形に し,複数の品詞で構成される固有名詞が品詞単位に分 解される場合を回避する必要がある。たとえば,「経営 大学」のように「経営」「大学」で 1 つの語になる場 合である。補足として,KHCoder は「茶筌10」を形態 素解析システムに採用しており,品詞体系は図表 3-2 に示すとおり,相当に細かい仕様になっている。 具体的な対処として,イベント名「工場の祭典」, 新幹線駅名「燕三条」,高速道路 IC 名「三条燕」を複 数の品詞に分解しないように KHCoder で設定した。 さらに,「背」「脂」と「背」「油」が連続している場合 は強制的にそれぞれ「背脂」「背油」となるように設定 した11。

3-2

結果

基礎データ KHCoderのファイルチェックの結果,文字化けを 含む行が 31 行,望ましくない半角記号が含まれてい る行が 5,169 行ある。 これらは,顔文字や Unicode などの文字コードに起 因するエラーだと考えられる。本分析においては,当 該エラーを無条件に削除してもさしあたり問題はない と考えられるため,KH Coder 機能で自動修正し「前 処理12」を実行した。 図表 3-3 前処理後の結果 項目 数値 総抽出語数 (使用) 385,179 (167,183) 異なり語数 (使用) 23,534 (21,109) 文 23,359 段落 14,978 前処理後の語と文および段落の数は,図表 3-3 で示 すとおりであるが,抽出後の Tweet14,592 件と段落数 14,978件がほぼ一致している点に着目したい。両者の 差異が小さい理由は,解析前の条件処理によりハイパ ーリンクや画像のみのデータを予め除去した効果だと 思われる。 図表 3-4「頻出語上位 150 語」から,基礎となる語 「燕三条」は全 Tweet に含まれているため除外して観 察すると,「新潟」「ラーメン」「駅」「行く」「系」が, 際立って頻出している様子が読み取れる。前節で示し た,品詞の分解という特性からたとえば,「系」という 語は単独で用いられるケースが少なく,「新幹線」の系 統として用いられているのか「燕三条系ラーメン」と して用いられているのかここでは分からない。 したがって,別途 Tweet を確認し修正しながら解析 を進める必要があろう。 図表3-2 KH Coderの品詞体系 図表3-3 前処理後の結果 5 図表 3-4 頻出 150 語リスト 順位 抽出語 出現回数 順位 抽出語 出現回数 順位 抽出語 出現回数 順位 抽出語 出現回数 順位 抽出語 出現回数 1 燕三条 15,340 31 醤油 310 61 無い 179 91 煮る 131 121 ホーム 102 2 新潟 2,836 32 出る 303 62 仕事 175 92 潤 131 122 終わる 102 3 ラーメン 2,537 33 帰る 300 63 上越新幹線 175 93 出来る 129 123 極太 101 4 駅 1,898 34 買う 284 64 多い 172 94 地域 129 124 最高 101 5 行く 1,539 35 スープ 277 65 上越 171 95 大宮 125 125 地場 101 6 系 1,300 36 燕 274 66 入る 170 96 通過 125 126 北陸 100 7 新幹線 927 37 前 274 67 到着 168 97 飯店 125 127 付近 99 8 笑 918 38 行う 259 68 聞く 168 98 本日 125 128 陣 98 9 食べる 906 39 良い 246 69 限定 167 99 油 125 129 金物 96 10 背脂 881 40 バス 242 70 ホテル 165 100 話 125 130 潟 95 11 三条 837 41 知る 229 71 食う 165 101 職人 124 131 乗車 95 12 麺 745 42 カレー 220 72 向かう 162 102 初めて 123 132 年 95 13 思う 732 43 子 213 73 味 162 103 イオン 122 133 分かる 95 14 今日 623 44 次 211 74 背油 156 104 イベント 122 134 ク 94 15 燕 607 45 中華 210 75 電車 154 105 お願い 118 135 東三条 94 16 来る 523 46 近く 209 76 気 153 106 玉ねぎ 116 136 いま 93 17 言う 485 47 降りる 208 77 違う 151 107 名前 114 137 飲む 93 18 長岡 479 48 円 207 78 行ける 150 108 杭州 113 138 タイトー 92 19 見る 445 49 雪 206 79 車 149 109 高崎 113 139 駅名 92 20 煮干 428 50 越後湯沢 203 80 包丁 148 110 浦佐 112 140 県 92 21 東京 390 51 着く 198 81 食 144 111 移動 111 141 工場 92 22 市 388 52 作る 195 82 遠い 142 112 産業 110 142 最近 92 23 人 369 53 感じ 193 83 地元 142 113 自分 110 143 少し 92 24 乗る 367 54 高速 191 84 有名 142 114 止まる 109 144 高い 91 25 店 362 55 使う 191 85 楽しい 140 115 駅前 106 145 旨い 91 26 今 360 56 好き 189 86 昨日 140 116 太 105 146 久しぶり 90 27 長岡 328 57 燕 187 87 夜 140 117 辺り 105 147 刃物 90 28 美味しい 324 58 近い 185 88 美味い 138 118 スる 103 148 街 89 29 明日 322 59 弥彦線 181 89 予定 138 119 早い 103 149 今回 89 30 時間 317 60 月 180 90 弥彦 136 120 センター 102 150 見える 88 図表 3-5A は語の出現回数、図表 3-5B は語の出現頻 度の分布をプロットしたものである13。視覚的にはべ き乗分布にしたがっており,一定の出現率の高い語が 多く用いられているが,データの構成は出現率の低い 語が多く,いわゆるロングテールになっていると推察 される。 図表 3-5A 出現回数の集計表 統計項目 値 語数(n) 21,146 出現回数の平均 7.80 出現回数の標準偏差 115.93 図表 3-5B 出現回数の記述統計量

(5)

 図表3-5Aは語の出現回数、図表3-5Bは語の 出現頻度の分布をプロットしたものである13。視覚的 には、べき分布にしたがっており、一部の出現率の高 い語に出現率が偏り、いわゆるロングテールになって いると推察される。 5 図表 3-4 頻出 150 語リスト 順位 抽出語 出現回数 順位 抽出語 出現回数 順位 抽出語 出現回数 順位 抽出語 出現回数 順位 抽出語 出現回数 1 燕三条 15,340 31 醤油 310 61 無い 179 91 煮る 131 121 ホーム 102 2 新潟 2,836 32 出る 303 62 仕事 175 92 潤 131 122 終わる 102 3 ラーメン 2,537 33 帰る 300 63 上越新幹線 175 93 出来る 129 123 極太 101 4 駅 1,898 34 買う 284 64 多い 172 94 地域 129 124 最高 101 5 行く 1,539 35 スープ 277 65 上越 171 95 大宮 125 125 地場 101 6 系 1,300 36 燕 274 66 入る 170 96 通過 125 126 北陸 100 7 新幹線 927 37 前 274 67 到着 168 97 飯店 125 127 付近 99 8 笑 918 38 行う 259 68 聞く 168 98 本日 125 128 陣 98 9 食べる 906 39 良い 246 69 限定 167 99 油 125 129 金物 96 10 背脂 881 40 バス 242 70 ホテル 165 100 話 125 130 潟 95 11 三条 837 41 知る 229 71 食う 165 101 職人 124 131 乗車 95 12 麺 745 42 カレー 220 72 向かう 162 102 初めて 123 132 年 95 13 思う 732 43 子 213 73 味 162 103 イオン 122 133 分かる 95 14 今日 623 44 次 211 74 背油 156 104 イベント 122 134 ク 94 15 燕 607 45 中華 210 75 電車 154 105 お願い 118 135 東三条 94 16 来る 523 46 近く 209 76 気 153 106 玉ねぎ 116 136 いま 93 17 言う 485 47 降りる 208 77 違う 151 107 名前 114 137 飲む 93 18 長岡 479 48 円 207 78 行ける 150 108 杭州 113 138 タイトー 92 19 見る 445 49 雪 206 79 車 149 109 高崎 113 139 駅名 92 20 煮干 428 50 越後湯沢 203 80 包丁 148 110 浦佐 112 140 県 92 21 東京 390 51 着く 198 81 食 144 111 移動 111 141 工場 92 22 市 388 52 作る 195 82 遠い 142 112 産業 110 142 最近 92 23 人 369 53 感じ 193 83 地元 142 113 自分 110 143 少し 92 24 乗る 367 54 高速 191 84 有名 142 114 止まる 109 144 高い 91 25 店 362 55 使う 191 85 楽しい 140 115 駅前 106 145 旨い 91 26 今 360 56 好き 189 86 昨日 140 116 太 105 146 久しぶり 90 27 長岡 328 57 燕 187 87 夜 140 117 辺り 105 147 刃物 90 28 美味しい 324 58 近い 185 88 美味い 138 118 スる 103 148 街 89 29 明日 322 59 弥彦線 181 89 予定 138 119 早い 103 149 今回 89 30 時間 317 60 月 180 90 弥彦 136 120 センター 102 150 見える 88 図表 3-5A は語の出現回数、図表 3-5B は語の出現頻 度の分布をプロットしたものである13。視覚的にはべ き乗分布にしたがっており,一定の出現率の高い語が 多く用いられているが,データの構成は出現率の低い 語が多く,いわゆるロングテールになっていると推察 される。 図表 3-5A 出現回数の集計表 統計項目 値 語数(n) 21,146 出現回数の平均 7.80 出現回数の標準偏差 115.93 図表 3-5B 出現回数の記述統計量 図表3-4 頻出150語リスト 5 図表 3-4 頻出 150 語リスト 順位 抽出語 出現回数 順位 抽出語 出現回数 順位 抽出語 出現回数 順位 抽出語 出現回数 順位 抽出語 出現回数 1 燕三条 15,340 31 醤油 310 61 無い 179 91 煮る 131 121 ホーム 102 2 新潟 2,836 32 出る 303 62 仕事 175 92 潤 131 122 終わる 102 3 ラーメン 2,537 33 帰る 300 63 上越新幹線 175 93 出来る 129 123 極太 101 4 駅 1,898 34 買う 284 64 多い 172 94 地域 129 124 最高 101 5 行く 1,539 35 スープ 277 65 上越 171 95 大宮 125 125 地場 101 6 系 1,300 36 燕 274 66 入る 170 96 通過 125 126 北陸 100 7 新幹線 927 37 前 274 67 到着 168 97 飯店 125 127 付近 99 8 笑 918 38 行う 259 68 聞く 168 98 本日 125 128 陣 98 9 食べる 906 39 良い 246 69 限定 167 99 油 125 129 金物 96 10 背脂 881 40 バス 242 70 ホテル 165 100 話 125 130 潟 95 11 三条 837 41 知る 229 71 食う 165 101 職人 124 131 乗車 95 12 麺 745 42 カレー 220 72 向かう 162 102 初めて 123 132 年 95 13 思う 732 43 子 213 73 味 162 103 イオン 122 133 分かる 95 14 今日 623 44 次 211 74 背油 156 104 イベント 122 134 ク 94 15 燕 607 45 中華 210 75 電車 154 105 お願い 118 135 東三条 94 16 来る 523 46 近く 209 76 気 153 106 玉ねぎ 116 136 いま 93 17 言う 485 47 降りる 208 77 違う 151 107 名前 114 137 飲む 93 18 長岡 479 48 円 207 78 行ける 150 108 杭州 113 138 タイトー 92 19 見る 445 49 雪 206 79 車 149 109 高崎 113 139 駅名 92 20 煮干 428 50 越後湯沢 203 80 包丁 148 110 浦佐 112 140 県 92 21 東京 390 51 着く 198 81 食 144 111 移動 111 141 工場 92 22 市 388 52 作る 195 82 遠い 142 112 産業 110 142 最近 92 23 人 369 53 感じ 193 83 地元 142 113 自分 110 143 少し 92 24 乗る 367 54 高速 191 84 有名 142 114 止まる 109 144 高い 91 25 店 362 55 使う 191 85 楽しい 140 115 駅前 106 145 旨い 91 26 今 360 56 好き 189 86 昨日 140 116 太 105 146 久しぶり 90 27 長岡 328 57 燕 187 87 夜 140 117 辺り 105 147 刃物 90 28 美味しい 324 58 近い 185 88 美味い 138 118 スる 103 148 街 89 29 明日 322 59 弥彦線 181 89 予定 138 119 早い 103 149 今回 89 30 時間 317 60 月 180 90 弥彦 136 120 センター 102 150 見える 88 図表 3-5A は語の出現回数、図表 3-5B は語の出現頻 度の分布をプロットしたものである13。視覚的にはべ き乗分布にしたがっており,一定の出現率の高い語が 多く用いられているが,データの構成は出現率の低い 語が多く,いわゆるロングテールになっていると推察 される。 図表 3-5A 出現回数の集計表 統計項目 値 語数(n) 21,146 出現回数の平均 7.80 出現回数の標準偏差 115.93 図表 3-5B 出現回数の記述統計量 5 図表 3-4 頻出 150 語リスト 順位 抽出語 出現回数 順位 抽出語 出現回数 順位 抽出語 出現回数 順位 抽出語 出現回数 順位 抽出語 出現回数 1 燕三条 15,340 31 醤油 310 61 無い 179 91 煮る 131 121 ホーム 102 2 新潟 2,836 32 出る 303 62 仕事 175 92 潤 131 122 終わる 102 3 ラーメン 2,537 33 帰る 300 63 上越新幹線 175 93 出来る 129 123 極太 101 4 駅 1,898 34 買う 284 64 多い 172 94 地域 129 124 最高 101 5 行く 1,539 35 スープ 277 65 上越 171 95 大宮 125 125 地場 101 6 系 1,300 36 燕 274 66 入る 170 96 通過 125 126 北陸 100 7 新幹線 927 37 前 274 67 到着 168 97 飯店 125 127 付近 99 8 笑 918 38 行う 259 68 聞く 168 98 本日 125 128 陣 98 9 食べる 906 39 良い 246 69 限定 167 99 油 125 129 金物 96 10 背脂 881 40 バス 242 70 ホテル 165 100 話 125 130 潟 95 11 三条 837 41 知る 229 71 食う 165 101 職人 124 131 乗車 95 12 麺 745 42 カレー 220 72 向かう 162 102 初めて 123 132 年 95 13 思う 732 43 子 213 73 味 162 103 イオン 122 133 分かる 95 14 今日 623 44 次 211 74 背油 156 104 イベント 122 134 ク 94 15 燕 607 45 中華 210 75 電車 154 105 お願い 118 135 東三条 94 16 来る 523 46 近く 209 76 気 153 106 玉ねぎ 116 136 いま 93 17 言う 485 47 降りる 208 77 違う 151 107 名前 114 137 飲む 93 18 長岡 479 48 円 207 78 行ける 150 108 杭州 113 138 タイトー 92 19 見る 445 49 雪 206 79 車 149 109 高崎 113 139 駅名 92 20 煮干 428 50 越後湯沢 203 80 包丁 148 110 浦佐 112 140 県 92 21 東京 390 51 着く 198 81 食 144 111 移動 111 141 工場 92 22 市 388 52 作る 195 82 遠い 142 112 産業 110 142 最近 92 23 人 369 53 感じ 193 83 地元 142 113 自分 110 143 少し 92 24 乗る 367 54 高速 191 84 有名 142 114 止まる 109 144 高い 91 25 店 362 55 使う 191 85 楽しい 140 115 駅前 106 145 旨い 91 26 今 360 56 好き 189 86 昨日 140 116 太 105 146 久しぶり 90 27 長岡 328 57 燕 187 87 夜 140 117 辺り 105 147 刃物 90 28 美味しい 324 58 近い 185 88 美味い 138 118 スる 103 148 街 89 29 明日 322 59 弥彦線 181 89 予定 138 119 早い 103 149 今回 89 30 時間 317 60 月 180 90 弥彦 136 120 センター 102 150 見える 88 図表 3-5A は語の出現回数、図表 3-5B は語の出現頻 度の分布をプロットしたものである13。視覚的にはべ き乗分布にしたがっており,一定の出現率の高い語が 多く用いられているが,データの構成は出現率の低い 語が多く,いわゆるロングテールになっていると推察 される。 図表 3-5A 出現回数の集計表 統計項目 値 語数(n) 21,146 出現回数の平均 7.80 出現回数の標準偏差 115.93 図表 3-5B 出現回数の記述統計量 図表3-5A 出現回数の集計表 図表3-5B 出現回数の記述統計量

(6)

共起ネットワーク  共起ネットワークは、「出現パターンの似通った語、 すなわち共起の程度が強い語を線で結んだネットワー ク(樋口(2014)、p.157)」である。node(語)間の 共起関係はedge(線)で描かれており、可視性の高 いグラフである。ただし、ここで用いる共起ネットワー クは、node間に距離と方向を持たない「無向共起」 であり、語と語の関係を数学で説明できない点に留意 が必要である。  ネットワーク図を得るための設定としてKH Coder で、最小出現語数を150、現在の設定で利用できる語 の数を90にした。 6 共起ネットワーク 共起ネットワークは,「出現パターンの似通った語, すなわち共起の程度が強い語を線で結んだネットワー ク(樋口(2014),p.157)」である。node(語)間の共起関 係を edge(線)で描かれており可視性の高いグラフであ る。ただし,ここで用いる共起ネットワークは,node 間に距離と方向を持たない「無向共起」であり,語と 語の関係を数学で説明できない点に留意が必要である。 図表 3-6 node―共起関係(edge)情報 項 目 値 node(語) 34 edge(線) 60 density(密度)14 0.107 Min.Jaccard15 0.77 ネットワーク図を得るための設定として KH Coder で,最小出現語数を 150,現在の設定で利用できる語 の数を 90 にした。 図表 3-7「燕三条」の共起ネットワーク図 ララララ 醤醤 煮煮 スラス 中中 バス 高高 限限 越越越越 長長 新新 新新新 燕 三三 東東 長長 燕 上越 燕三三 背背 三三燕 行く 食べべ 乗べ 駅 系 麺 背醤 美美しし 市 燕 ニニ 子 美 図表3-6 node―共起関係(edge)情報 図表3-7「燕三条」の共起ネットワーク図 6 共起ネットワーク 共起ネットワークは,「出現パターンの似通った語, すなわち共起の程度が強い語を線で結んだネットワー ク(樋口(2014),p.157)」である。node(語)間の共起関 係を edge(線)で描かれており可視性の高いグラフであ る。ただし,ここで用いる共起ネットワークは,node 間に距離と方向を持たない「無向共起」であり,語と 語の関係を数学で説明できない点に留意が必要である。 図表 3-6 node―共起関係(edge)情報 項 目 値 node(語) 34 edge(線) 60 density(密度)14 0.107 Min.Jaccard15 0.77 ネットワーク図を得るための設定として KH Coder で,最小出現語数を 150,現在の設定で利用できる語 の数を 90 にした。 図表 3-7「燕三条」の共起ネットワーク図 ララララ 醤醤 煮煮 スラス 中中 バス 高高 限限 越越越越 長長 新新 新新新 燕 三三 東東 長長 燕 上越 燕三三 背背 三三燕 行く 食べべ 乗べ 駅 系 麺 背醤 美美しし 市 燕 ニニ 子 美

(7)

 図表3-6はネットワーク図の基礎数値の要約、図 表3-7は、本解析の基礎となる「共起ネットワーク 図」である。図表3-7から、「燕三条」を起点として、 「ラーメン」「新潟」「駅」との共起関係がみられる。 さらに、「駅」から派生して「新幹線」との関連を示 しているが、この共起関係とは離れて「越後湯沢」を 中心に「東京」「長岡」「上越」でネットワークを形成 している。なお、図表3-4にて出現回数1,300回が 確認された「系」については、「駅」「新幹線」など「鉄 道」に関連するものなのか、「燕三条系ラーメン」に 関連するものなのかが定かではなかったが、共起ネッ トワーク図を見る限り後者との共起関係が強いものと 理解できる。  このほか、「三条燕」を起点とする「高速道路」に 関連するネットワークが形成されている。  この結果から、共起ネットワーク分析に限っていえ ば、「新幹線の駅名」、「高速道路」、「ラーメン」とい うように大きく3つの共起ネットワークでTweetが構 成されている様子がうかがえる。  特に、ラーメンに関連する「node word16」に関し ては、「麺」「背脂」「煮干」「醤油」が「中心性17」を もちながら強いedgeで結ばれている。 4.考 察 (阿部 彩奈)  本研究の所期の目的に立ち返れば、観光経営に資す るヒントをSNSから探り出すことにあった。  周知のとおり、「燕三条」は江戸時代から続く金属 加工業の集積地であり、日本を代表する産業クラスタ を形成している。こうした特徴から、観光活性と親和 性が高いと考えられる「産業観光」「クラフト・ツー リズム」「伝統産業」などに関連する「ものづくり」 を想起させる語の出現回数が目立って多くない点は、 一般的な含意においては想定外の結果であろう。 4-1 Twitter投稿にうかがう「工場の祭典」の話題  ここで、改めて近年燕三条地区で行政と民間が連携 して力を入れている「工場の祭典」について、本研究 で用いたTweetデータを活用して実証的に考量をすす めたい。  実証に際し、node word「工場の祭典」の月次出現 回数を説明変数として、月ごとのTweetの偏りをχ2 分布を用いて分析する。  図表4-1にもとづき、図表4-2に基本統計量お よび検定統計量を整理する。  図表4-2に示すように、月次ごとのTweet数につ いて有意差がみられた(χ2(11, N=85)237.588 , p <.01)。よって、少なくとも「燕三条」をTweetの検 索キーワードとして収集され、かつ、個人投稿に限定 して抽出されたTweetにおいて、node word「工場の 祭典」を含む月次の投稿は月ごとに偏りがあると分析 できる。もっとも、図表4-2の基本統計量からあき らかなように、最小値0、中央値1.5の差異に対して、 はずれ値ともとれる最大値38が発生していることか ら、この結果は容易に予測できる。  なによりも、投稿数自体が少ない事実が現状である。 殊にTwitterに限れば、SNS利用者層への宣伝告知活 7 図表 3-7 は,本解析の基礎となる「共起ネットワー ク図」,図表 3-6 はネットワーク図の基礎数値の要約で ある。「燕三条」を起点として,「ラーメン」「新潟」「駅」 との共起関係がみられる。さらに,「駅」から派生して 「新幹線」との関連を示しているが,この共起関係と は離れて「越後湯沢」を中心に「東京」「長岡」「上越」 でネットワークを形成している。なお,図表 3-4 にて 出現回数 1,300 回が確認された「系」については,「駅」 「新幹線」など「鉄道」に関連するものなのか,「燕三 条系ラーメン」に関連するものなのかが定かではなか ったが,共起ネットワーク図を見る限り後者との共起 関係が強いものと理解できる。 このほか,「三条燕」を起点とする「高速道路」に 関連するネットワークが形成されている。 この結果から,共起ネットワーク分析に限っていえ ば,「新幹線の駅名」,「高速道路」,「ラーメン」という ように大きく3つの共起ネットワークでTweetが構成 されている様子がうかがえる。 特に,ラーメンに関連する「node word16」に関し ては,「麺」「背脂」「煮干」「醤油」が「中心性17」を もちながら強い edge で結ばれている。

4.考 察

(阿部彩奈) 本研究の所期の目的に立ち返れば,観光経営に資す るヒントを SNS から探り出すことにあった。 周知のとおり,「燕三条」は江戸時代から続く金属 加工業の集積地であり,日本を代表する産業クラスタ を形成している。こうした特徴から,観光活性と親和 性が高いと考えられる「産業観光」「クラフト・ツーリ ズム」「伝統産業」などに関連する「ものづくり」を想 起させる語の出現回数が目立って多くない点は,一般 的な仮定においては想定外の結果であろう。 4-1 Twitter 投稿にうかがう「工場の祭典」の話題 ここで,改めて近年燕三条地区で行政と民間が連携 して力を入れている「工場の祭典」について,本研究 で用いた Tweet データを活用して実証的に考量をす すめたい。 実証に際し,node word「工場の祭典」の月次出現 回数を説明変数として,月ごとの Tweet の偏りを独立 性の検定を用いて分析する。 図表 4-1 「工場の祭典」月次出現回数 月 出現回数 9 27 10 38 11 9 12 1 1 0 2 4 3 0 4 2 5 0 6 0 7 1 8 3 合計 85 図表 4-1にもとづき,図表4-2 に基本統計量および 検定統計量を整理する。 図表 4-2 基本統計量および検定統計量 (工場の祭典) 基本統計量 検定統計量 項目 値 項目 値 平均値 7.1 χ2 237.588 最大値 38 自由度 11 中央値 1.5 p 値 1.103✕10-44 ** 最小値 0 n.s.: not significant *: p <0.05 **: p <0.01 標準偏差 11.042 図表 4-2 に示すように,月次ごとの Tweet 数につい てχ2検定を行った結果,有意差がみられた(χ2(11, N=85)237.588 , p<.01)。よって,少なくとも「燕三 条」を Tweet の検索キーワードとして収集され,かつ, 個人投稿に限定して抽出された Tweet において,node word「工場の祭典」を含む月次の投稿は月ごとに偏り があると分析できる。もっとも,図表 3-14 の基本統 計量からあきらかなように,最小値 0,中央値 1.5 の 差異に対して,はずれ値ともとれる最大値 38 が発生 していることから,この結果は容易に予測できる。 なによりも,投稿数自体が少ない事実が厳然たる現 図表4-1 「工場の祭典」月次出現回数 図表4-2 基本統計量および検定統計量 (工場の祭典) 7 図表 3-7 は,本解析の基礎となる「共起ネットワー ク図」,図表 3-6 はネットワーク図の基礎数値の要約で ある。「燕三条」を起点として,「ラーメン」「新潟」「駅」 との共起関係がみられる。さらに,「駅」から派生して 「新幹線」との関連を示しているが,この共起関係と は離れて「越後湯沢」を中心に「東京」「長岡」「上越」 でネットワークを形成している。なお,図表 3-4 にて 出現回数 1,300 回が確認された「系」については,「駅」 「新幹線」など「鉄道」に関連するものなのか,「燕三 条系ラーメン」に関連するものなのかが定かではなか ったが,共起ネットワーク図を見る限り後者との共起 関係が強いものと理解できる。 このほか,「三条燕」を起点とする「高速道路」に 関連するネットワークが形成されている。 この結果から,共起ネットワーク分析に限っていえ ば,「新幹線の駅名」,「高速道路」,「ラーメン」という ように大きく3つの共起ネットワークでTweetが構成 されている様子がうかがえる。 特に,ラーメンに関連する「node word16」に関し ては,「麺」「背脂」「煮干」「醤油」が「中心性17」を もちながら強い edge で結ばれている。

4.考 察

(阿部彩奈) 本研究の所期の目的に立ち返れば,観光経営に資す るヒントを SNS から探り出すことにあった。 周知のとおり,「燕三条」は江戸時代から続く金属 加工業の集積地であり,日本を代表する産業クラスタ を形成している。こうした特徴から,観光活性と親和 性が高いと考えられる「産業観光」「クラフト・ツーリ ズム」「伝統産業」などに関連する「ものづくり」を想 起させる語の出現回数が目立って多くない点は,一般 的な仮定においては想定外の結果であろう。 4-1 Twitter 投稿にうかがう「工場の祭典」の話題 ここで,改めて近年燕三条地区で行政と民間が連携 して力を入れている「工場の祭典」について,本研究 で用いた Tweet データを活用して実証的に考量をす すめたい。 実証に際し,node word「工場の祭典」の月次出現 回数を説明変数として,月ごとの Tweet の偏りを独立 性の検定を用いて分析する。 図表 4-1 「工場の祭典」月次出現回数 月 出現回数 9 27 10 38 11 9 12 1 1 0 2 4 3 0 4 2 5 0 6 0 7 1 8 3 合計 85 図表 4-1にもとづき,図表4-2 に基本統計量および 検定統計量を整理する。 図表 4-2 基本統計量および検定統計量 (工場の祭典) 基本統計量 検定統計量 項目 値 項目 値 平均値 7.1 χ2 237.588 最大値 38 自由度 11 中央値 1.5 p 値 1.103✕10-44 ** 最小値 0 n.s.: not significant *: p <0.05 **: p <0.01 標準偏差 11.042 図表 4-2 に示すように,月次ごとの Tweet 数につい てχ2検定を行った結果,有意差がみられた(χ2(11, N=85)237.588 , p<.01)。よって,少なくとも「燕三 条」を Tweet の検索キーワードとして収集され,かつ, 個人投稿に限定して抽出された Tweet において,node word「工場の祭典」を含む月次の投稿は月ごとに偏り があると分析できる。もっとも,図表 3-14 の基本統 計量からあきらかなように,最小値 0,中央値 1.5 の 差異に対して,はずれ値ともとれる最大値 38 が発生 していることから,この結果は容易に予測できる。 なによりも,投稿数自体が少ない事実が厳然たる現

(8)

動が課題として提起される。  工場の祭典は例年10月初旬に開催され、回を重ねる ごとに活況を呈し、県央地域・燕三条を代表する行事 として定着しつつあるイベントである。  しかし、Twitterの投稿状況から推察する限り、開 催前月の9月にわずかな投稿があるものの、開催月の 10月でさえ投稿数が極端に減少していることも事実で ある。直感的には、開催月を変更するか、季節ごとや 月例で「ミニ工場の祭典」を開催して、話題がとぎれ ないように工夫するなど、改良の余地は十分にあろう。 4-2 観光資源としての「ラーメン」  図表4-3、図表4-4で示すように、月ごとの Tweet数について有意差がみられた(χ2(11 , N= 2,535)71.367 , p<.01)。  ネットワーク分析において強い共起関係を形成して いるとみられる「ラーメン」においても、「工場の祭典」 と同様に月ごとのTweetに偏りがみられる。しかも、 10のマイナス11乗という極めて小さい期待確率を示し ている。この分析結果は、地域資源の発掘という観点 からは看過できない。これらのTweetがラーメンを食 している時につぶやかれているのか、「燕三条=ラー メン」のイメージでつぶやかれているのか、本解析の みをもって結論付けることはできない。この点は課題 として残る18 補 足   ちなみに、総務省の調査によればSNS利用者層は図 表4-5で示すとおりである。FacebookとTwitterと もに20代で約50%、30代・40代ともに30%超で50代に いたっても25%近くがSNSを利用している。今後、さ らにユビキタスが身近になり、ユニバーサルなICT社 会の進展につれ年代を問わず利用者が増加することは 衆目の一致するところであろう。   むすびにかえて (解析:阿部彩奈、文責:筆頭執筆者)  膨大なTwitter投稿から「燕三条」をキーワードに 検索・抽出し、当該投稿にテキスト・マイニングを用 いて解析したところが本研究の特徴である。冒頭と2 章で述べたように、観光振興による地域活性化が耳目 を集める中で、特定の地域をフォーカスしたテキス ト・マイニング研究は多くない。こうした観点では、 本研究の試みが県央地域の観光資源再発掘に資する施 策提言の一助として貢献に結びつけば幸いである。 8 状である。殊に Twitter に限っていえば,SNS 利用者 層への宣伝告知活動が課題として提起される。 工場の祭典は例年 10 月初旬に開催され,回を重ね るごとに活況を呈し,県央地域・燕三条を代表する行 事として定着しつつあるイベントである。 しかし,殊にTwitter の投稿状況から推察する限り, 開催前月(9 月)にわずかの投稿があるものの開催月 の 10 月でさえ投稿数が極端に減少していることも事 実である。直感的には,開催月を変更するか,季節ご とや月例で「ミニ工場の祭典」を開催して,話題がと ぎれないように工夫するなど,十分に改良の余地はあ ろう。 4-2 観光資源としての「ラーメン」 図表 4-3,図表 4-4 で示すように,月ごとの Tweet 数についてχ2検定を行った結果,有意差がみられた (χ2(11 , N=2,535)71.367 , p<.01)。 ネットワーク分析において強い共起関係を形成し ているとみられる「ラーメン」においても,「工場の祭 典」と同様に月ごとの Tweet に偏りがみられる。しか も,10 のマイナス 11 乗という極めて小さい期待確率 を示している。この分析結果は,地域資源の発掘とい う観点からは看過できない。これらの Tweet がラーメ ンを食べに行った際につぶやかれているのか,「燕三条 =ラーメン」のイメージでつぶやかれているのか,本 解析のみをもって結論付けることはできない。この点 は課題として残る18。 図表4-3 「ラーメン」月次出現回数 月 出現回数 9 189 10 209 11 228 12 186 1 196 2 178 3 187 4 176 5 223 6 198 7 286 8 279 合計 2,535 図表4-4 基本統計量および検定統計量 (ラーメン) 基本統計量 検定統計量 項目 値 項目 値 平均値 211.25 χ2 71.367 最大値 286 自由度 11 中央値 197 p 値 6.683✕10-11 ** 最小値 176 n.s.: not significant *: p <0.05 **: p <0.01 標準偏差 35.447 補 足 ちなみに,総務省の調査によれば SNS 利用者層は 図表 4-5 で示すとおりである。facebook と Twitter と もに 20 代で約 50%,30 代・40 代ともに 30%超で 50 代にいたっても 25%近くが SNS を利用している。今 後,さらにユビキタスが身近になり,ユニバーサルな ICT社会の進展につれ年代を問わず利用者が増加する ことは衆目の一致するところであろう。 図表4-5 SNS 利用者層 出所:総務省(2015)から筆者作成 むすびにかえて (解析:阿部彩奈、文責:筆頭執筆者) 膨大な Twitter 投稿から「燕三条」をキーワードに 検索・抽出し,当該投稿にテキスト・マイニングを用 いて解析したところが本研究の特徴である。冒頭と 2 章で述べたように,観光振興による地域活性化が耳目 を集める中で, 特定の地域をフォーカスしたテキス ト・マイニング研究は多くない。こうした観点では, 本研究の試みが県央地域の観光資源再発掘に資する施 策提言一助として貢献に結びつけば幸いである。 図表4-3 「ラーメン」月次出現回数 図表4-4 基本統計量および検定統計量 (ラーメン) 8 状である。殊に Twitter に限っていえば,SNS 利用者 層への宣伝告知活動が課題として提起される。 工場の祭典は例年 10 月初旬に開催され,回を重ね るごとに活況を呈し,県央地域・燕三条を代表する行 事として定着しつつあるイベントである。 しかし,殊にTwitter の投稿状況から推察する限り, 開催前月(9 月)にわずかの投稿があるものの開催月 の 10 月でさえ投稿数が極端に減少していることも事 実である。直感的には,開催月を変更するか,季節ご とや月例で「ミニ工場の祭典」を開催して,話題がと ぎれないように工夫するなど,十分に改良の余地はあ ろう。 4-2 観光資源としての「ラーメン」 図表 4-3,図表 4-4 で示すように,月ごとの Tweet 数についてχ2検定を行った結果,有意差がみられた (χ2(11 , N=2,535)71.367 , p<.01)。 ネットワーク分析において強い共起関係を形成し ているとみられる「ラーメン」においても,「工場の祭 典」と同様に月ごとの Tweet に偏りがみられる。しか も,10 のマイナス 11 乗という極めて小さい期待確率 を示している。この分析結果は,地域資源の発掘とい う観点からは看過できない。これらの Tweet がラーメ ンを食べに行った際につぶやかれているのか,「燕三条 =ラーメン」のイメージでつぶやかれているのか,本 解析のみをもって結論付けることはできない。この点 は課題として残る18。 図表4-3 「ラーメン」月次出現回数 月 出現回数 9 189 10 209 11 228 12 186 1 196 2 178 3 187 4 176 5 223 6 198 7 286 8 279 合計 2,535 図表4-4 基本統計量および検定統計量 (ラーメン) 基本統計量 検定統計量 項目 値 項目 値 平均値 211.25 χ2 71.367 最大値 286 自由度 11 中央値 197 p 値 6.683✕10-11 ** 最小値 176 n.s.: not significant *: p <0.05 **: p <0.01 標準偏差 35.447 補 足 ちなみに,総務省の調査によれば SNS 利用者層は 図表 4-5 で示すとおりである。facebook と Twitter と もに 20 代で約 50%,30 代・40 代ともに 30%超で 50 代にいたっても 25%近くが SNS を利用している。今 後,さらにユビキタスが身近になり,ユニバーサルな ICT社会の進展につれ年代を問わず利用者が増加する ことは衆目の一致するところであろう。 図表4-5 SNS 利用者層 出所:総務省(2015)から筆者作成 むすびにかえて (解析:阿部彩奈、文責:筆頭執筆者) 膨大な Twitter 投稿から「燕三条」をキーワードに 検索・抽出し,当該投稿にテキスト・マイニングを用 いて解析したところが本研究の特徴である。冒頭と 2 章で述べたように,観光振興による地域活性化が耳目 を集める中で, 特定の地域をフォーカスしたテキス ト・マイニング研究は多くない。こうした観点では, 本研究の試みが県央地域の観光資源再発掘に資する施 策提言一助として貢献に結びつけば幸いである。 8 状である。殊に Twitter に限っていえば,SNS 利用者 層への宣伝告知活動が課題として提起される。 工場の祭典は例年 10 月初旬に開催され,回を重ね るごとに活況を呈し,県央地域・燕三条を代表する行 事として定着しつつあるイベントである。 しかし,殊にTwitter の投稿状況から推察する限り, 開催前月(9 月)にわずかの投稿があるものの開催月 の 10 月でさえ投稿数が極端に減少していることも事 実である。直感的には,開催月を変更するか,季節ご とや月例で「ミニ工場の祭典」を開催して,話題がと ぎれないように工夫するなど,十分に改良の余地はあ ろう。 4-2 観光資源としての「ラーメン」 図表 4-3,図表 4-4 で示すように,月ごとの Tweet 数についてχ2検定を行った結果,有意差がみられた (χ2(11 , N=2,535)71.367 , p<.01)。 ネットワーク分析において強い共起関係を形成し ているとみられる「ラーメン」においても,「工場の祭 典」と同様に月ごとの Tweet に偏りがみられる。しか も,10 のマイナス 11 乗という極めて小さい期待確率 を示している。この分析結果は,地域資源の発掘とい う観点からは看過できない。これらの Tweet がラーメ ンを食べに行った際につぶやかれているのか,「燕三条 =ラーメン」のイメージでつぶやかれているのか,本 解析のみをもって結論付けることはできない。この点 は課題として残る18。 図表4-3 「ラーメン」月次出現回数 月 出現回数 9 189 10 209 11 228 12 186 1 196 2 178 3 187 4 176 5 223 6 198 7 286 8 279 合計 2,535 図表4-4 基本統計量および検定統計量 (ラーメン) 基本統計量 検定統計量 項目 値 項目 値 平均値 211.25 χ2 71.367 最大値 286 自由度 11 中央値 197 p 値 6.683✕10-11 ** 最小値 176 n.s.: not significant *: p <0.05 **: p <0.01 標準偏差 35.447 補 足 ちなみに,総務省の調査によれば SNS 利用者層は 図表 4-5 で示すとおりである。facebook と Twitter と もに 20 代で約 50%,30 代・40 代ともに 30%超で 50 代にいたっても 25%近くが SNS を利用している。今 後,さらにユビキタスが身近になり,ユニバーサルな ICT社会の進展につれ年代を問わず利用者が増加する ことは衆目の一致するところであろう。 図表4-5 SNS 利用者層 出所:総務省(2015)から筆者作成 むすびにかえて (解析:阿部彩奈、文責:筆頭執筆者) 膨大な Twitter 投稿から「燕三条」をキーワードに 検索・抽出し,当該投稿にテキスト・マイニングを用 いて解析したところが本研究の特徴である。冒頭と 2 章で述べたように,観光振興による地域活性化が耳目 を集める中で, 特定の地域をフォーカスしたテキス ト・マイニング研究は多くない。こうした観点では, 本研究の試みが県央地域の観光資源再発掘に資する施 策提言一助として貢献に結びつけば幸いである。 図表4-5 SNS利用者層 出所:総務省(2015a)から筆者作成

参照

関連したドキュメント

の観察が可能である(図2A~J).さらに,従来型の白

国民の「知る自由」を保障し、

もっと早く詳しく報告すべきだったのだが、今日初めてフルヤ氏との共同の仕事の悲し

「Remote NDIS based Internet Sharing Devise」を誤って削除してしまった。 → 資格確認端末の再起動を行っていただくことで、ネットワーク接続に「Remote NDIS

 本実験の前に,林間学校などで行った飯 はん 盒 ごう 炊 すい

日本語で書かれた解説がほとんどないので , 専門用 語の訳出を独自に試みた ( たとえば variety を「多様クラス」と訳したり , subdirect

共通点が多い 2 。そのようなことを考えあわせ ると、リードの因果論は結局、・ヒュームの因果

   がんを体験した人が、京都で共に息し、意 気を持ち、粋(庶民の生活から生まれた美