• 検索結果がありません。

SNSを用いた街づくり要望の分析

N/A
N/A
Protected

Academic year: 2021

シェア "SNSを用いた街づくり要望の分析"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)36. 特集:人口減少時代の環境デザインを考える. 川合康央 Kawai Yasuo. 池辺正典. Ikebe Masanori 文教大学. 第一部:現状調査報告. SNS を用いた街づくり要望の分析 湘南地区5市の Twitter を対象として Analysis of Town Planning Requests Using SNS: Twitter in Five Cities in the Shonan Area. Bunkyo University. 1.はじめに 地方自治体は,街づくりに地域住民の要望を反映させるため,イベントや ワークショップなど様々な試行を行っている[注1].しかし,現状の街づ 表1 地域ごとの取得した Tweet 数と ID 数. くり事業では,主に60代以上の参加者が中心となっており,様々な世代の地 域要望を反映しているとは言い難い[注2].そこで本研究では,ソーシャ ル・ネットワーキング・サービス(SNS)を対象とした街の分析を行い,こ. 表2 年間 Tweet 数別 Tweet 数. れまで把握が難しかった勤労世代や子育て世代などの市民層から,間接的な 街づくりの要望抽出が可能であるかを検討する.本研究では,SNS として. Twitter を選定した.Twitter は,「Tweet(ツイート)」と呼ばれるメッセージ を,半角280文字または全角140文字以内で投稿できる SNS である.. SNS のテキストマイニングは,コンテンツの評価[注3]や選挙[注4],. 災害[注5]など,様々な領域での分析が行われている.また,街づくりに 関するテキストマイニング分析としては,市民アンケート調査[注6]や新 聞記事[注7]を対象としたものが挙げられる. 表3 年間 Tweet 数別 ID 数. 本研究では,神奈川県5市を対象とした Tweet を収集し,これを整理,分. 析を行うことによって,夫々の街における特徴的な単語の抽出を行うもので ある.さらに,1年間分の大規模なテキストデータを収集することによって, 抽出された単語の継時的変動と地域特性についても見ていくこととする.. 2.方法 対象地域として,神奈川県の相模湾に面する湘南地域である,平塚市,茅 ケ崎市,藤沢市,鎌倉市,逗子市の5市を選定した.「平塚」,「茅ケ崎」, 「藤沢」,「鎌倉」,「逗子」をキーワードとして選定し,Twitter から継続的に 表4 同一内容の Tweet 数. 収集した.期間は2019年1月1日から同年12月31日までである.Twitter API. の「Standard search API」 [注8]を利用し,毎時0分に前回取得 Tweet 以降,. 最大100件(1日あたり24回,1地域最大2,400件)取得した.Twitter API か 表5 “RT @”を含む Tweet 数. らのデータ取得は,「abraham/twitteroauth」のライブラリ[注9]を利用し. た.実装言語は PHP である.指定したキーワードを含む Tweet とともに,. Tweet した日付と時刻,半角英数字15文字以内のラベルであるユーザ名(ID). 表6 “https://”を含む Tweet 数. を取得した.地域ごとの取得した Tweet 数と ID 数は表の通りである(表1). 取得した Tweet は,大規模なテキストデータとなるが,ここには対象地区. とは無関係な Tweet が大量に含まれている. そこで,試行的な解析を行い, ノイズとなる Tweet を除外する.まず,繰り返し Tweet している ID を見たと.

(2) デザイン学研究特集号  Vol.28-2 No.104. 1). ころ,年6回以上 Tweet している ID は全体の5.82%だが,Tweet 数は50.40%. であった(表2,3).次に,内容が完全一致する Tweet を調査した結果,. 2). 50.85%の Tweet が同一内容の Tweet となった(表4) .さらに, 「RT @」を含. む Tweet についても調査した.RT は,ReTweet の略であり,転載する際に使. 用される.先頭に「RT @」を含む Tweet は,42.90%存在した(表5) .最後. に「https://」を含む Tweet を見た.これは,リンク URL 付き Tweet であり,内. 容は広告が主であった. 「https://」を含む Tweet は,43.30%であった(表6) . これらの結果を踏まえ,以下の①∼③の順で除外処理を行った.. ① 同一地域において同一 ID からの年間 Tweet 数が6以上の Tweet を除外. ② 同一地域において同一文字列の Tweet を除外. ③ 文字列先頭に“RT_@”または“https://”を含む Tweet を除外. 除外処理を行った結果,取得した Tweet の13.58%が抽出された.これらを. 統計的にテキストデータ分析できる「KHCoder」 [注10]を用いて,自然言語. 処理を行う.まず,形態素解析器である「茶筅」 [注11]により,各 Tweet を. 単語単位に分割し,品詞を付与した.本稿では,分析対象とする品詞として. 名詞を扱うこととした.抽出した名詞のうち,出現頻度の高いものに対して,. Jaccrad 係数を用いた Ward 法による階層的クラスター分析を行った.Jaccard 係. 数は,集合 A と B の共通要素数を,少なくとも一方にある要素の総数で割っ. て算出する1).これは,単語間の類似度を測るものである.次にクラスタリン. グを Ward 法で行った2).ある語と他の語がどのように共起しているかを調べ, 共起頻度が高い組み合わせから順番にクラスターを形成する.地域ごとに出 現頻度の高い名詞上位300語を対象に階層的クラスター分析を行った. 結果,地域と直接関係のないクラスターを特定した.これらは大きく分け て,①地域名と同一の人物名やキャラクター名など,②広告内に地域名を埋 め込んだもの,③広域交通機関に関するものであった.地域特性と直接関係 のないクラスターに含まれる単語についてコンコーダンスを用いて文脈を精 査し,11.54%の Tweet をあらためて削除した後,再度単語間の共起関係を求. めた(図1).次に,継時的変動を見るため,抽出語と発話された時期(月) を対応分析した(図2−6).さらに,抽出語の地域特性を見るため,都市 間の対応分析を行った(図7).これは,地域毎に30,000件の Tweet をランダ ムサンプリングして対応分析を行ったものである.図中の赤文字は,時期. (月)や地域(市)を表し,抽出語の偏りを表すものである.. 3.結果と考察 各地域における抽出語の共起ネットワークと継時的変動について見ていく. 平塚市では,大型商業施設である「ららぽーと」や「サッカー」 「スタジ アム」,「競輪」場などが特徴的な都市施設として挙げられた.また,1月に は「箱根」「駅伝」,7月には「七夕」「祭り」が抽出されている. 茅ケ崎市では,「海」「波」「海岸」とともに「湘南」「江ノ島」「逗子」な どが抽出されている.また,「駅」では,地域出身のアーチストが手掛けた 「希望」「轍」といった楽曲が「発車」 「メロディ」に採用されている.8月 に開催予定であった「花火」「大会」は「台風」により「中止」された. 藤沢市では, 「江ノ島」が観光地として「鎌倉」と近い位置で抽出されてい る.また「青春」 「ブタ」といった「アニメ」 「映画」の「聖地」 「巡礼」が抽 出され,同地域を舞台としたコンテンツの評価が見られた.7月には「日大藤 図1 藤沢市における階層的クラスター. 沢」 「東海大相模」といった高校野球県大会決勝戦に関する話題が抽出された.. 37.

(3) 38. 特集:人口減少時代の環境デザインを考える. 図2 平塚市における抽出語と時期の対応分析. 図3 茅ケ崎市における抽出語と時期の対応分析. 図4 藤沢市における抽出語と時期の対応分析. 図5 鎌倉市における抽出語と時期の対応分析. 図6 逗子市における抽出語と時期の対応分析. 図7 抽出語と地域の対応分析. 鎌倉市では, 「鶴岡」 「八幡宮」 「神社」 「大仏」 「お寺」など「観光」要素が 多く, 「散策」 「散歩」 「デート」 「遠足」などの語が抽出された.また, 「浅草」 「ディズニー」 「京都」など他の観光地な語が混在している.また,6月には 「紫陽花」 ,7月には「花火」 「大会」など,時期に応じたイベントも見られた..

(4) デザイン学研究特集号  Vol.28-2 No.104. 逗子市では, 「マリーナ」 「由比ヶ浜」など「海水浴」関連の語が見られた. また, 「兄弟」 「ユーミン」などのアーチストも抽出されている. 「花火」 「大 会」は9月に見られ,周辺地域と時期をずらして開催していることが分かる. 抽出語の地域特性としては,平塚市は「七夕」 「祭り」 ,茅ケ崎市は「東海 道線」関連,藤沢市は「ブタ」や「小田急」 ,鎌倉市は「大仏」 「観光」 ,逗子 市は「マリーナ」 「海岸」 「開成」といった語が,特徴語として挙げられる. 5市の中では,鎌倉,逗子が特徴的な傾向を持つとともに,平塚と茅ケ崎, 藤沢は類似している.抽出された語は,各地域における SNS 上での主要な. キーワードとなるため,これらの共起語とともにその評価を行う必要がある.. 4.まとめ 人口減少時代において,様々な世代の多様性を考慮した街づくりを行うた め,人々の日常的な情報発信から間接的に街づくりに関する情報を取得でき ないかと考えた.本研究では,SNS を用いた街づくり要望について,手法の. 検討と分析結果の考察を行った.SNS として Twitter を用い,神奈川県5市. の Tweet を対象とした.分析のため収集した Tweet は2019年1年間分であり, 2,977,437Tweet の大規模テキストデータとなった.一方で,対象地域と無関. 係な Tweet も多いため,削除ルールを策定した.さらに階層的クラスター分. 析により,無関係な単語グループを削除した.抽出語を継時的変動と地域特 性による対応分析を行い,街づくりの大まかなキーワードを特定した.クラ スター分析や対応分析により,全体傾向についての単語抽出を行ったが,詳. 細な街づくり要望についての具体化が必要である.Tweet が肯定的,否定的. であるか評価を行い,街づくりへの要望や批判を抽出するとともに,大規模 データであることを活かして,個別 Tweet の抽出と評価を行っていく必要が. ある.また,大規模テキストデータは,不要情報削除後も十分なデータ量を 保持できるが,必要な計算量も多くなるため,処理の軽量化が課題である. 謝辞:本研究は JSPS 科研費 JP19K12665 の助成を受けたものです. 注および参考文献 [注1]西田智裕,他:連続ワークショップ間に合意形成支援システムを用いた効果検証(まちづ くりの社会実験を事例として),研究報告知能システム(ICS),2016(9),1-7,2016.. [注2]栗原理聡,他:Twitter を利用した地域毎の要望抽出,人工知能学会全国大会論文集第29回 全国大会,1H33,1-4,2015.. [注3]吉見憲二,松本淳:映画の評判形成において Twitter が果たす役割に関する研究,研究報告 電子化知的財産・社会基盤(EIP),2017(9),1-3,2017.. [注4]吉見憲二:選挙期間中の各政党におけるソーシャルメディアの利用傾向―第47回衆議院議 員総選挙の Twitter 利用を題材として―,社会情報学,4(3),15-29,2016.. [注5]榎本甫,他:災害時のソーシャルメディアと帰宅行動の関連性分析,土木学会論文集 D3 (土木計画学),70(1),102-112,2014.. [注6]森田哲夫,他:自由記述データを用いたテキストマイニングによる都市のイメージ分析, 土木学会論文集 D3(土木計画学),68(5),315-323,2012.. [注7]西尾敏和,他:テキストマイニングによる富岡製糸場の世界遺産登録前における観光まち づくりの把握,ランドスケープ研究,79(5),519-524,2016.. [注8]Twitter, Inc.: Standard search API ─ Twitter Developers, https://developer.twitter.com/en/docs/. tweets/search/api-reference/get-search-tweets(参照日2020年3月28日). [注9]Abraham Williams: GitHub - abraham/twitteroauth: The most popular PHP library for use with the. Twitter OAuth REST API, https://github.com/abraham/twitteroauth(参照日2020年3月28日). [注10]樋口耕一:テキスト型データの計量的分析 ─ 2つのアプローチの峻別と統合 ─ ,理論と方 法,19(1),101-115,2004.. [注11]奈良先端科学技術大学院大学情報科学研究科自然言語処理学講座:ChaSen ─ 形態素解析 器,https://chasen-legacy.osdn.jp/(参照日2020年3月28日). 39.

(5)

参照

関連したドキュメント

る、関与していることに伴う、または関与することとなる重大なリスクがある、と合理的に 判断される者を特定したリストを指します 51 。Entity

テキストマイニング は,大量の構 造化されていないテキスト情報を様々な観点から

テューリングは、数学者が紙と鉛筆を用いて計算を行う過程を極限まで抽象化することに よりテューリング機械の定義に到達した。

これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,

自分は超能力を持っていて他人の行動を左右で きると信じている。そして、例えば、たまたま

つまり、p 型の語が p 型の語を修飾するという関係になっている。しかし、p 型の語同士の Merge

これら諸々の構造的制約というフィルターを通して析出された行為を分析対象とする点で︑構

学側からより、たくさんの情報 提供してほしいなあと感じて います。講議 まま に関して、うるさ すぎる学生、講議 まま