SNSを用いた街づくり要望の分析
4
0
0
全文
(2) デザイン学研究特集号 Vol.28-2 No.104. 1). ころ,年6回以上 Tweet している ID は全体の5.82%だが,Tweet 数は50.40%. であった(表2,3).次に,内容が完全一致する Tweet を調査した結果,. 2). 50.85%の Tweet が同一内容の Tweet となった(表4) .さらに, 「RT @」を含. む Tweet についても調査した.RT は,ReTweet の略であり,転載する際に使. 用される.先頭に「RT @」を含む Tweet は,42.90%存在した(表5) .最後. に「https://」を含む Tweet を見た.これは,リンク URL 付き Tweet であり,内. 容は広告が主であった. 「https://」を含む Tweet は,43.30%であった(表6) . これらの結果を踏まえ,以下の①∼③の順で除外処理を行った.. ① 同一地域において同一 ID からの年間 Tweet 数が6以上の Tweet を除外. ② 同一地域において同一文字列の Tweet を除外. ③ 文字列先頭に“RT_@”または“https://”を含む Tweet を除外. 除外処理を行った結果,取得した Tweet の13.58%が抽出された.これらを. 統計的にテキストデータ分析できる「KHCoder」 [注10]を用いて,自然言語. 処理を行う.まず,形態素解析器である「茶筅」 [注11]により,各 Tweet を. 単語単位に分割し,品詞を付与した.本稿では,分析対象とする品詞として. 名詞を扱うこととした.抽出した名詞のうち,出現頻度の高いものに対して,. Jaccrad 係数を用いた Ward 法による階層的クラスター分析を行った.Jaccard 係. 数は,集合 A と B の共通要素数を,少なくとも一方にある要素の総数で割っ. て算出する1).これは,単語間の類似度を測るものである.次にクラスタリン. グを Ward 法で行った2).ある語と他の語がどのように共起しているかを調べ, 共起頻度が高い組み合わせから順番にクラスターを形成する.地域ごとに出 現頻度の高い名詞上位300語を対象に階層的クラスター分析を行った. 結果,地域と直接関係のないクラスターを特定した.これらは大きく分け て,①地域名と同一の人物名やキャラクター名など,②広告内に地域名を埋 め込んだもの,③広域交通機関に関するものであった.地域特性と直接関係 のないクラスターに含まれる単語についてコンコーダンスを用いて文脈を精 査し,11.54%の Tweet をあらためて削除した後,再度単語間の共起関係を求. めた(図1).次に,継時的変動を見るため,抽出語と発話された時期(月) を対応分析した(図2−6).さらに,抽出語の地域特性を見るため,都市 間の対応分析を行った(図7).これは,地域毎に30,000件の Tweet をランダ ムサンプリングして対応分析を行ったものである.図中の赤文字は,時期. (月)や地域(市)を表し,抽出語の偏りを表すものである.. 3.結果と考察 各地域における抽出語の共起ネットワークと継時的変動について見ていく. 平塚市では,大型商業施設である「ららぽーと」や「サッカー」 「スタジ アム」,「競輪」場などが特徴的な都市施設として挙げられた.また,1月に は「箱根」「駅伝」,7月には「七夕」「祭り」が抽出されている. 茅ケ崎市では,「海」「波」「海岸」とともに「湘南」「江ノ島」「逗子」な どが抽出されている.また,「駅」では,地域出身のアーチストが手掛けた 「希望」「轍」といった楽曲が「発車」 「メロディ」に採用されている.8月 に開催予定であった「花火」「大会」は「台風」により「中止」された. 藤沢市では, 「江ノ島」が観光地として「鎌倉」と近い位置で抽出されてい る.また「青春」 「ブタ」といった「アニメ」 「映画」の「聖地」 「巡礼」が抽 出され,同地域を舞台としたコンテンツの評価が見られた.7月には「日大藤 図1 藤沢市における階層的クラスター. 沢」 「東海大相模」といった高校野球県大会決勝戦に関する話題が抽出された.. 37.
(3) 38. 特集:人口減少時代の環境デザインを考える. 図2 平塚市における抽出語と時期の対応分析. 図3 茅ケ崎市における抽出語と時期の対応分析. 図4 藤沢市における抽出語と時期の対応分析. 図5 鎌倉市における抽出語と時期の対応分析. 図6 逗子市における抽出語と時期の対応分析. 図7 抽出語と地域の対応分析. 鎌倉市では, 「鶴岡」 「八幡宮」 「神社」 「大仏」 「お寺」など「観光」要素が 多く, 「散策」 「散歩」 「デート」 「遠足」などの語が抽出された.また, 「浅草」 「ディズニー」 「京都」など他の観光地な語が混在している.また,6月には 「紫陽花」 ,7月には「花火」 「大会」など,時期に応じたイベントも見られた..
(4) デザイン学研究特集号 Vol.28-2 No.104. 逗子市では, 「マリーナ」 「由比ヶ浜」など「海水浴」関連の語が見られた. また, 「兄弟」 「ユーミン」などのアーチストも抽出されている. 「花火」 「大 会」は9月に見られ,周辺地域と時期をずらして開催していることが分かる. 抽出語の地域特性としては,平塚市は「七夕」 「祭り」 ,茅ケ崎市は「東海 道線」関連,藤沢市は「ブタ」や「小田急」 ,鎌倉市は「大仏」 「観光」 ,逗子 市は「マリーナ」 「海岸」 「開成」といった語が,特徴語として挙げられる. 5市の中では,鎌倉,逗子が特徴的な傾向を持つとともに,平塚と茅ケ崎, 藤沢は類似している.抽出された語は,各地域における SNS 上での主要な. キーワードとなるため,これらの共起語とともにその評価を行う必要がある.. 4.まとめ 人口減少時代において,様々な世代の多様性を考慮した街づくりを行うた め,人々の日常的な情報発信から間接的に街づくりに関する情報を取得でき ないかと考えた.本研究では,SNS を用いた街づくり要望について,手法の. 検討と分析結果の考察を行った.SNS として Twitter を用い,神奈川県5市. の Tweet を対象とした.分析のため収集した Tweet は2019年1年間分であり, 2,977,437Tweet の大規模テキストデータとなった.一方で,対象地域と無関. 係な Tweet も多いため,削除ルールを策定した.さらに階層的クラスター分. 析により,無関係な単語グループを削除した.抽出語を継時的変動と地域特 性による対応分析を行い,街づくりの大まかなキーワードを特定した.クラ スター分析や対応分析により,全体傾向についての単語抽出を行ったが,詳. 細な街づくり要望についての具体化が必要である.Tweet が肯定的,否定的. であるか評価を行い,街づくりへの要望や批判を抽出するとともに,大規模 データであることを活かして,個別 Tweet の抽出と評価を行っていく必要が. ある.また,大規模テキストデータは,不要情報削除後も十分なデータ量を 保持できるが,必要な計算量も多くなるため,処理の軽量化が課題である. 謝辞:本研究は JSPS 科研費 JP19K12665 の助成を受けたものです. 注および参考文献 [注1]西田智裕,他:連続ワークショップ間に合意形成支援システムを用いた効果検証(まちづ くりの社会実験を事例として),研究報告知能システム(ICS),2016(9),1-7,2016.. [注2]栗原理聡,他:Twitter を利用した地域毎の要望抽出,人工知能学会全国大会論文集第29回 全国大会,1H33,1-4,2015.. [注3]吉見憲二,松本淳:映画の評判形成において Twitter が果たす役割に関する研究,研究報告 電子化知的財産・社会基盤(EIP),2017(9),1-3,2017.. [注4]吉見憲二:選挙期間中の各政党におけるソーシャルメディアの利用傾向―第47回衆議院議 員総選挙の Twitter 利用を題材として―,社会情報学,4(3),15-29,2016.. [注5]榎本甫,他:災害時のソーシャルメディアと帰宅行動の関連性分析,土木学会論文集 D3 (土木計画学),70(1),102-112,2014.. [注6]森田哲夫,他:自由記述データを用いたテキストマイニングによる都市のイメージ分析, 土木学会論文集 D3(土木計画学),68(5),315-323,2012.. [注7]西尾敏和,他:テキストマイニングによる富岡製糸場の世界遺産登録前における観光まち づくりの把握,ランドスケープ研究,79(5),519-524,2016.. [注8]Twitter, Inc.: Standard search API ─ Twitter Developers, https://developer.twitter.com/en/docs/. tweets/search/api-reference/get-search-tweets(参照日2020年3月28日). [注9]Abraham Williams: GitHub - abraham/twitteroauth: The most popular PHP library for use with the. Twitter OAuth REST API, https://github.com/abraham/twitteroauth(参照日2020年3月28日). [注10]樋口耕一:テキスト型データの計量的分析 ─ 2つのアプローチの峻別と統合 ─ ,理論と方 法,19(1),101-115,2004.. [注11]奈良先端科学技術大学院大学情報科学研究科自然言語処理学講座:ChaSen ─ 形態素解析 器,https://chasen-legacy.osdn.jp/(参照日2020年3月28日). 39.
(5)
関連したドキュメント
る、関与していることに伴う、または関与することとなる重大なリスクがある、と合理的に 判断される者を特定したリストを指します 51 。Entity
テキストマイニング は,大量の構 造化されていないテキスト情報を様々な観点から
テューリングは、数学者が紙と鉛筆を用いて計算を行う過程を極限まで抽象化することに よりテューリング機械の定義に到達した。
これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,
自分は超能力を持っていて他人の行動を左右で きると信じている。そして、例えば、たまたま
つまり、p 型の語が p 型の語を修飾するという関係になっている。しかし、p 型の語同士の Merge
これら諸々の構造的制約というフィルターを通して析出された行為を分析対象とする点で︑構
学側からより、たくさんの情報 提供してほしいなあと感じて います。講議 まま に関して、うるさ すぎる学生、講議 まま