災害情報基盤構築に向けた
地理情報リソースの整備
榊剛史 ( ホットリンク) 大谷昭成(慶応義塾大学) 鳥海不二夫 (東京大学) 吉田光男 (豊橋技術科学大学) 風間一洋(和歌山大学) 篠田孝祐 栗原聡(電気通信大学) 野田五十樹( AIST)
背景と目的
本研究の背景・目的
背景 背景
大規模災害発生時における
ソーシャルメディア活用の重要性
これらを効率的に抽出するためのシステム開発が必要
これらを効率的に抽出するためのシステム開発が必要
○ 被災者の投稿から、様々な情報が獲得可能
・安否確認
・各地域の被災程度
・通過可能経路
・不測物資
本研究の背景・目的
背景 背景
実際のシステム開発時は様々な問題点が存在する
○ 情報の種類によって取得方法が異なる
経路情報 → 〜から〜へ避難
救助要請情報 → 〜で避難中です。
○ 情報の種類によって情報のとしての寿命が異なる
救助要請情報 → 48 時間
不測物資情報 → 1 週間〜 2 週間
災害発生直後に迅速にシステムを開発する必要がある
災害発生直後に迅速にシステムを開発する必要がある
システムの目的
基盤情報リソース
災害支援システムだけでなく、平常時に使用するシステ
ムの構築に耐えうる情報リソースが必要
一昨年の成果を受けて、地理情報リソースを整備
目的 目的
様々な災害において災害救助支援システムを構築する
基盤となる情報リソースを提供する ための
字・町名をキーとした災害時 Twitter 情報の抽出と地図への
展開 , 原 久美子 木野 泰伸 鳥海 不二夫 , 人工知能学会 2013,
近未来チャレンジセッション 2013 優秀技術賞 近未来チャレンジセッション 2013 優秀技術賞
基盤情報リソース
地理情報リソース 概要
災害発生時に迅速に活用できるリソースが必要
実際は
各エンジニアの環境・能力によって使用可能なリソース異なる
配布する際にはライセンスの問題をクリアする必要
→
今日から使える地理情報リソースの提供を目指
す
今日から使える地理情報リソースの提供を目指
す
・多様な形式で地理情報リソースを整備・提供
・リバースエンジニアリング可能なデータについては ライセ
ンス問題がないもののみを配布
・多様な形式で地理情報リソースを整備・提供
・リバースエンジニアリング可能なデータについては ライセ
ンス問題がないもののみを配布
地理情報リソース 提供すべき機能
位置情報変換機能
位置情報変換機能
・緯度経度 → 行政区域
(都道府県単位,区市町村単位,大字単位)
・緯度経度,探索施設 → 周囲の施設
(病院、避難施設)
・行政区域 → 代表地点の緯度経度
・地名(建物・ランドマーク) → 代表地点の緯度経度
位置情報生成機能
位置情報生成機能
・テキスト → 位置情報生成
・ユーザの行動(投稿テキスト群) → 居住地
地理情報リソース 利用可能なデータ
配布データ
空間情報科学研究センター
アドレスマッチングサービス
ジオコーダ DAMS
シンプルジオコー ディング実験
NII GeoNLP プロジェクト
政府・官公庁配布データ
国土交通省国土政策局 GIS データ閲覧・ダウンロード サー
ビス
電子国土基本図(地名情報)
郵便番号データ
地理情報リソース 利用可能なデータ
配布データ
その他企業・個人
日本行政区画便覧データファイル
言語資源協会地名施設名辞書第 2 版
10 万語地名辞書、山岳名辞書、統一地名辞書
場所参照表現タグ付きコーパス Ver 0.1
クロール可能なデータ
Wikipedia データ
はてな地名辞書データ
地理情報リソース 解決すべき課題
地名としての場所曖昧性
当てはまる地名について全て列挙するように提示
中央区:
一般的な語義曖昧性
既存辞書から地名でない語(非地名語)を抽出
ipadic, nastdic, jumadic, unidic
地名辞書エントリの語と非地名語の AND をとり、曖昧地
名として公開
address:札幌市中央区南3条西11丁目 address:さいたま市中央区下落合5 7 10− − address:千葉市中央区中央3 10 8− −
address:中央区築地1 1 1− −
address:相模原市中央区中央2 11 15− −
address:新潟市中央区学校町通1番町602 1− address:大阪市中央区久太郎町� P− 2 27− address:神戸市中央区雲井通5 1 1− −
address:福岡市中央区大名2 5 31− −
地理情報リソース 解決すべき課題
地名表記揺れ
ひらがな・カタカナ表記揺れ→カタカナに統一
ひらがな・カタカナ・漢字表記揺れ→カタカナに統一
が/ヶ/ケ
の/ノ/之
漢字表記揺れ →どちらか一つに統一
須惠 / 須恵
住所表記揺れ
番地表記揺れ→ 1-1-1 のような半角数値に統一
1丁目1番地→ ( 1 |1| 一 )( 丁目 | ー |-| の ) ( 1 |1| 一 )
地理情報リソース 提供方法
生データ 生データ サーバ環境 サーバ環境 API API
地理情報リソース 提供方法
生データ 生データ
地名データ
各エントリについて地名、緯度経度(代表点)、都道府
県、市区町村、大字、地名クラス(後述)を含む
可能であれば住所も含む
地理情報リソース 提供方法
生データ 生データ
地名データ:情報元 追加済み 451,014 エントリ
情報源 データ名 ライセンス
GeoNLP 日本の郡・市区町村( 2013 年 9
月)
CC0
日本の大字( 2012 年) CC-BY
全国の教育施設(含む保育所)
( 2006 年)
CC0
全国の避難施設( 2012 年) CC0
全国の都市公園( 2010 年 3 月) CC0
全国の医療機関( 2010 年 9 月) CC0
全国の市町村役場等及び公的集会施設
( 2010 年 4 月)
CC0
全国の美術館・博物館・図書館
( 2006 年)
CC0
日本の鉄道駅( 2012 年) CC-BY
地理情報リソース 提供方法
生データ 生データ
地名データ:情報元 追加検討中
情報源 データ ライセンス
Wikipedia 緯度経度を含むエントリから抽出 確認中
はてなキー
ワード 緯度経度を含むエントリから抽出 確認中
地理情報リソース 提供方法
生データ 生データ
提供フォーマット:
個々の地名データ: LTSV ( Labeled Tab Separated Val
ues)
曖昧性を考慮した地名データ:タブ区切り JSON
oaza: 旭ケ丘5丁目 prefecture: 北海道 type:point subcity: 中央区 latitude:43.03633475 body: 慈啓会病院 address: 北海道札幌市中央区旭ケ丘 5-6-50 longitude:141.32283289 city: 札幌市 ne_class: 医療施設
" 地名 "[TAB]"JSON"( 当該地名に対応する全てのエントリの記述)
地理情報リソース 提供方法
生データ 生データ
提供フォーマット:
type: 地名タイプ( prefecture, city, subcity, oaza, po
int )
prefecture: 都道府県
city: 区市町村
subcity: 特別区等
oaza: 大字
latitude: 緯度
longitude: 経度
ne_class 建物書類(医療施設、避難場所、学校、美術館)
地理情報リソース 提供方法
生データ 生データ
提供フォーマット:
Elasticsearch ダンプデータ(後述)
地名データ: 957,006 件
行政区画ポリゴンデータ: 237,065 件
地理情報リソース 提供方法
Amazon Machine Image で提供
Amazon Web Services に登録していればすぐに利用可能
Elasticsearch に下記データをインポート済み
行政区域ポリゴンデータ
総務省:「地図で見る統計(統計 GIS) 」から取得したデータ
http://e-stat.go.jp/SG2/eStatGIS/page/download.html
地名データ(生データと同様のもの)
サーバ環境
サーバ環境
地理情報リソース 提供方法
Elasitcsearch を用いる理由
容易に分散が可能
デフォルトで REST 形式の API を利用可能
GIS データを扱うことができる
ライセンスは Apache License vol.2
サーバ環境
サーバ環境
地理情報リソース 提供方法
コマンド例:
サーバ環境
サーバ環境
curl -XPOST
'localhost:9200/venues/venue/_search { "query": {
"filtered" : { "query" : {
"match_all" : {} },
"filter" : {
"geo_distance" : {
"distance" : "10km", "venue.pin" : {
"lat" : 41.841999, "lon" : 140.767019 }
} } } }} 周囲 10km の病院を探索
周囲 10km の病院を探索
地理情報リソース 提供方法
コマンド例:
サーバ環境
サーバ環境
curl -XPOST
'localhost:9200/towns/town/_search {
"query": {
"filtered" : { "query" : {
"match_all" : {} },
"filter" : {
"geo_shape": {
"town.geometry": { "shape": {
"type" : "envelope", "coordinates" :
[[136.919573,35.558386], [136.919573,35.558386]] }}}}}}}’ 緯度経度を行政区域に変換
緯度経度を行政区域に変換
地理情報リソース 提供方法
ジオコーディング
http://api.chidiri.com/cgi-bin/geocoding.cgi
INPUT:JSON
{"query"[{"keyword":" 亀田中野町 "}]}
OUTPUT:
{"result":{"status":"true",results[{"type":"oaza","prefecture":" 北海道 ","city":" 函館市 ", "bod y":" 亀田中野町 ", "latitude":"41.862987","longitude":"140.770176"}]}
緯度経度→行政区画変換
http://api.chidiri.com/cgi-bin/reverse_geocoding.cgi
INPUT:JSON
{"query"[{"latitude":41.841999, "longitude":140.767019}]}
OUTPUT:
{"result":{"status":"true",results[{"prefecture":" 北海道 ","city":" 函館市 ", "oaza":" 亀田中野町
", "latitude":"41.862987","longitude":"140.770176"}]}
API API
来週中に公開予定
地理情報リソース 提供方法
テキスト→緯度経度情報付与
http://api.chidiri.com/cgi-bin/text_geocoding.cgi
INPUT:JSON
{"query"[{"latitude":41.841999, "longitude":140.767019}]}
OUTPUT:
{"result":{"status":"true",results[{"prefecture":" 北海道 ","ci ty":" 函館市 ", "oaza":" 亀田中野町 ", "latitude":"41.862987","l ongitude":"140.770176"}]}
ユーザ投稿→居住地推定
http://api.chidiri.com/cgi-bin/user_geocoding.cgi
API API
来週中に公開予定
地理情報リソース 提供方法
住所表現正規化
http://api.chidiri.com/cgi-bin/normalize_address.cg
i
緯度経度、施設種類→近傍建物検索
http://api.chidiri.com/cgi-bin/normalize_address.cg
i
API API
来週中に公開予定
まとめ
災害情報システム構築のため地理情報基盤の整備を
行った。
地理情報データの配布
GIS 処理を容易に実行可能な Amazon Machine Image の配
布
GIS 処理を容易に実行可能な Elasticsearch ダンプデー
タの配布
GIS 処理のための API の提供
今後は、本システムを皆さんに活用して頂きたい
まとめ
今後の活動
下記アドレスにて、順次機能の公開・文書整備を行っていきます
ウェブサイト: http://chidri.com
配布リソース
API : http://api.chidri.com/cgi-bin/
実装予定機能
ランドマークデータの拡充
はてなキーワード/ Wikipedia
API へのコンビニ住所・緯度経度のインポート
クロールデータのため、配布は困難
Twitter 連携機能