DEWS2008 D10-4
任意 Web ページにおける地理情報提供方法の提案
田中 龍一
†井上 潮
‡†東京電機大学大学院工学研究科 〒101-8457 東京都千代田区神田錦町 2-2
E-mail: †[email protected], ‡[email protected]
あらまし あらまし あらまし
あらまし 現状の WebGIS(Web Geographic Information System)の利用形態としては, Web ページ管理者がハイパーリ ンクを明示的に作り, エンドユーザを WebGIS へと誘導させる方法が一般的である. 近年, WebGIS を Blog などの通 常の Web ページに埋め込むサービスが普及したことで, これまで以上に WebGIS を利用する機会が増えているが, 埋め込まれた地図の表示場所やページ上の表示位置などはページ管理者に依存しているため, エンドユーザにとっ て必ずしも必要でない情報が表示されている. 言い換えると, 管理者にとって WebGIS を組み込む手間がかかる. 地 図を表示する領域をあらかじめレイアウトする必要があり, 地図を見る必要のない利用者にとっては不要なものと なる. 本論文では, 住所情報をもとに任意の Web ページ上に, ページ遷移することやレイアウトを崩すことなく地 理情報を提供することにより, 管理者の負担を減らし, エンドユーザのニーズに応えることのできる地理情報提供 方法を提案する. キーワード キーワード キーワード キーワード WebGIS, 住所抽出, 地理情報
Providing Geographic Information to Arbitrary Web Pages
Ryuichi TANAKA
†and Ushio INOUE
‡†‡Graduate School of Information and Communication Engineering, Tokyo Denki University
2-2 Kanda-nishikicho, Chiyoda-ku, Tokyo, 101-8457 Japan
E-mail: †[email protected], ‡[email protected]
Abstract Current WebGIS(Web Geographic Information System) requires the Web page manager to make hyperlinks
explicitly, and guide end users to the WebGIS. Though, Web pages such as Blog on embedded WebGIS service is
increasing, opportunities using WebGIS increase more than before, it is uncertain whether the end users need the
embeded map attached to the page. This paper proposes a method to provide geographic information to arbitrary Web
pages without page transition or breaking page layout.
Key words WebGIS, Address extraction, Geographic Information
1. はじめ に
は じ め に
は じ め に
は じ め に
こ れ ま で , GIS(Geographic Information System)の 主 な 用 途 は , 地 図 に 顧 客 情 報 を 反 映 さ せ る エ リ ア マ ー ケ テ ィ ン グ や 電 力 や ガ ス な ど の イ ン フ ラ 施 設 管 理 , 建 設 な ど の 都 市 開 発 で あ り , 一 般 向 け で は な く , 一 部 の 専 門 技 術 者 ら が 利 用 対 象 と な っ て い た . エ ン ド ユ ー ザ に と っ て は 利 用 す る 機 会 が 少 な い だ け で な く , 導 入 ま で の 敷 居 も 高 か っ た .
し か し , Web の 普 及 が 進 ん だ こ と で , GIS を Web 上 か ら 利 用 す る こ と が で き る WebGIS が 普 及 し て き た . 一 般 的 に , WebGIS は 自 ら サ ー バ や ソ フ ト ウ ェ ア 等 の 環 境 を 用 意 す る 必 要 が な く , Web 上 か ら 無 償 で 使 用 で き る . サ イ バ ー マ ッ プ ・ ジ ャ パ ン の 「 Mapion」 や イ ン ク リ メ ン ト ・ ピ ー の 「 Mapfan」 と い っ た WebGIS を 専 門 に 扱 っ て い る 企 業 だ け で な く , Google の 「 Google Maps」や Yahoo!の「 Yahoo!地 図 情 報 」な ど 多 く の 企 業 が WebGIS サ ー ビ ス を 行 っ て い る . 初 期 の WebGIS は , 操 作 性 が 悪 く , 使 い や す い と は 言 え な か っ た が , 近 年 は Ajax 等 の 技 術 に よ り , ス タ ン ド ア ロ ン の ア プ リ ケ ー シ ョ ン と ほ ぼ 同 等 の 操 作 性 を 実 現 し て い る . ま た , GoogleMaps は , ブ ロ グ な ど で も エ ン ド ユ ー ザ が 個 人 的 な WebGIS 構 築 を 行 え る よ う な 仕 組 み の 「 Google Maps API」[1]を 提 供 し て お り , 非 商 用 で あ れ ば 無 料 で 利 用 す る こ と が で き る こ と も , 利 用 の 敷 居 を 低 く し て い る 要 因 の 一 つ と 言 え る . し か し , WebGIS の
操 作 性 は 向 上 し た も の の , WebGIS の 利 用 形 態 特 有 の 問 題 点 が あ る . 現 状 の WebGIS の 利 用 形 態 を ま と め る と 表 1 の よ う な る .
表 1 WebGIS サ ー ビ ス と WebGIS API サ ー ビ ス の 特 徴 WebGIS サ ー ビ ス ・ エ ン ド ユ ー ザ に WebGIS サ イ ト へ 直 接 来 て も ら う ・ 他 Web ペ ー ジ か ら の ハ イ パ ー リ ン ク に よ り WebGIS サ イ ト へ 誘 導 す る WebGIS API サ ー ビ ス ・ ホ ー ム ペ ー ジ や ブ ロ グ の 管 理 者 が 設 定 し た 地 図 を 提 供 す る ・ 提 供 す る 地 図 の 表 示 領 域 (レ イ ア ウ ト )が 必 要 に な る ま ず , WebGIS を 利 用 す る た め に は ブ ッ ク マ ー ク や 検 索 エ ン ジ ン , ハ イ パ ー リ ン ク か ら 辿 る な ど の ア ク シ ョ ン を 起 こ す 必 要 が あ る . し か し , こ の 方 法 の い ず れ も 元 々 の Web ペ ー ジ を 上 書 き す る か 別 ウ イ ン ド ウ , 別 タ ブ を 開 く こ と に な る . つ ま り , 一 時 的 に 元 々 の Web ペ ー ジ の 情 報 が 消 え る (隠 れ る )こ と に な る . 一 時 的 に 消 え て し ま え ば , 元 々 ど の よ う な 地 名 , あ る い は そ の 説 明 だ っ た の か が 分 か ら な く な り , 忘 れ て し ま う こ と す ら あ る . そ う い っ た , 情 報 が 一 時 的 に 消 え る と い う 問 題 が WebGIS API に よ り 解 消 さ れ る . 利 用 方 法 は 主 に , 企 業 や 個 人 の ホ ー ム ペ ー ジ , ブ ロ グ で 地 図 を 貼 り 付 け る と い う 形 で あ る . し か し , ホ ー ム ペ ー ジ や ブ ロ グ に 地 図 を 貼 り 付 け た 地 図 は , 本 当 に エ ン ド ユ ー ザ が そ の 地 図 の 情 報 を 必 要 と し て い る か は 不 明 確 で , そ う い っ た ユ ー ザ に と っ て は む し ろ 地 図 が 邪 魔 に な る 恐 れ が あ る . 必 要 と し て い る ユ ー ザ に と っ て も , 示 さ れ て い る 地 図 の 地 点 や 地 図 の 表 示 位 置 な ど は 管 理 者 の 一 存 に よ っ て 決 ま る た め , 管 理 者 の 提 供 す る 地 理 情 報 が ユ ー ザ の 求 め る 情 報 と 一 致 す る か は 分 か ら な い と 言 え る . 地 図 を 設 置 す る 管 理 者 に と っ て も , 表 示 領 域 を 確 保 し , レ イ ア ウ ト を 考 え る 必 要 性 が で て く る . こ の よ う に , 現 状 で は エ ン ド ユ ー ザ と 管 理 者 双 方 に 負 担 が あ る と 言 え る . そ こ で 本 論 文 で は , 地 図 が な い Web ペ ー ジ 上 で も 住 所 情 報 が あ れ ば ペ ー ジ 遷 移 す る こ と や レ イ ア ウ ト を 崩 す こ と な く 地 図 を 表 示 す る 方 法 を 提 案 す る . 管 理 者 の WebGIS 構 築 コ ス ト を 減 ら し , か つ , ユ ー ザ が 必 要 な 時 に だ け 地 図 を 見 た い と い う ニ ー ズ に 応 え る こ と で き る .
2. 関連研 究
関 連 研 究
関 連 研 究
関 連 研 究
Web ペ ー ジ 上 か ら 住 所 を 抽 出 す る サ ー ビ ス や API は い く つ か 公 開 さ れ て い る . 東 京 ガ ス ・ エ ン ジ ニ ア リ ン グ 株 式 会 社 の GeOAP[2]は , 住 所 を 含 む URL を フ ォ ー ム に 入 力 す る と 画 面 上 部 に 抽 出 し た 住 所 周 辺 の 地 図 を 表 示 し , 画 面 下 部 に 抽 出 結 果 を ハ イ パ ー リ ン ク 化 し た 元 ペ ー ジ を 表 示 す る (図 1). 既 存 の シ ス テ ム と マ ッ シ ュ ア ッ プ す る よ う な 作 り で は な い こ と か ら , エ ン ド ユ ー ザ 向 け で は あ る も の の , 開 発 者 向 け で は な い . OKILab.jp の 住 所 抽 出 API[3] は , 住 所 抽 出 を API(Application Program Interface)サ ー ビ ス と し て 提 供 し て い る (図 2). 既 に 一 つ の シ ス テ ム と し て 完 成 し て い る の で は な く , 他 の シ ス テ ム と マ ッ シ ュ ア ッ プ す る こ と が 前 提 と し て 作 ら れ て い る た め , 一 般 の 開 発 者 向 け の サ ー ビ ス で あ る . GeOAP の 問 題 点 は , 住 所 を 抽 出 す る た め に は 必 ず GeOAP の 抽 出 フ ォ ー ム に URL を 入 力 し な け れ ば な ら な い . 従 っ て , エ ン ド ユ ー ザ に と っ て こ の 作 業 を 何 度 も 行 う の は 負 担 と な る . 住 所 抽 出 API の 問 題 点 は , 抽 出 対 象 の 住 所 が 必 ず 都 道 府 県 名 か ら 始 ま ら な け れ ば な ら な い と い う 制 約 で あ る . Web 上 に は 住 所 の 表 記 が , 市 区 町 村 か ら 始 ま る 記 述 も 多 く 見 受 け ら れ る が , こ の 場 合 に は 適 用 す る こ と は で き な い . 図 1 GeOAP の 利 用 画 面 図 2 住 所 抽 出 API に よ る 抽 出 結 果3. 本研究
本 研 究
本 研 究
本 研 究 の
の
の 目 標
の
目 標
目 標
目 標 と
と
と
と ア プ ロ ー チ
ア プ ロ ー チ
ア プ ロ ー チ
ア プ ロ ー チ
本 章 で は , 実 現 す る べ き 目 標 を 掲 げ , 任 意 Web ペ ー ジ 上 で 地 理 情 報 を 提 供 す る た め の ア プ ロ ー チ と 適 用 す る 技 術 に つ い て 示 す . 3.1 目 標目 標目 標 目 標 任 意 の Web ペ ー ジ に お い て 地 理 情 報 を 提 供 す る た め に は , 次 の 項 目 を 満 足 す る よ う な 設 計 お よ び 実 装 を 目 標 と す る . ・ ハ イ パ ー リ ン ク に よ る ペ ー ジ 遷 移 を 無 く す ・ 元 々 の Web ペ ー ジ の レ イ ア ウ ト を 崩 さ な い ・ 誰 で も 簡 単 に 利 用 で き る 通 常 の WebGIS は , ハ イ パ ー リ ン ク か ら 辿 っ て 利 用 す る こ と が 多 い が , ハ イ パ ー リ ン ク は 必 ず 閲 覧 中 の Web ペ ー ジ の 遷 移 が 起 き る . そ れ を 防 ぐ た め , 閲 覧 中 の Web ペ ー ジ 上 で 地 図 を 表 示 さ せ る . そ の 際 に , 閲 覧 中 の Web ペ ー ジ の レ イ ア ウ ト を 崩 さ な い よ う な 表 示 の 仕 方 に す る . そ し て , 実 際 に 利 用 す る と き , イ ン ス ト ー ル や 実 行 方 法 を 複 雑 に せ ず , 誰 で も 簡 単 に 地 図 を 見 ら れ る よ う に す る . 3.2 WebGIS フレームワークフレームワークフレームワークフレームワーク TMAP のののの利 用利 用利 用利 用 本 研 究 で は , 我 々 が こ れ ま で 開 発 を 進 め て き た WebGIS フ レ ー ム ワ ー ク TMAP(TDU Map Access Processor)[4]を サ ー バ と し て 使 用 す る . TMAP は , 従 来 の オ ー プ ン ソ ー ス WebGIS に 見 ら れ た 操 作 性 の 悪 さ を 改 良 す る た め , 「 通 信 方 法 の 改 良 」「 通 信 デ ー タ 量 の 削 減 」「 描 画 処 理 量 の 削 減 」の 3 つ の ア プ ロ ー チ を 行 い 開 発 し た 高 イ ン タ ラ ク テ ィ ブ WebGIS フ レ ー ム ワ ー ク で あ る . TMAP は 地 図 描 画 エ ン ジ ン で あ る MapServer や 地 図 デ ー タ 格 納 用 の PostgreSQL/PostGIS な ど , シ ス テ ム を オ ー プ ン ソ ー ス ソ フ ト ウ ェ ア に よ っ て 構 築 し て い る . ま た , 地 図 デ ー タ は 国 土 地 理 院 の 数 値 地 図 2500 お よ び 25000 を 利 用 し て い る . 利 用 画 面 は 図 3 の よ う に な る . 企 業 な ど か ら 提 供 さ れ る WebGIS API は , 表 示 さ れ る 地 図 を 変 更 す る こ と は で き な い . ま た , 地 図 画 像 が ラ ス タ 画 像 で あ る た め , ス ケ ー ル レ ベ ル も 固 定 さ れ る . そ れ に 対 し て , TMAP は 地 図 画 像 が デ ー タ ベ ー ス か ら 動 的 に 生 成 す る ベ ク タ 画 像 で あ り , デ ー タ の 変 更 や 追 加 も 容 易 で あ る . TMAP の 特 徴 は , 高 イ ン タ ラ ク テ ィ ブ 性 と 内 部 デ ー タ 構 造 な ど を 変 更 で き る 点 に あ る . 3.3 適 用適 用適 用 する適 用するするする手 法手 法手 法手 法 ととと技 術と技 術技 術技 術 任 意 の Web ペ ー ジ 上 で 地 理 情 報 , つ ま り 地 図 を 提 供 す る た め の 位 置 に 関 す る 情 報 が 必 要 と な る . 本 研 究 図 3 TMAP の 利 用 画 面 の 例 で は , 日 本 の 住 所 情 報 を 対 象 と し た 抽 出 方 法 に つ い て 述 べ る . 住 所 を 抽 出 方 法 で 一 般 的 な の は , 住 所 辞 書 を 用 い て 形 態 素 解 析 を 行 い 抽 出 す る 方 法 で あ る [5][6]. 抽 出 の た め の 辞 書 と し て , 日 本 全 国 の 街 区 レ ベ ル の 住 所 デ ー タ な ど を 元 に 抽 出 対 象 の 住 所 の 形 態 素 解 析 を 行 う [7] し か し , 日 本 の 住 所 に 限 れ ば , 形 態 素 解 析 を 用 い な く て も 抽 出 で き る 可 能 性 が あ る . 日 本 の 住 所 の ほ ぼ 全 て は 図 4 の よ う に 分 解 す る こ と が で き る . 図 4 日 本 の 住 所 の 特 徴 具 体 的 に 住 所 を 分 解 し て み る と 図 5 の よ う に 表 す こ と が で き , 特 殊 な 住 所 で も 図 6 の よ う に 分 解 が で き る . ま た , 住 所 の 表 記 で 一 部 省 略 さ れ た 場 合 で あ っ て も , 省 略 さ れ る 部 分 は 頭 の 都 道 府 県 あ る い は 尾 の 番 地 や 号 が ほ と ん ど で , 中 の 市 区 町 村 が 省 略 さ れ る こ と は な い . 従 っ て , 分 解 し た 要 素 と 住 所 を マ ッ チ ン グ さ せ れ ば 住 所 抽 出 API に あ る よ う な 都 道 府 県 が 省 略 で き な い と い う 制 約 を 無 く す こ と が で き る . 図 5 通 常 の 住 所 分 解図 6 特 殊 な 住 所 分 解 次 に , 抽 出 し た 住 所 か ら 地 図 を 表 示 す る た め に ジ オ コ ー デ ィ ン グ を 行 う . ジ オ コ ー デ ィ ン グ に は 東 京 大 学 空 間 情 報 科 学 研 究 セ ン タ ー の CSIS シ ン プ ル ジ オ コ ー デ ィ ン グ 実 験 [8]利 用 す る . CSIS シ ン プ ル ジ オ コ ー デ ィ ン グ 実 験 は 、 日 本 語 で 記 述 さ れ た 住 所 ・ 地 名 ・ 駅 名 ・ 公 共 施 設 名 を 経 緯 度 に 変 換 し 、 結 果 を XML 形 式 で 返 す 「 シ ン プ ル ・ ジ オ コ ー デ ィ ン グ 」 処 理 を 行 う ジ オ コ ー デ ィ ン グ エ ン ジ ン の 性 能 評 価 の た め の 実 験 で あ る . 外 部 ア プ リ ケ ー シ ョ ン か ら 呼 び 出 し て 利 用 す る こ と が 前 提 と な る REST(Representational State Transfer)サ ー ビ ス と し て 設 計 し て あ る た め , 既 存 の シ ス テ ム に 組 み 込 み や す い . こ れ に よ り 得 ら れ た 経 緯 度 を 元 に 地 点 の 地 図 を 表 示 さ せ る . そ し て , こ れ ら の 処 理 を ペ ー ジ 遷 移 こ と な く 実 現 さ せ る . 従 来 (ハ イ パ ー リ ン ク や フ ォ ー ム の ク エ リ 送 信 な ど )の 方 法 で は , ペ ー ジ の 遷 移 が 発 生 し て し ま う . そ こ で , ペ ー ジ を 遷 移 さ せ ず に 外 部 の サ ー バ と 通 信 さ せ る 方 法 に JSONP(JSON with padding)を 用 い る . JSONP と は , JavaScript か ら HTTP を 通 じ て リ ク エ ス ト を 送 信 し , 返 っ て く る JSON(JavaScript Object Notation)デ ー タ を 指 定 し た コ ー ル バ ッ ク で 処 理 す る よ う な 仕 組 み で あ る (図 7). 2006 年 7 月 に RFC4627 に よ っ て 仕 様 が 規 定 さ れ た た め , 多 く の Web ブ ラ ウ ザ で 標 準 利 用 す る こ と が 出 来 る . JSONP の 最 大 の 利 点 は , ク ロ ス ド メ イ ン の 問 題 を 解 決 で き る こ と に あ る . 類 似 の 技 術 で あ る Ajax(Asynchronous Javascript + XML)は , 非 同 期 通 信 と DOM に よ り ペ ー ジ を 遷 移 さ せ ず に 処 理 を す る こ と が で き る が , 外 部 の サ ー バ と の 通 信 は で き な い (図 8).
4. システ ム
シ ス テ ム
シ ス テ ム
シ ス テ ム の
の
の
の 設 計
設 計
設 計 と
設 計
と
と
と 実 装
実 装
実 装
実 装
本 章 で は , 第 3 章 で 述 べ た 内 容 の 設 計 お よ び 実 装 と , 主 要 な ブ ラ ウ ザ で 利 用 で き る TMAP API に つ い て 述 べ る . 図 7 JSONP 図 8 JSONP と Ajax の 違 い 4.1 TMAP API のののの設 計設 計設 計設 計 第 3 章 の ア プ ロ ー チ を 設 計 に 反 映 さ せ た 結 果 , TMAP API の 処 理 の 流 れ は 図 9 の よ う に 表 す こ と が で き る . エ ン ド ユ ー ザ が 閲 覧 し て い る Web ペ ー ジ の 内 容 (文 書 ) を サ ー バ の 住 所 抽 出 部 に 渡 し , 抽 出 し た 住 所 を ジ オ コ ー デ ィ ン グ 部 で 経 緯 度 に 変 換 す る . そ し て , 得 ら れ た 経 緯 度 を TMAP に 渡 し , 対 応 す る 地 点 の 地 図 を ブ ラ ウ ザ に 返 す . こ の と き , ク ラ イ ア ン ト と サ ー バ の 通 信 は JSONP で 行 う . 4.2 住 所 抽 出住 所 抽 出住 所 抽 出住 所 抽 出 方 法方 法方 法方 法 日 本 の 住 所 は 図 4 の よ う に 分 割 で き る , と い う 特 徴 を 用 い て , 正 規 表 現 で マ ッ チ ン グ を 行 う Perl ラ イ ブ ラ リ 「 Geography::AddressExtract::Japan 」 [9] 用 い る . Geography::AddressExtract::Japan は , 日 本 の 住 所 デ ー タ を 都 道 府 県 , 群 市 区 町 村 , 字 の 4 つ に 分 解 し , こ れ ら の 組 み 合 わ せ パ タ ー ン を 結 合 し て 正 規 表 現 を 作 る . 図 10 は そ の 正 規 表 現 の 一 部 で あ る . Web ペ ー ジ に 含 ま れ る 住 所 を 取 得 す る 方 法 は 2 通 り あ る . 1 つ 目 は , Web ペ ー ジ 全 体 の 情 報 を 取 得 し て そ こ に 含 ま れ る 住 所 を 全 て 抽 出 す る 方 法 , 2 つ 目 は , Web ペ ー ジ の 住 所 部 分 を 選 択 し て そ こ に 含 ま れ る 住 所 を 全 て function callback(json){ … } callback({‘obj’ : [ {‘name’ : ‘alice’}, {‘name’ : ‘bob’} ] })図 9 処 理 の 流 れ 抽 出 す る 方 法 で あ る . 前 者 は サ ー バ か ら 対 象 の Web ペ ー ジ へ HTTP で ア ク セ ス し て HTML を 取 得 す る . そ し て , 取 得 し た HTML か ら 住 所 を 抽 出 す る . 抽 出 結 果 の 反 映 は 抽 出 前 の HTML を 保 存 し て お き , そ の HTML に 抽 出 結 果 を 示 し た 新 た な HTML を 表 示 さ せ る . 後 者 は 選 択 し た 文 字 列 を 取 得 す る が , 大 抵 の 場 合 , 住 所 が 含 ま れ る 文 字 列 は HTML タ グ に 囲 ま れ て い る た め , HTML の 構 造 も 取 得 し て お く . 文 字 列 と HTML の 構 造 を 一 緒 に 取 得 す る た め に , Document Object Model(DOM) Range[10]い る . ま た , 前 者 の よ う な ペ ー ジ 全 体 の 情 報 を 書 き 換 え る の で は な く , 選 択 部 分 の み を 書 き 換 え る た め , DOM Range に よ っ て 取 得 し た 範 囲 の 開 始 位 置 と 終 了 位 置 を 覚 え て お き (図 11), 結 果 反 映 時 に そ の 情 報 を 元 に 書 き 換 え る . そ し て , そ の 後 , 抽 出 し た 住 所 を 元 に ジ オ コ ー デ ィ ン グ を 行 う . 4.3 ジオコーディングジオコーディングジオコーディング方 法ジオコーディング方 法方 法 方 法 ジ オ コ ー デ ィ ン グ に 用 い る , CSIS シ ン プ ル ジ オ コ ー デ ィ ン グ 実 験 は , 変 換 結 果 を XML 形 式 で 返 す . TMAP API で は , 抽 出 し た 住 所 を ク エ リ と し て 取 得 し た XML を パ ー ス し , 経 緯 度 を TMAP に 渡 す . 4.4 サーバサーバサーバとのサーバとのとのとの通 信 方 法通 信 方 法通 信 方 法通 信 方 法 サ ー バ と の 通 信 は 全 て JSONP で 行 う . JSONP を 利 用 す る こ と で , TMAP API で 行 う べ き 全 て の 処 理 が ペ ー ジ 遷 移 す る こ と な く 実 現 で き る . こ の 際 に , JSONP は コ ー ル バ ッ ク 関 数 の 指 定 を す る こ と で , 処 理 を 連 続 的 に 行 う . 従 っ て , サ ー バ 側 で の 処 理 結 果 は , コ ー ル バ ッ ク 関 数 の 引 数 に あ た る JSON デ ー タ の 形 式 で 返 す よ う に 設 計 し た . 図 10 住 所 の 正 規 表 現 パ タ ー ン 図 11 DOM Range で 取 得 時 の HTML sub create { my $re =<<RE; (?-xism:(?: 北 (?: 海 道 (?:(?:(?:[ 幕 愛 本 津 湧 陸 ]| 喜 茂 |秩 父 )別 |(?:木 古 |黒 松 |知 )内 |浜 (?:頓 別 |中 )|長 (?: 万 部 | 沼 )|[ 乙 興 ] 部 |[ 池 沼 ] 田 | 大 [ 樹 空 ]| 当 [ 別 麻 ]|遠 [別 軽 ]|鹿 [追 部 ]|え り も |せ た な |む か わ |ニ セ コ |佐 呂 間 |倶 知 安 |奈 井 江 |妹 背 牛 |弟 子 屈 |洞 爺 湖 |訓 子 府 |七 飯 |下 川 |京 極 |仁 木 |今 金 |八 雲 |共 和 | 別 海 |剣 淵 |和 寒 |壮 瞥 |安 平 |平 取 |月 形 |栗 山 |比 布 | 由 仁 |福 島 |置 戸 |羅 臼 |羽 幌 |芽 室 |蘭 越 |雄 武 |鷹 栖 | 森 )町 |上 (?:川 (?:郡 … | 士 (?: 別 市 | 幌 町 )| 姫 (?: 島 村 | 路 市 )| 庄 (?: 内 町 | 原 市 )|座 間 (?:味 村 |市 )|弥 (?:富 市 |彦 村 )|旭 (?:川 ?市 | 区 )|杉 (?:並 区 |戸 町 )|根 (?:室 市 |羽 村 )|氷 (?:川 町 | 見 市 )| 浪 (?: 江 町 | 速 区 )| 渋 (?: 川 市 | 谷 区 )| 熱 (?: 海 市 |田 区 )|王 (?:寺 町 |滝 村 )|直 (?:島 町 |方 市 )|磐 (?: 梯 町 | 田 市 )| 箕 (?: 輪 町 | 面 市 )| 篠 (?: 山 市 | 栗 町 )| 舟 (?:形 町 | 橋 村 )| 茂 (?: 原 市 | 木 町 )| 見 (?: 沼 区 | 附 市 )| 飛 (?: 島 村 | 騨 市 )| 鳴 (?: 沢 村 | 門 市 )| 麻 (?: 生 区 | 績 村 )| 境 (?: 港 市 | 町 )| 府 中 [ 市 町 ]| 栄 [ 区 村 町 ]| 池 田 [市 町 ]|滑 川 [市 町 ])) RE $re =~ s/¥n//g; $re; }
4.5 TMAP API の
の
の
の実 装
実 装
実 装
実 装
以 上 に 述 べ て き た こ と を 実 装 す る . ま ず , TMAP API で の 住 所 抽 出 部 分 の 実 装 に つ い て 述 べ る . 住 所 抽 出 は Web 上 か ら 行 う こ と が で き , JSONP に よ っ て 結 果 を 返 す こ と が 必 要 と な る . ま た , ペ ー ジ 全 体 か ら の 取 得 と 選 択 文 字 列 か ら の 抽 出 の 2 通 り を 行 え る よ う に す る . こ れ に よ り 作 成 し た 住 所 抽 出 部 tmap_extract.pl は 次 の よ う な 処 理 を 行 う . (1) GET パ ラ メ ー タ 受 信 (URL ま た は 文 字 列 、 コ ー ル バ ッ ク ) (2) URL 取 得 の 場 合 は そ の URL に 問 い 合 わ せ て 内 容 を 取 得 、 文 字 列 の 場 合 は そ れ を 内 容 と す る (3) 内 容 を 全 て EUC-JP に エ ン コ ー ド (4) 内 容 か ら 住 所 抽 出 (5) 抽 出 結 果 を JSON に 変 換 し て 返 却 ま た , tmap_extract.pl の 問 い 合 わ せ 方 法 , お よ び 各 パ ラ メ ー タ お よ び リ ク エ ス ト の 例 を 図 12 に 示 す . 図 12 tmap_extract.pl の パ ラ メ ー タ と リ ク エ ス ト 例 tmap_extract.pl を 実 行 す る と , 図 13 の よ う に な る . 対 象 の Web ペ ー ジ に は「 東 京 都 千 代 田 区 神 田 錦 町 2-2」 と い う 住 所 が 含 ま れ て い る . 抽 出 結 果 か ら , 正 常 に 住 所 抽 出 が で き て い る こ と が 分 か る . こ の 住 所 抽 出 部 tmap_extract.pl を TMAP API に 組 み 込 ん だ 結 果 を 図 14 に 示 す . 抽 出 結 果 の 反 映 は , 抽 出 位 置 を 分 か り や す く す る た め に 抽 出 住 所 を ハ イ ラ イ ト し , 隣 に 地 図 へ の リ ン ク ア イ コ ン を 表 示 す る . こ の ア イ コ ン は ハ イ パ ー リ ン ク で は な い た め , ペ ー ジ が 遷 移 す る こ と は な い . 次 に 地 図 表 示 に つ い て 述 べ る . 地 図 リ ン ク ア イ コ ン を ク リ ッ ク す る と , 住 所 か ら 経 緯 度 を 求 め る ジ オ コ ー デ ィ ン グ が 開 始 さ れ る . そ し て TMAP に ア ク セ ス し , そ の 経 緯 度 に 対 応 し た 地 点 の 地 図 を 表 示 さ せ る (図 15). こ の よ う に オ ー バ ー レ イ 表 示 さ せ る こ と で , 元 ペ ー ジ の レ イ ア ウ ト を 崩 す こ と な く 表 示 で き る . TMAP API の 地 図 は 単 な る 画 像 で は な く , 拡 大 ・ 縮 小 、 移 動 な ど の 操 作 を す る こ と が で き る . こ れ は , TMAP API に よ っ て TMAP を 外 部 の Web ペ ー ジ 上 で 実 行 さ せ て い る た め 可 能 に な っ て い る . 地 図 の 表 示 は も と も と の Web ペ ー ジ 自 体 の 邪 魔 に な ら な い よ う に 設 計 し て い る た め 小 さ く な っ て い る . そ の た め , 地 図 が 見 え づ ら い こ と も あ る の で , TMAP API の ア イ コ ン に TMAP 地 図 ペ ー ジ へ の ハ イ パ ー リ ン ク も 用 意 し て い る .4.6 TMAP API の
の
の利 用 方 法
の
利 用 方 法
利 用 方 法
利 用 方 法
TMAP API は 主 要 な ブ ラ ウ ザ で あ る InternetExplorer と Firefox で 動 作 す る が , ブ ラ ウ ザ の 仕 様 が 異 な る た め , 利 用 方 法 も 異 な る . InternetExplorer で は , TMAP API 専 用 イ ン ス ト ー ラ を 使 っ て コ ン テ キ ス ト メ ニ ュ ー 拡 張 を 行 う . そ し て , 図 16 の よ う に 「 TMAP API」 と い う 項 目 が 現 れ る の で , そ れ を 選 択 す る と 準 備 完 了 と な る . 図 13 tmap_extract.pl の 住 所 抽 出 結 果 図 14 TMAP API の 住 所 抽 出 結 果 リ ク エ ス ト リ ク エ ス ト リ ク エ ス ト リ ク エ ス ト URL::: : http://team2.de.c.dendai.ac.jp/tmap2gv2 /api/pl/tmap_extract.pl パ ラ メ ー タ パ ラ メ ー タ パ ラ メ ー タ パ ラ メ ー タ ::: :
uri=( 任 意 の URL) 、 para=( 住 所 を 含 む 文 字 列 ) 、 callback=(コ ー ル バ ッ ク 関 数 名 ) リ ク エ ス ト リ ク エ ス ト リ ク エ ス ト リ ク エ ス ト 例例例 :例::: http://team2.de.c.dendai.ac.jp/tmap2gv2 /api/pl/tmap_extract.pl?uri=http://atom .dendai.ac.jp/info/060317_468.html &callback=call http://team2.de.c.dendai.ac.jp/tmap2gv2 /api/pl/tmap_extract.pl?para=こ こ は 東 京 都 千 代 田 区 神 田 錦 町 2-2 で す &callback=call http://atom.dendai.ac.jp/info/060317_468.html
図 15 TMAP API の 地 図 表 示
図 16 TMAP API の 読 み 込 み (InternetExplorer)
Firefox で は , 拡 張 プ ラ グ イ ン で あ る「 Greasemonkey」 を イ ン ス ト ー ル し , TMAP API の 起 動 フ ァ イ ル を 読 み 込 ま せ る . 成 功 す る と , 図 17 の よ う に 表 示 さ れ る . こ の よ う に 表 示 さ れ た ら 準 備 完 了 と な る .
図 17 TMAP API の 読 み 込 み (Firefox)
TMAP API の 実 行 は 表 2 の よ う に キ ー ボ ー ド に よ っ て 行 う . こ の よ う に 利 用 方 法 は 簡 単 で あ る た め , 知 識 の 乏 し い エ ン ド ユ ー ザ で あ っ て も 容 易 に 扱 う こ と が で き る と 思 わ れ る . 表 2 TMAP API の 抽 出 コ マ ン ド コ マ ン ド キ ー 操 作 ペ ー ジ 全 体 か ら 抽 出 Ctrl+Alt+A 文 字 列 を 選 択 し て 抽 出 Ctrl+Alt+S
5 住所抽 出
住 所 抽 出
住 所 抽 出 と
住 所 抽 出
と
と 地 図 表 示
と
地 図 表 示
地 図 表 示
地 図 表 示 の
の
の 検 証
の
検 証
検 証
検 証
TMAP API を 実 際 に 複 数 の 任 意 の Web ペ ー ジ で 実 行 さ せ て み た 時 , ど の 程 度 正 し く そ の 地 点 の 地 図 を 表 示 さ せ ら れ て い る か に つ い て 評 価 す る . 評 価 の 観 点 は , 住 所 が 正 し く 抽 出 さ れ て い る か , そ の 住 所 の 地 点 を 正 し く 地 図 で 表 示 で き て い る か で あ る . 特 に 後 者 を 評 価 す る た め に , 評 価 対 象 を 略 地 図 付 き の 任 意 の Web ペ ー ジ 100 件 を 無 作 為 に 選 ん だ . ま た , 周 囲 に 地 物 が 多 い と い う 理 由 か ら , 東 京 都 内 の 住 所 を 対 象 に し た . 条 件 を ま と め る と 以 下 の よ う に な る . 対 象 対 象対 象 対 象 (1) 住 所 と 略 地 図 が 一 緒 に 載 っ て い る 任 意 Web ペ ー ジ 100 件 (東 京 都 内 )を 対 象 (2) 略 地 図 は WebGIS に よ る も の で は な く 独 自 の 画 像 で あ る も の に 限 定 住 所 抽 出 住 所 抽 出住 所 抽 出 住 所 抽 出 基 準基 準基 準基 準 ととと 方 法と方 法方 法方 法 (1) 住 所 が 全 て 抽 出 で き て い る か ど う か (2) ペ ー ジ 全 体 (ALL), 文 字 列 選 択 (SELECT)の 2 種 類 で 抽 出 地 図 地 図地 図 地 図 のののの 基 準基 準基 準 基 準 (1) 略 地 図 と TMAP API 地 図 を 比 べ 、 表 示 地 点 が 一 致 し て い る か ど う か (2) 2 種 類 の 抽 出 の ど ち ら か 一 方 と 比 較 す る 住 所 抽 出 は , 丁 , 番 地 , 号 ま で と し , そ の 後 に 続 く 部 分 ( ビ ル 名 な ど ) は 対 象 と し な い . 略 地 図 は 特 定 の WebGIS(GoogleMaps な ど )を 利 用 し て い な い Web ペ ー ジ に 限 定 す る . そ の 理 由 は , 定 の WebGIS と 多 く 比 較 す る と , 街 区 , 道 路 , 地 物 な ど の 特 徴 が 常 に 同 じ で あ る た め , 一 致 の 基 準 が 偏 る 可 能 性 が 高 い . 独 自 の 略 地 図 で あ れ ば 特 徴 が ば ら ば ら と な り , 一 致 の 基 準 が 偏 り に く い た め で あ る . な お , 方 角 な ど が 異 な る 場 合 が あ る が , 道 路 や 街 区 な ど の 位 置 関 係 か ら 一 致 し て い る か ど う か を 判 断 す る . 抽 出 お よ び 地 図 表 示 の 結 果 を 表 3 お よ び 4 に 示 す .
表 3 任 意 Web ペ ー ジ 100 件 の 住 所 抽 出 結 果 抽 出 方 法 抽 出 成 功 抽 出 不 完 全 抽 出 失 敗 ALL 88 8 4 SELECT 94 4 2 ALL:ペ ー ジ 全 体 SELECT:文 字 列 選 択 表 4 TMAP API 地 図 と 略 地 図 の 表 示 位 置 比 較 一 致 抽 出 に 問 題 略 地 図 に 問 題 TMAP に 問 題 84 4 7 5 表 3 よ り , 文 字 列 選 択 に よ る 抽 出 の 方 が 成 功 し 易 い こ と が 分 か る . ペ ー ジ 全 体 か ら 抽 出 す る 場 合 は , HTML 要 素 が 膨 大 に な る こ と も あ り , 通 信 の 遅 延 な ど の 影 響 も 考 え ら れ る . 従 っ て , 通 信 す る デ ー タ 量 が 少 な い 文 字 列 選 択 の 方 が , 成 功 数 が 多 く な っ て い る と 考 え ら れ る . 抽 出 の 失 敗 は , 断 片 的 に し か 抽 出 し な い 場 合 と ま っ た く 抽 出 で き な い 場 合 の 2 通 り が 確 認 さ れ た . 断 片 的 に 抽 出 す る 例 と し て , 「 東 京 都 千 代 田 区 五 番 町 7 番 地 」 と い う 住 所 が 挙 げ ら れ る . こ の よ う に 町 名 で あ る 「 五 番 町 」 を 番 地 と 誤 っ て 解 釈 し て し ま う こ と が あ っ た . こ の 問 題 は Geography::AddressExtract::Japan ラ イ ブ ラ リ の 正 規 表 現 パ タ ー ン を 書 き 換 え る こ と で 対 応 で き る と 考 え ら れ る . ま た , 住 所 の 文 字 列 が 複 数 の フ ォ ン ト で 記 述 さ れ て い る も の も 正 し く 取 得 で き な か っ た . 対 策 と し て は , 抽 出 す る 前 に HTML タ グ を 除 去 す れ ば 良 い . た だ し , 住 所 文 字 列 が 複 数 の フ ォ ン ト と い う こ と は 稀 で あ り , HTML タ グ を 除 去 す る オ ー バ ヘ ッ ド に 見 合 う の か と い う の は 検 討 す る 必 要 が あ る . そ し て , 全 く 抽 出 で き な か っ た 場 合 は 文 字 コ ー ド 推 定 に 問 題 が あ る と 思 わ れ る . 住 所 抽 出 プ ロ グ ラ ム で は , 取 得 し た ペ ー ジ の 内 容 の 文 字 コ ー ド 変 換 を 行 う 際 に 元 ペ ー ジ の 文 字 コ ー ド 推 定 も 実 行 し て い る . た だ し , 推 定 が 失 敗 す る 場 合 も あ る た め , 抽 出 も 失 敗 し て い る と 思 わ れ る . TMAP API 地 図 と 略 地 図 の 比 較 結 果 に つ い て , 略 地 図 , TMAP API 地 図 の ど ち ら か が 見 辛 く 一 致 し て い る と は み な せ な い も の が あ っ た . 略 地 図 は そ れ 自 体 が 簡 略 化 さ れ す ぎ て い て 分 か り づ ら い (街 区 や 道 路 が 省 略 さ れ す ぎ て い る な ど )こ と , TMAP は 地 物 デ ー タ が な い こ と が 原 因 で あ っ た . こ れ は 地 図 デ ー タ の 充 実 化 で 解 決 で き る と 思 わ れ る . た だ , 場 所 が 大 き く ず れ た り す る こ と は な か っ た の で , ジ オ コ ー デ ィ ン グ に 問 題 は な い と 言 え る .
6 今後
今 後
今 後
今 後 の
の
の
の 課 題
課 題
課 題
課 題
検 証 の 結 果 よ り , 現 状 の TMAP API は 抽 出 自 体 の 失 敗 や 住 所 の 取 得 の 失 敗 , 表 示 す る 地 図 の 問 題 が 明 ら か と な っ た . 今 後 は ど の よ う な 文 字 列 で 抽 出 が 失 敗 す る の か , ま た , ど の よ う な 条 件 で 住 所 の 取 得 が 失 敗 す る の か な ど , 失 敗 時 の 状 況 に つ い て よ り 詳 し く 検 証 し て い く 予 定 で あ る .7 まとめ
ま と め
ま と め
ま と め
WebGIS フ レ ー ム ワ ー ク TMAP に よ り 提 供 さ れ る 地 図 を , 住 所 情 報 を 元 に 任 意 Web ペ ー ジ 上 で 利 用 で き る よ う な 仕 組 み TMAP API を 提 案 し た . 利 用 方 法 も 簡 略 化 し , 2 つ の 主 要 ブ ラ ウ ザ で そ れ ぞ れ 利 用 で き る よ う す る こ と で , 多 く の エ ン ド ユ ー ザ 向 け の 手 間 と 管 理 者 の WebGIS 設 置 負 担 を 減 ら す 仕 組 み に つ い て 述 べ た . そ し て , 任 意 Web ペ ー ジ 上 で 動 作 さ せ た と き の 住 所 の 取 得 や 抽 出 , 地 図 表 示 に つ い て 検 証 し た . さ ら に 今 後 の 課 題 に つ い て 述 べ た .文
文
文
文 献
献
献
献
[1] GoogleMaps API http://code.google.com/apis/maps/index.html [2] GeOAP. http://www.geoap.jp/service/index_e.html. [3] OKILab.jp – 住 所 抽 出 API. http://okilab.jp/project/location/2007/02/api_3.html. [4] 田 中 龍 一 , 泉 陽 一 郎 , 岩 根 一 樹 , 井 上 潮 : "非 同 期 通 信 に よ る 高 イ ン タ ラ ク テ ィ ブ WebGIS フ レ ー ム ワ ー ク の 研 究 ― TMAP2 の 設 計 と 実 装 ― ", DEWS2007, B7-2, 2007. [5] 金 木 雄 太 , 山 田 剛 一 , 絹 川 博 之 , 中 川 裕 志 : "地 名 辞 書 を 利 用 し た 地 名 の 曖 昧 解 消 と 文 書 の 地 域 分 類 ", 人 工 知 能 学 会 全 国 大 会 ( 第 19 回 ), 2E1-03, 2005 [6] 横 路 誠 司 , 高 橋 克 巳 , 三 浦 信 幸 , 島 健 一 : "位 置 指 向 の 情 報 の 収 集 , 構 造 化 お よ び 検 索 手 法 ", 情 報 処 理 学 会 論 文 誌 Vol.41 No.7(20000715) pp.1987-1998 [7] 国 土 交 通 省 国 土 計 画 局 - 街 区 レ ベ ル 位 置 参 照 情 報 ダ ウ ン ロ ー ド サ ー ビ ス http://nlftp.mlit.go.jp/isj/ [8] CSIS シ ン プ ル ジ オ コ ー デ ィ ン グ 実 験 http://geocode.csis.u-tokyo.ac.jp/cgi-bin/simple_geo code.cgi[9] Shibuya Perl Mongers - 自 然 文 書 か ら 日 本 の 住 所 を 頑 張 っ て 抽 出
http://tech.yappo.jp/docs/20061020shibuya.pm/ [10] Document Object Model Range
http://www.w3.org/TR/DOM-Level-2-Traversal-Rang e/ranges.html