持続可能な空間コンテンツ流通の枠組みに関して
1.インターネット上の空間コンテンツ流通のフレームワークの現状と問題点
1.1 ウェブコンテンツの意義とサーチエンジンによるバリューチェーン インターネットやケータイ電話などに代表されるIT の発達と普及により,われわれ人類 が手にした情報コンテンツの量・質・迅速性は,人類始まって以来最も優れたものになっ ており,われわれの生活を豊かにしている。ウェブ自体が情報の宝庫であり,われわれの 生活やビジネスの場面場面でウェブにアクセスし,必要な情報を得て,賢く,そして,無 駄無く活動できるようになってきている。従来の紙とマスメディアを主体とした情報コン テンツ流通の枠組みは,根本から変りつつある。このように,以前に比べるとわれわれは 必要な情報を楽に手に入れることができるようになった。一方で,情報が多過ぎて困る状 況にも陥っている。そこで,たくさんの情報の中から自分が意図するもの,つまり,信頼 性の高い情報だけを手っ取り早く得る手段として,google[1]に代表されるウェブサーチエ ンジンが台頭するようになった。ウェブサーチエンジンは,キーワードでウェブページ群 を単に検索するだけではなく,そのコンテンツが信頼おけるかどうかを,そのページに対 する他のページからのリンクが多いかどうかというような間接的な社会的信用を表す指標 を利用した社会的フィルタリング(social filtering)を利用して自動的なランキングを実現 し,提供するコンテンツの信頼性を上げている。つまり,ウェブサーチエンジンはコンテ ンツだけではなくランキングも利用者に提供している。このウェブサーチエンジンは,現 在では,われわれの生活およびビジネスにおいて不可欠な存在となっている。別の言い方 をすれば,ウェブサーチエンジンはウェブコンテンツをキーワードで検索し,ウェブペー ジを重要な順番で串刺しにする便利な道具であり(図1参照),百科事典に代わる,あるい はそれ以上の存在となっており,ウェブと共に人類にとって不可欠で普遍的な道具となっ ている。この串刺しを繰り返すことは,ウェブ情報空間から必要とする情報を連想的に抽 出することであり,情報から関連する情報を逐次的にたぐり出すという意味から,人間を 介したバリューチェーン(value chain)の原点と言える。そして,ウェブコンテンツにア クセスするときに,まず,ウェブサーチエンジンから始めることが多く,この意味からウ ェブサーチエンジンがポータルサイト(portal site)となる場合が多い。ポータルサイトは さまざまな分野ごとにあり,この意味からは,ウェブサーチエンジンは,多くのポータル サイトを串刺しにするメタポータルサイトとも考えられる。図1.ウェブサーチ:キーワードによるウェブページの串刺し
ウェブサーチエンジンの別の使い方として,DNS(Domain Name Service)の代わりに使わ れることもある。たとえば,朝日新聞のウェブページに行きたい場合に,人間が連想記憶 しやすいドメイン名として "www.asahi.com"という URL を入力する代わりに,ウェブサ ーチエンジンでわれわれが日常的に使っている言葉と同じように"朝日新聞"と直接入力し, 検索結果として朝日新聞のウェブページへのリンクを出力させ,それをクリックすること により”www.asahi.com”にアクセスする,というように,本来の情報検索とは違い,わ れわれにとって自然なウェブへのアクセスの枠組みを提供している。この意味から,ウェ ブサーチエンジンは,ユニバーサルなディレクトリサービスを実現しているとも言える。 現在では,ウェブサーチエンジンをうまく使える人がインターネットあるいは情報をうま く使える人となっている。もしウェブサーチエンジンが今有料化されたとしたら,たぶん 多くの人はお金を払ってでも利用するだろう。なぜなら,ウェブサーチエンジンはすでに われわれの生活およびビジネスには不可欠な道具になってしまっているからだ。われわれ は,本当に有用である,あるいは,必要であると考えたら,ウェブサービスにもお金を払 うはずである。逆に,お金を払いたくない,と思っているウェブサービスは,お金を払う だけの品質のサービスを実現していない,とも考えて良いだろう。実際には,ウェブサー チエンジンは,消費者からみると無料のシステムだが,ポータルサイトとしての広告料,
キーワード空間
キーワード
という矢
あるいはログ解析などのマーケッティング戦略のための情報販売などできちんとビジネス として成り立っている。このように,IT とともに生まれたビジネスではすでに先駆的な成 功例があり,これらから学ぶことは多い。一方,ウェブサーチエンジンを使って悪いこと をする人々も当然ながら出て来る。たとえば,爆弾の作り方のページを作ったり,それに アクセスして実際にテロを起こすなどといった可能性がある。あらゆる道具には長所と短 所は共に備えているが,悪用をいかに少なくするかを社会規範としていかに実現するかは 大きな課題であり,これらに関しても多方面から検討がなされている。 1.2 日本における空間コンテンツ消費の現状と問題点 今回の記事の主題である,現実世界の位置の情報を含むコンテンツ(以降,空間コンテ ンツと呼ぶ)を考えた場合に,今のインターネットの枠組みの延長として,ある位置の情 報を検索する枠組みはほとんど整っていない。もちろん,個々の空間情報サービスに関し ては,日本は世界的にも先進的なケースは多い。たとえば,乗り換え案内,経路地図,地 図ASP,GPS ケータイ,などのサービスは,現在の IT の状況を考えるとよくできており, 著者も外出するときは頻繁に利用している。そして,それらはある意味ですでに満足が行 くものとなっている。しかし,この満足も,次に来る高度な空間サービスの真実を利用者 が知らないことから来る満足であると考えられる。一例としては,現在の空間ビジネスの 枠組みのほとんどはオープン化の枠組みではなく,むしろ囲い込みの枠組みで実現されて おり,その弊害があまり知られてはいない。オープン化の考えからすると,現在の空間ビ ジネスの形態は一過性のものかもしれない。一方,インターネットに代表されるオープン 化が絶対に正しいという訳ではなく,オープン化の考え方では,ビジネスモデルを作り出 すのは現在のさまざまな状況からすると現実的でないかもしれない。この意味で,現在の 空間ビジネスは,ある意味で最適化された状態であるとも言える。一方,今後,空間コン テンツの流通のあり方・認識の仕方を変えることにより,現在とは異なる,より高度な空 間ビジネスモデルを作り出すことができるのではないかと考えられる。これにより,一般 市民は普段から,あるいは常に位置情報を使うことができる環境を手にし,前節で紹介し たサーチエンジンと同様に,生活とビジネスにおいて不可欠な道具になると期待できる。 オープン化に関して,現在の空間ビジネスの1つの問題点を具体的に説明すると,現状 は,ある地図プロバイダのセッションの中でのみ空間サービスは利用できる形態になって いる。複数のプロバイダのそれぞれのコンテンツを集めて,あるいは,それらを組み合わ せて高度利用できる環境には至っていない。具体的には,M さんは A 銀行と B 銀行を使っ ているが,A 銀行は X 社の地図 ASP で提供され,B 銀行は Y 社の地図 ASP で提供されて いる場合に,A 銀行と B 銀行の ATM を1枚の地図上で確認したくても,それはできない。 また,経路案内でも,A 銀行の ATM と B 銀行の ATM と C 薬局を通って D 美術館に行き たい,などといった複合的な経路検索はできないのが現状である。また,A 銀行の ATM を 表示する地図は,画像の地図であるので,実際には,現在はまだ空間データがインターネ
ット上を流通してはおらず,画像データが流通しているのが実状であり,そのために情報 の再利用性はほとんど無い。むしろ,再利用性をなくして,各社の地図ASP に毎回アクセ スすることにより,ポータルサイトとしての機能を実現してビジネスを成立させている。 これは,地図ASP の論理であり,銀行 A のようなコンテンツ提供元が無料で POI(Point of Interest)により位置情報を含む空間コンテンツを消費者に流通させるのは問題ではなく, むしろ,ダイレクトメールのような宣伝の効果があると考えられる。逆に,電子メールで, 位置情報を顧客に配布することも可能であろう。ただし,ATM が廃止された場合などは保 持している空間コンテンツからは分からない,などの情報の新鮮さが保証できない問題が 生じるが,これも空間コンテンツの中にXLink などを用いて自動更新の機能を使えば,実 現することは比較的容易である。しかし,ここで問題となるのは,消費者がPOI を保持し ていたとして,それを閲覧する手段あるいは環境が現在まだ実現できていないことである。 たとえば,G-XML で記述された POI アーカイブを,PC 地図や地図 ASP で取り込めたり, あるいは,書き出したりする機能があれば,消費者は,自分に必要なPOI を集めて管理す るようになるだろう。このように,POI は,現在の地図 ASP やダイレクトメールと直結し, すぐにでも置き換わるものになるかもしれない。電子メールでPOI が流通できると考える と,流通に制限はほとんど無いと言って良く,個人で集めたPOI アーカイブを友人に渡す ことも普段の活動の一部になるだろう。名刺もPOI に置き換わるかもしれない。また,電 子メールのシグネチャに位置情報を付けるのが一般的になると,電子メール自体がPOI に なる可能性もある。電子メールの整理のときに,地図を使って整理したり,過去の電子メ ールを位置で検索するというのも近い将来日常的になるかもしれない。ウェブページにも 位置情報タグを入れることが普及すると,ウェブ自体のPOI 化が進行するだろう。POI 化 したウェブ空間は,キーワードだけでなく,地図やGPS を使って,ある場所あるいは自分 のいる位置でさまざまなウェブページにアクセスするのは日常的なことになるだろう(図 2参照)。朝日新聞のウェブページにアクセスするのを,朝日新聞の本社や販売店のウェブ ページを位置キーにしてアクセスすることで間接的にたどることも日常になるかもしれな い。これは,前節で自然言語のキーワードを使ってウェブページにアクセスする手段と似 ており,位置キーでウェブページにアクセスすることはわれわれの日常生活の活動に近く 自然な枠組みになるだろう。現在は,ある空間コンテンツプロバイダが保持している空間 コンテンツはウェブ空間とは別の独自の情報空間を形成しており,その閉じた情報空間だ けを検索対象にサービスを実現しているのに対し,ウェブサーチエンジンでオープンな空 間コンテンツが検索できるようになることは,世界中のウェブコンテンツを,従来のキー ワードに混ぜて,位置キーでも検索可能になることを意味する。このように,位置情報に よる情報検索は,キーワードによる検索の拡張として扱うことができる。
図2.位置キーによるウェブサーチ:位置によるウェブページの串刺し 1.3 空間コンテンツのソース このようなオープンな空間コンテンツ流通を考えた場合,背景図を利用したいためにPC 地図や地図ASP を利用するということが考えられるが,カシミール3D[2]のような,国土 交通省国土地理院[3]が公開している個人利用ならば無料の地図データを扱えるフリーソフ トがあり,今後,この背景図のためだけにPC 地図や地図 ASP を使う必要はなくなるかも しれない。しかし,日常的に地図を使うようになると,やはり,品質が高い,リアルタイ ム更新が可能である地図,あるいは,デザイン性の高い地図の必要性がより認識され,今 以上にPC 地図や地図 ASP は売れるようになるだろう。 今後は,政府や自治体などが保有している空間情報については,市民に対して可能な限 りデジタル地理情報の形態で情報公開を進めて行くと考えられる。公共的な施設などはPOI として公開することにより,一般市民だけでなく,地図ASP やコンテンツプロバイダにと っても有用な情報となるだろう。
POI の例としてはいろいろと考えられる。POI の普及とともに,個人や NPO が作った無 料のPOI も出回るだろう。また,企業は宣伝を兼ねて POI を電子チラシとして配るように なるだろう。観光ガイドやレストランガイドの付録でPOI が付くことも予想できる。これ らのPOI はパソコン上での閲覧が可能であるとともに,ケータイや PDA での閲覧も一般 的になるだろう。
地理空間
位置キー
という矢
1.4 簡単な位置情報の生成の枠組み POI を作るときの一番の障害は,位置情報を生成することである。 GPS ケータイにより 位置情報がより簡単に生成できるようになると,今後,電子メールの数だけ,あるいは, デジタル写真の数だけのPOI が作成されるようになり,それらがいろいろな手段で流通し, 空間コンテンツが氾濫する時代も来るだろう。この空間コンテンツの氾濫により,空間コ ンテンツに対してどのようにしてランキングを付けるか,品質保証を行うか,カテゴリ化 するかなど,さまざまな問題が明らかになってくるだろう。 GPS ケータイの普及と実際に使用に耐える機能の実現にはまだ数年はかかるのではない かと考えられる。これを待たなくても,住所,郵便番号,電話番号などの間接位置参照情 報は,現在でもすでに流通しており,それらを直接位置情報(たとえば,緯度経度)に変 換するジオコーディング(geocoding)サービスが低価格で安定して簡単に一般利用される ようになると,必ずしも緯度経度などの直接的な位置データを含まない空間コンテンツも POI として扱うことができるので,POI として扱えるコンテンツの範囲を広げることにな る。具体的には,国土交通省 国土計画局 国土情報整備室が提供している街区レベル位置 参照情報[4]を利用して,住所情報を絶対座標空間の位置情報へ変換する無料のサービスは, 著者が所属している東京大学空間情報科学研究センター[5]で独自開発したアドレスマッチ ングサービス[6]としてすでに公開されている。このアドレスマッチングサービスのソフト ウェアはオープンソースであり,今後,多くの機関で,独自の住所情報を対象にしたアド レスマッチングサービスが立ち上げられ,いろいろな場面で位置情報が有効活用されるき っかけになると予想できる。このアドレスマッチングサービスおよびその応用の空間文書 管理システムに関しては,後の節で詳しく説明する。 GPS やジオコーディングとは別の位置情報の生成の枠組みとしては,たとえば,コンビ ニや喫茶店などでもらう領収書を電子化して,自分の時空間行動履歴として利用できない かと考えられる。この場合,レジで紙の領収書をもらうのではなく,bluetooth や赤外線な どの無線通信でケータイかPDA にデジタル領収書をもらう。デジタル領収書には,場所と 時間の情報が入っているので,これはそのまま家計簿ソフトで利用でき,同時に,時空間 行動履歴アーカイブとして有益な環境を実現することになるだろう。少なくとも,消費者 の購買履歴として,企業が持っているログ情報のうち,自分に関するものは閲覧できる, あるいは,コピーする権利があるようにすることは可能ではないだろうか。一方,このよ うな枠組みを実現するためには,ハードウェアおよびソフトウェアのインフラの整備も必 要であり,デジタル領収書が紙の領収書と同等のものとして認められるようにするための 法律改正などさまざまな制度改革が必要になるだろう。 1.5 空間コンテンツの信頼性と主情報でない位置タグ 最初に述べたように,コンテンツはその信頼性が極めて重要である。逆に言えば,信頼 性が高いコンテンツなら,多くの人々は喜んでそれ相当のお金を払って購入するだろう。
現在のコンテンツプロバイダの問題は,そこに保持されている情報に網羅性がなく,また, ランキングに関しても公平性が保たれていない点である。今後,POI による無料の空間コ ンテンツ流通が普及すると,インターネット上の情報空間の一部となるので,この網羅性 という点は改善されると考えられる。また,ランキングに関しても,適切なランキングを 行うコンテンンツロバイダの人気が上がるのは間違いない。そのランキングを作るために, コンテンツプロバイダのスタッフがランキングを労働集約的に作って行くのには限界もあ り,人がランキングするのでは,情報の新鮮さを保つことも現実的ではない。したがって, 空間コンテンツを使うユーザからの声をうまく拾い上げる仕組みが必要であるが,これは, そのコンテンツプロバイダの人気が出ないと人が集まらないということであり,卵が先か, 鶏が先か,の問題となる。また,今のウェブのランキングは,一般に,口コミのランキン グよりも正しい情報が提供できていないという事実もある。たとえば,夕食を食べるのに 同じ額を出して,より美味しいものを食べられるのなら,少しのお金を払ってでも良いお 店を紹介してもらうのは,実は,消費者にとっては,全体としての満足感からすると得を したことになる。消費者は,一般的な情報ではなく,リアルタイムの情報を必要としてい る場合も多い。今,新しいネタは何であるか,目玉は何か,新しいサービスはあるのか, メニューに何があるか,料金はどのくらいになりそうか,料理人は昔と同じか,今込んで いるか,などの実時間性が高いコンテンツならお金を払うものである。 このように,これらの空間コンテンツは,決して位置情報が主では無く,コンテンツが 主であり,位置情報は,便利に検索するための検索キーであり,また,バリューチェーン を実現するものでもある。したがって,名称も空間コンテンツというよりは,空間情報付 きコンテンツと呼ぶべきかもしれない。つまり,「空間コンテンツの流通の普及」と言うよ りは,「空間タグと空間キーの普及」と言った方が正しいかもしれない。ここで空間タグと は,POI を構成する位置情報タグを意味し,この空間タグは,どのようなマルチメディア にも付加することができる。一方,空間キーとは,空間タグを検索するための検索キーを 意味する。GIS では,位置情報は主データであったが,IT 一般では,位置情報は,時間情 報と同じく付属情報であることを忘れてはいけないだろう。しかし,位置情報は,現実世 界の実体にアクセスするための重要な情報であり,現実世界でのわれわれの移動を支援し てくれる極めて重要な情報である。今までは,この位置情報は,紙地図の上で,各人の空 間認知を使って地図と現実世界との対応関係を導き出して,われわれの活動に役立てて来 た。これからは,POI のようなデジタル位置情報により,機械での判読が可能になるため, 人が見るだけではない高度な位置検索や空間解析を実現できるようになると期待される。 1.6 空間コンテンツ流通のビジネスモデルの分類学的とらえ方 空間コンテンツ流通を,ビジネス(B),消費者(C),政府や自治体(G),非営利組織(NPO) の4つの範疇での相互のコンテンツフローに分類して,空間ビジネスの形態の組み合わせ を考えると,それぞれの形態の位置付けと違いを比較的分かりやすく理解することができ
る。(ただし,ここで非営利組織をNPO と略しているが,本節では,NPO という言葉を正 確な定義としてではなく,一般的な意味として用いている。たとえば,ボランティアベー スで社会に貢献する非営利組織の一般的な概念としてNPO という言葉を使うことにする。 著者が所属する大学も,本節では,NPO の1つに含ませて議論を進めさせていただく。) ウェブは,初期の段階では,大学などを中心とする研究機関というNPO が中心になって, 研究成果や研究データなどを公表したり,共有したりする仕組みとして出現した。つまり, 最初のウェブは, NPO2NPO の形態の情報交換が中心であった。そして,研究情報以外の, 生活や趣味や遊びに関する情報などの共有や公開を行うようになり,その有用性が認めら れ,NPO を中心に一般市民へも情報公開する方向に拡大していき, NPO2C に発展した。 この段階で,ビジネスを抜きにして,ウェブは一般市民が楽しめるようなものになった。 これがさらに拡大し,消費者を対象にしたビジネスにも利用できることが認知され,B2C の枠組みの形態へと発展した。この B2C のような使われ方がなされるようになってから, ウェブの有効性が本格的に認められるようになった。このB2C の枠組みにより,ウェブ上 でのビジネスは実現し,ウェブサーバが世界中に広まった。現在,公開されているウェブ サーバだけでも,その数は4千万台はあると言われている[7]。実際には,サーバは億の単 位であると考えられ,今後も,その台数は増え続けるだろう。このウェブサーバは,B2C の段階では,人が情報を閲覧することを主な目的に,ウェブクライアントに情報を送るた めに利用されている。しかし,世界中にこれだけたくさんのウェブサーバがあるのだから, 企業間のデータ交換にもウェブサーバを利用することが得策と考えられるようになり, B2B の枠組みが出現した。この枠組みでは,人が見る HTML 文書データではなく,きちん と構造化されたデータベースの情報を表現する構造化データを交換する必要があり,それ に適するXML が誕生したと言われている。 XML の使い方は,機械が理解できる構造化デ ータの表現だけでなく,人が読むHTML の構造記述にも XHTML などで利用されている。 実際には,両者の中間で,人が読め,かつ機械も読めるようなデータの構造として利用す るのも実用的であると考えられる。この意味からも,XML 文書は半構造化データと呼ばれ ることもある。 一方,GIS の分野を見てみると,まずは,各省庁間の壁を取り外して,共有できる空間 データは共有できるようにするために,G2G のデータ流通の枠組みが重要視されるように なった。GIS の導入により,政府および自治体の効率化を図るための構造改革を推進する カギになると期待されている。G2G に関しては,ウェブを使わなくても,統合型 GIS とし て従来のクライアントとサーバ型の枠組みで実現することも可能である。しかし,現在の ウェブ技術の社会への普及を考えると,ウェブを使う方が全体として効率化が図られると 考えられている。たとえば,すでに多くの安定したツールがあるという意味から,ウェブ のプラットフォームにする利点は多い。一方,市民に対しては,政府や自治体が保有して いるデジタル情報を一般公開するという意味で,G2C の枠組みが推進されることは市民生 活およびビジネス展開においても重要である。たとえば,台帳のような表の形でデジタル
情報を公開する場合に,公的施設の場所に関する情報もPOI のような再利用性の高い形式 で提供することができ,これが直接,空間コンテンツ流通のG2C という形態の実現につな がる。たとえば,自治体から提供されたPOI 集合を,背景となる地図の上に重ねて情報提 供する場合に,もし自治体が背景地図サービスを独力で実現できない場合は,G2C という データフローの途中に,地図プロバイダ(B)が入り, G2B2C という枠組みとなる。これ は,背景地図や空間コンテンツのディストリビューションをアウトソウシングする方が効 率的になる場合もあることを示唆している。このような3段階の枠組みは,むしろ,ビジ ネスにおける地図利用では政府や自治体よりもずいぶんと進んで利用されている。たとえ ば,インターネット上での店鋪の案内を地図で消費者に提供する場合は,コンテンツオー ナー(B)が各店鋪の位置データを POI という形式で,地図 ASP(B)に提供し,地図 ASP は,そのPOI 集合を背景地図と重ねた形で消費者(C)に提供しているので,B2B2C の枠 組みとなっている(図3参照)。この枠組みは,現在のウェブでの地図サービスでは主流で あり,現在の空間ビジネスモデルの代表的な例である。また,許可を取れば,国土地理院 の地図データを利用した地図ASP を行うことは可能である。その地図 ASP は,ビジネス (B),他の政府機関(G), NPO がそれぞれで行うことも可能であり,その上に,政府や 自治体等(G)の公的機関が無料公開している空間コンテンツや,ビジネス(B)で公開し ている位置情報付きの無料の広告情報や,NPO 自体が集めた空間コンテンツを,複合的に 重ねて消費者に提供することもできる(図4参照)。このように,B,C,G,NPO, のたった4 つの範疇に分けて,その範疇間の空間コンテンツのフローを考えてみるだけでも,現状が どのような状況であり,今後どう予想されて,何が足りなくて,何をどこに追加すべきで あるかが,少し明らかになる。この意味で,このような分類学的な思考は,役に立つので はないだろうか(図5参照)。 図3.現在の主流となる背景地図ASP を使った空間ビジネスの1形態:B2B2C
B
2
B
2
C
空間コンテンツ
オーナー
空間コンテンツ
ディストリビュータ
+
背景地図ASP
空間コンテンツ
消費者
図4.政府・自治体,非営利組織,ビジネス,それぞれから 無料の空間コンテンツが提供され,その上にNPO や ビジネスを展開する模式図 図5.政府・自治体,ビジネス,非営利組織,一般市民の 間での空間コンテンツ流通のすべての組み合わせ
NPO
B
or
NPO
C
2
2
空間コンテンツ
オーナー
空間コンテンツ
ディストリビュータ
+
背景地図ASP
空間コンテンツ
消費者
G
2
B
2
C
G
NPO
B
空間コンテンツのキャリア:
(Web, Email, BBS) × (TEXT, Photo, Voice, HTML, XML, etc)
<通信プロトコル> <データ形式>
個人の空間コンテンツの交換という意味では,実は,消費者同士の交換,"C2C"が重要で あろう。C2C の枠組みはどのような枠組みかというと,もちろん,個人同士でデータ交換 する手段は,email が中心になってくる。また,BBS を使った場合は,C2C という流れも あるが,その結果,限られた個人だけではなく一般の消費者にも,不特定多数に公開され る結果となる。そして,それはウェブコンテンツとも見なすことができ,サーチエンジン でも検索できる対象となりうる。このBBS で集めた空間コンテンツというのは,リアルタ イム性があり,情報が画一的でなく,極めて有用な情報になる可能性が高い。BBS を立て ること自体がコミュニティを作ることであり,位置情報を使った空間コンテンツ交換の理 解者を増やすという意味からも重要であり,今後,空間コンテンツの便利さを多くのコミ ュニティが理解し,空間コンテンツ利用の普及が拡大していくであろう。そして,ウェブ というものは,一方的な情報発信のようにも見えるのだが,BBS とウェブというものは, 境があるようで,境が無いものであり,BBS は簡単にパブリッシュできるウェブサイトと 考えることもできる。 1.7 社会の個人化と個人空間ポータル 社会において個人化は重要である。インターネットやIT は,個人を生かすための道具と 言える。人類の歴史を考えると,階層的な社会と組織を作ることは現代社会の実現の第一 歩であった。しかし,IT の出現により,人と人との通信形態や人の活動範囲が高度化し, いろいろな意味で個人が生きる時代になった。これは,コンピュータのダウンサイジング 化や,個人化(パーソナライゼーション)に直接つながる。そして,企業や政府のような 各組織での構造改革にも直接的につながるものである。たとえば,コンピュータは,以前 は大規模な装置であったが,現在では個人化し,パーソナルコンピュータとなった。ソフ トウェアに関しても,従来は組織のためのソフトウェアであったが,今は個人化し,パソ コンの上で動くソフトウェアとなり,個人でも使用でき,個人の仕事を支援する表計算や ワードプロセッサなどが,個人だけでなく組織においても,情報処理の主体となりつつあ る。個人化は,社会のいたるところで進んでいる。逆に言うと,今までのシステムは,一 部のスタッフだけ,たとえば,専門家だけが使うために設計されたものがほとんどであっ た。ダウンサイジング化の別の例としては,たとえば,デスクトップパブリッシング(DTP) により,印刷やデザインも専門家から一般市民の手へと移って来た。写真に関しても,以 前は専門家が撮影し,専門家が現像していたが,今では,個人が撮影し,個人がパソコン で楽しんだりカラー印刷したりするように移り変って来た。このように,いろいろな広範 な活動が個人でできるようになり,個人の能力向上および活動範囲拡大が実現できている と言って良いだろう。 このような個人化の流れは,現在の社会全体で明らかに進行している。一方,GIS の分 野では,この個人化の流れはあまり大きく認識できておらず,旧来の専門家向けのシステ ムという傾向がまだ強い。ソフトウェアという道具は,個人が使えるものになれば,それ
を基本にして多人数(グループ)で使うものに発展させることができる,という発展手段 が共通認識になりつつある。具体的には,パーソナルコンピュータの上で動くソフトウェ アは,それよりも規模が大きいコンピュータであるワークステーションやメインフレーム の上でも動く,という拡大過程の模式図の方が枠組みとしては健全と考えられるようにな った。もちろん,個人化したソフトウェアで,専門的な処理を含むすべてのソフトウェア をカバーすることは不可能ではあるが,本来,個人向けソフトウェアでカバーできる範囲 を,専門家向けソフトウェアや特殊/専門ソフトウェア(システム)で行っていた場合が 多いので,良い意味で個人化は全体システムのダウンサイジング化を進め,結果として構 造改革につながっている。 個人で使えるソフトウェアは,グループでも使える。個人の特殊な形が,自治体のスタ ッフ,民間のスタッフ,コンテンツプロバイダのスタッフ,あるいは,研究者であったり する。グループの特種な形が,自治体,大学,会社であったりする。実際には,自治体も 大学も,企業と同じような合理化を受け入れる必要があり,今後,自治体や大学も会社と 呼ばれる時代が来るかもしれない。グループがもう一階層深くなると,それは,グループ のグループということになり,その1つ上のグループが形成される。つまり,個人化のツ ールと,グループ化して情報を共有するツールにより,コミュニティによる情報共有の枠 組みが実現することが,現実的には,健全な方向であると今までの流れからも分かるであ ろう。
Personal > Group > Big Group
コンテンツに関しても,位置データは高価である。内容が特殊であり,また,測量も高 価であったために,位置データ自体が地図という形となり,測量によりデータ化され,一 般の人々に享受されていたというのが実体だろう。しかし今後は,たとえば,個人が GPS で位置データを採取し,個人がそこで写真を取り,個人がコメントをテキストで作り,そ れらを組み合わせたものをデータベースにupload し管理するようになるだろう(図6参照)。 個人用の DB とは,いろいろな呼び方はできるが,日記的な情報を管理するので,個人日 記データベースと言っても良いかもしれない。日記だが,インターネットを通してどこか らでも見られる日記である。また,誰からでも見られる日記にすることもできる。ウェブ プロバイダが,個人日記を簡単に作る仕組みを提供しているサイトも多い。これは,世界 的にも blog[8]という名称で広がりつつある。また,ケータイから,テキストや写真などを upload して作れる Web 日記を moblog[9]と呼んでいる。blog は web log の略である。普 通,web log というと,web server のログを連想し,間違えやすい。ここでの web log の 意味は,個人の生活の記録としてのログをWeb に載せた,個人日記ウェブページを意味す る。
図6.個人空間ポータル.個人が簡単に空間情報をネットワーク上で管理できるようになる. 外で撮影したデジカメ写真を自分のサーバにupload するがごとく,自分の軌跡などの 個人空間コンテンツを個人空間サーバにupload する 個人情報は,普通は,その個人しか見られないようにするのが基本である。一方,自分 の個人日記のうち,公開できるものは知り合いや家族に公開するという使い方があるだろ う(図7参照)。これは,個人日記ウェブのアクセス管理の制御を行っていることになる。 また,一般的なウェブと同様に,不特定多数に公開するという制御も可能である。blog は, 一般に不特定多数に,自分の生活内容や不満などを知ってもらって情報交換を促進したい と考えている。日記の中の情報は,かなり新鮮な情報であり,それを読む人にとっては有 益な情報がたくさんあるだろう。一方,これらの情報は,機械で直接的に理解できる形式 になっていないので,地図で検索するのは一般に難しい。しかし,自然言語処理で,位置 情報抽出や位置情報検索が実現できるかもしれない。また,位置情報タグを個人日記の内 容に明示的に入れるように習慣付けると,それで位置情報検索の精度がずいぶんと上がる。 図7.個人空間ポータルと情報共有. 個人が簡単に空間情報を交換/発信できる. 個人空間ポータルサーバ
個人
( 研究者)
+GPS
個人空間コンテンツの upload
個人空間コンテンツの
検索/ブラウジング
個人空間ポータル
サーバ
個人
( 研究者)
+GPS
個人
( 研究者)
交換 (P2P)
by emailなど
+GPS
公開部分
情報発
信
個人空間コンテンツの upload 個人空間コンテンツの 検索/ブラウジングそれらが,われわれにとって使いやすいものになる可能性もある。そして,個人の空間 ポータルサイトを皆が持つようになると,それらのうちの公開している部分,共有して良 い部分をつないで,グループのデータベースやグループのポータルサイトを作ることがで きる(図8参照)。このように,個人空間ポータルを階層的にしていくことにより,組織の 情報共有システムを実現できる。このような,個から全体をボトムアップに積み上げて行 く枠組みでのシステムの展開の仕方は,健全な方向と考えることができる。この最も代表 的なものは,やはりウェブであり,ウェブページそれぞれは個人が中心になって作ったも のであり,それらを集約してウェブサーチエンジンが実現でき,豊かで使いやすい情報空 間の利用環境を実現している。 図8.グループ空間ポータル. グループ空間ポータル=Σ個人空間ポータル 個人空間ポータル グループ空間ポータル 個人空間ポータル
・・
・
・ ・・2.空間 IT 社会と LBS
2.1 空間 IT とは これまでのGIS は,専門家向けのツールとして発展・普及しており,消費者を対象とは していなかった。これは,空間データを作成するのに多大なコストが掛かることが大きな 理由となっていた。一方,IT(情報技術)は,もともとは専門家向けの技術から始まり,現在 では消費者向けの技術へと進化した。この結果,IT はわれわれの生活習慣を変え,さらに 従来のコンピュータ技術の在り方さえ変えてしまった。同様に,GIS も専門家向けのシス テムから,より広い範囲をカバーするという意味で,消費者向けへと進化しているのが現 状である。次世代GIS における最も重要な消費者向け適用分野として「ひとナビ」がある。 ひとナビでは,大縮尺の地理情報が小縮尺の地理情報よりも重要である。「地理」という用 語自体が一般に小縮尺や専門家向けに使われてきた。一方,「空間」という用語は,人間の 活動のための空間である現実世界を設計する建築家に好まれて使われてきた。ひとナビや IT の観点からは,「地理」という概念よりも「空間」の方が,次世代 GIS の予想される利 用形態をより良く反映しているだろう。そこで,GIS の従来技術から発展した消費者向け の技術を空間IT(S-IT:Spatial IT)と呼ぶことにする。S-IT は,IT のコア技術の1つにな るだろう。S-IT は,GIS の分野だけではなく,IT がそうであるように,すべての応用分野 で使われるようになると予想される。2.2 LBS の意義
消費者向けGIS の最も有望な形態の1つは,LBS(Location Based Services: 位置情報サ ービス)を基本とするものになるだろう。LBS は,家電,乗物,人などあらゆるものの位置 情報を提供するようになる。消費者は,それらの位置に依存した多くのサービスを享受す るようになるだろう。インターネットの特徴の1つとして,現実世界の位置に制約されず に情報空間が存在することが挙げられる。つまり,ネットワークは,時間と空間の制約を 超えて,われわれが情報を共有できる環境を実現した。そして,インターネットは爆発的 に普及し,われわれの生活スタイルそして社会のシステムをも変革した。インターネット が当たり前の環境になった現在,次に注目される機能として「モバイル」があり,現在, 多くの研究が行われている。近い将来には,すべての人々がコンピュータをどこでもいつ でもどんな状況でも使うようになるだろう。コンピュータは,現在の機能からさらに発展 して,利用する場所に制限されることなく人々の活動を支援するツールとなり,自律した 存在あるいはエージェントへと発展すると予想される。たとえば,コンピュータの存在は, デジタル秘書,デジタル友人,デジタルペットなどの存在へと変化するだろう。コンピュ ータは,人と対話し,その人の意図や好みを理解する機能を持つことになるだろう。また, その人自身の過去の行動履歴を記憶し,これを利用してアドバイスを人に与えたり,それ
に対するフィードバックを受けて,その人を深く理解する機能が実現されると予想される。 2.3 新しい主要入力デバイスとしての LBS LBS は,このようなエージェントを実現するための最も重要な技術の1つである。エー ジェントは,人(=主人)の位置が分かっているので,その人の行動を支援する情報を提 供できる。エージェントへの現在の入力情報のほとんどは,人手をかけて入力したもので ある。たとえば,今日,ソフトウェアアプリケーションやエージェントに対するデータや 問い合わせの情報を作る場合,キーボード,マウス,ペン,あるいは音声などの物理的そ して仮想的な入力デバイスを利用する。一方,LBS は,人が入力しなくても,現実世界の 人の動きに関する空間情報を自動的に生成できる。LBS は,ヒューマンインタフェースの 観点からは,キーボードとマウスに次ぐ,コンピュータにとって革新的な第3の入力デバ イスになると考えられる。LBS は,現実世界に対応する地図の上に,人の動きの軌跡を線 で描くような入力デバイスである。この人の軌跡の情報を用いて,エージェントはさまざ まな状況において人の活動を支援し,将来のモバイルコンピュータ環境において,最も重 要でかつ便利な入力デバイスとなるだろう。 2.4 LBS によるボトムアップ型空間コンテンツ構築 LBS は,従来高価であった空間データ制作費用を少なく,あるいは無料にする。LBS が 普及すると,人類がかつて経験したことが無いほど大量の空間データが生成され,インタ ーネット上を流通することになる。LBS により生成された空間データはインターネットを 通して収集され,大規模な自立発展的な地理データベースが構築されることになるだろう。 このようなボトムアップ的な空間データ基盤は,従来の政府や測量会社などがトップダウ ン的に整備してきた空間データ基盤とはかなり性質が異なり,市民参加による草の根的な 枠組みの実現となり,また,空間データ基盤の在り方自体も変えてしまうだろう。インタ ーネットを普及に導いたウェブも,ボトムアップ的,草の根的な枠組みであり,コンピュ ータ環境を一変させてしまった。同様に,ボトムアップ的空間データ/コンテンツ基盤は, S-IT が進むべき健全な方向だとわれわれは考えている。 2.5 空間時計としての LBS LBS は,時計に例えることができる。時計の普及により,われわれは「時間」情報を手 に入れることができた。一方,LBS の普及により,われわれは「空間」情報あるいは「位 置」情報を手に入れることになるだろう。今日の社会は,時間を基準に回っていると言っ て良いだろう。LBS が安定して安価で提供されるようになると,「空間」を基準にしたさま ざまな管理方法が社会の根幹に加わり,社会のシステムを変革するだろう。これは,時計 の普及により,「時間」を基準にした管理方法が導入され,社会のシステムが変革された歴 史と似たものとなるのではないだろうか。
2.6 認知空間のデジタル化 LBS のもう1つの側面として,われわれが自分自身の個人的な空間データを所有するこ とになることが挙げられる。空間データのパーソナライゼーションを実現するためには, 人間の認知の解明が重要となる。エージェントは,人間の脳の中の情報をシミュレーショ ンすることにより,各種機能を実現することになる。エージェントは,人の行動の履歴デ ータをその人の個人空間データとして記録する。個人空間データは,現実世界におけるわ れわれの行動に関する記憶の外在化と解釈することができる。このように,個人空間デー タを管理するエージェントを「空間パーソナルエージェント/アシスタント」と呼ぶこと にする。将来のパーソナルコンピュータを空間パーソナルエージェントとして実現するた めには,関係する多くの領域の専門家が結集して知識を出し合うことが,大きな実質的な 発展を生み出すだろう。 図9.空間IT と関係する分野 2.7 空間 IT 社会の技術的研究課題 最後に,「S-IT 社会」に関する技術的研究課題を以下に列挙する。 A.LBS に基づく空間 PDA (Personal Digital Assistant)
A.1 ひとナビ(Human Navigation) - 略地図
空間IT
Database System
Hypermedia
Image Processing
Visualization
Digital Earth
(Spatial Digital Library)
Map
Architecture
Mobile
User Interface
Design
Web
Internet
Infrastructure
Cyber Space
Cognitive Science
Content Business
Ubiquitous Computing
GIS
-音声/自然言語ナビ
- 拡張現実感(Augmented Reality)インタフェース
A.2 デジタルひとメモリ(Spatial Human's Memory or Digital Recognition Spaces) - 空間対話(Spatial Interaction) A.3 空間デジタルパーソナルエージェント - デジタル秘書,デジタル友人,デジタルペット,デジタルわたし,デジタル家族, デジタル神 A.4 空間個人履歴管理 - 空間日記/空間個人メモリ管理 - 写真やビデオの個人アーカイブに対する空間個人情報検索システム A.5 空間健康管理システム B.IT 社会向けボトムアップ空間データ/コンテンツ流通基盤 B.1 空間 DNS (Domain Name Service)
B.2 空間セマンティックウェブ B.3 空間コンテンツ融合
B.4 空間リアルタイムカメラ情報場 B.5 空間センサー情報場
- 空間センサーの協調とプライバシー保護
B.6 LPS(Local Positioning Systems)を基本としたオープン LBS フレームワーク B.7 P2P を基本とする空間コンテンツ流通の普及
3.位置情報によるインターネット上のリソース管理
インターネットの出現により,地理的な位置に依存せずに全世界的にネットワークを介 して誰でも自由に情報を交換できるようになった。しかし,この情報空間が現実空間の位 置とうまくリンクしていないことが問題であり,サイバー空間の本来の可能性を小さくし ている。今後,この情報空間と現実空間の位置とをスムーズに,かつ自由にリンクさせる サービスを実現する(図 10)ことにより,現実空間でのわれわれの活動とインターネット に展開された情報空間とを自然に結び付けて,人間の日常生活を多角的に豊かにさせるこ とができるだろう。また,LBS とインターネットとを組み合わせることにより,一般の人々 が個々に空間情報を作成し,交換できる土壌ができつつあると言える。 図10.位置情報による現実空間とサイバー空間の相互参照 ウェブは地理的位置に依存しない情報空間を実現し,今日,巨大な情報空間を人類が共 有できるようになった。一方,ウェブの情報を場所に依存する形態で利用できるようにす る要望がある。たとえば,現在いる場所から近いお勧めのイタリアンレストランの情報が 知りたいとか,今から行く先の場所のリアルタイム映像を見てみたいなどといった,位置 に依存した情報アクセスの手段は便利である。位置情報をキーとしてインターネット上の ウェブページにアクセスするサービス[10,11]はまだ研究レベルであり,インターネットの 主要サービスの1つとして技術的に実現されてはいない。VRML(Virtual Reality Modeling Language)の提案は,1994 年に第 1 回の WWW に 関する国際会議で,"Cyberspace"という題目の発表として行われた[12]。VRML を発明し たときの大きな目的の1つとしてデジタルアース[13]の構想があった。デジタルアースとは, 地球上のさまざまな情報を 3 次元化して,さも地球儀を覗くがごとく,インターネット上 のさまざまな情報にアクセスするという枠組みである。VRML の提案論文では,(x,y,z)で表 現される3 次元の位置と IP アドレスとを対応付ける Cyberspace Server というサービスが
現実空間
位置情報による
関連付け
サイバー 空間
提案された。このサービスは,唯一の 3 次元ウェブ空間を地球上の位置と一意に結び付け る。現在, ウェブは普及したが,VRML の提案論文にあったような,位置に基づいて必要 なリソースにアクセスする枠組みは,まだ実現されていない。ただし,そのようなサービ スを実現しようとする国際標準化の動きが全く無いわけではない。VRML コンテンツの中 で緯度経度を記述できる"GeoVRML"[14]の提案や,トップレベルのドメイン名として ".geo"[15]を使えるようにして,"20e30n.geo"のように経度緯度情報を URL の一部に記述 できるようにし,現実世界の場所を階層的なセル単位でアクセスする枠組みの提案が行わ れた。残念ながら,.geo の提案は,インターネットの標準化組織である IETF では認めら れなかった。このように,インターネット上のリソースへの,位置情報によるアクセスの ためのインターネット標準については,決定的なものはまだ出てきていない。 LBS の普及により,位置情報を時間情報並みに一般市民が利用できるインフラが整って くると考えられる。今後は,位置情報は,専門家だけでなく誰もが普通に使うようになり, 時間情報が溢れているのと同様に,位置情報もわれわれの生活の中に溢れるようになり, さまざまな情報の共有や同期を行うために,それらの位置情報の多くはインターネット上 を流通するだろう。たとえば,ファミリーレストランは,そのホームページにおいて各店 鋪の位置情報をインターネットで公開するのが当たり前となるだろう。これらのインター ネット上で公開された空間情報を,クローラ(crawler)やディレクトリサービスを使って 集めたものが「未来の地図」あるいは「未来のサイバー地図」になると考えられる。つま り,地図は,従来のようなトップダウンで画一的なものではなく,ボトムアップで多様性 を持つ位置情報あるいは空間情報を集約して作られる形態へとシフトして行くだろう。言 い換えると,現在のウェブと同様に,個人でも,地図とは無縁の組織でも,普通に自由に 簡単に空間情報を公開させ,流通させる枠組みになることがインターネット上の今後の発 展の自然な方向と考えることができる。この結果,空間データ(むしろ,空間コンテンツ と言うべきだろう)は,新鮮性を保つことができる。一方で,現在のインターネットと同 様に,さまざまな品質の空間コンテンツがカオスのように流通するようになるだろう。し かし,それらの情報は,社会というフィルタにより自然淘汰され,ボトムアップ型のサイ バー地図は自律的に段階的に内容が充実して,現在の地図の一部に置き換わるものになる だろう。 位置情報は,現在の地図で扱っている地物,つまり,建物や自然地物のような静止物だ けではなく,あらゆるもの(リソース;resource)を表現するようになる。たとえば,人, 自動車,ケータイ,パソコン,家電,洋服,鉛筆,靴,食料などあらゆるものに位置セン サーならびにIP アドレスが付くようになるだろう。それらの位置情報を検索できるように なるだけではなく,逆に,位置情報からさまざまなリソースをコントロールできるように なるだろう。具体的には,IPv6 で提供される無限に近い IP アドレスが自分の身の回りのも ののほとんどに割り当てられるようになる。それらを検索するあるいはコントロールする 場合,IP アドレスで直接そのリソースを指定するのは非人間的であり,また,小さなもの
にまで名前(ドメイン名)を付けるのも非現実的である。そこで,名前が無いものでも, 位置で指定ができるのが自然である。バーコードでいろいろな指定ができるがごとく,位 置でいろいろなリソースを指定できる枠組みが普及する可能性は大きい。位置によりIP ア ドレスが検索できる枠組みが確立すれば,たとえば,どこに行っても,目の前にあるテレ ビのコントロールは,自分のケータイから自動的に普遍的にコントロールできる。 位置とリソースを結び付けると,われわれの生活活動を楽に高度にできる。この位置と リソースを結び付けるサービスとは,DNS(Domain Name Service)がドメイン名から IP ア ドレスを検索するのと同様に,位置からIP アドレスを検索できる枠組みがインターネット 上での一般的なサービスとして確立することである。当然,個人情報において,位置情報 は人の居場所を表現する。プライバシや安全を確保する枠組みの確立は必須である。同時 に,うまく隠蔽化が実現できれば,人の動きなどのリアルタイムで大量の情報を公開でき る。これらを利用すれば,行政計画,マーケティングなどさまざまな分野で効率良い客観 的で公平な空間意思決定を行うことが可能となる。
4.ジオコーディング手法を用いた多様な文書資源の空間情報化
4.1 背景 多くの文書データには,そのデータが作成された場所や著者の住所,あるいはある場所 の参照情報など,実世界の位置の情報が含まれている。このような多様な文書データを実 世界の位置で検索・管理することは,情報の活用可能性を広げ,利用を高度化させる。一 般に,位置情報というと緯度経度で表される二次元座標値が想定されるだろう。二次元座 標値のように位置を数値で表したものを,直接位置情報と呼ぶ。直接位置情報を利用する 代表的な応用例としては,GIS や GPS が挙げられるが,直接位置情報が利用されているの は,特定の目的に作られた専門性の高いデータだけである。これに対し,住所や地名のよ うに位置の情報を表しているものの,直接地図上に射影できない記述を,間接位置情報と 呼ぶ。間接位置情報を含む文書は,一般文書データにも多数存在する。これらの間接位置 情報を直接位置情報,つまり(x, y)へと変換できれば,文書データを地理空間に射影するこ とができ,多様な検索や構造化が可能となる。 間接位置情報を直接位置情報へ変換する手法として,欧米を中心に従来よりジオコーデ ィング(Geocoding)が利用されている。昨今のモバイルコンピューティング環境の普及に伴 い,位置に基づく検索・整理や,情報発信が今後ますます重要になると考えられるため[16], ジオコーディング手法を利用することでメディアの種類を超えて,位置に依存したさまざ まなアプリケーションが一般ユーザにも使えるようになるのが理想と言える。このような インフラが整備されれば,現実世界とのインタラクションのある空間情報を日常的に利用 できるようになるだろう。 4.2 空間文書データの分類 本節ではまず,本研究の対象とする文書データを,空間データとして利用する観点から 分類する。最も代表的な空間データを扱う情報システムであるGIS で利用可能な文書デー タには,地理データ(Geographic Data)と地理参照データ(Geo-referenced Data)がある。地 理データは道路形状や行政界などの幾何的な情報を中心としたものである。地理参照デー タは,顧客データや道路交通量などの定量データが中心だが,ID などによって地理データ にリンクすることができるデータである。地理データも地理参照データも,特定目的用に 多くの費用をかけて作成されるもので,一般ユーザが日常的に利用するものではない。 さて,日常生活で利用される文書に含まれる情報には,待ち合わせ場所や宿泊先など,住 所や地名を含むものが多い。このような「空間的な位置情報を含むデータ」を「空間デー タ(Spatial Data)」と定義する。空間データには,「○△町□番地で火災発生」「震源地は× ×沖50km」や「○○駅前の△ラーメンはおいしい」といった自然言語で記述された文章や, 略地図,事故現場を写すニュース映像なども含まれる。このような高級な表現は人間にとっては有用だが,そのままではコンピュータには理解 できないため利用できない。そこで,XML などの半構造化表現を利用したドキュメント記 述を用いて,表現の曖昧さを解消する手法が注目されている。例えば「○△町□番地で火 災発生」というデータを「<spatial information><location>○△町□番地</location>で <event>火災発生</event></spatial information>」のように記述すれば,コンピュータに とって格段に理解しやすくなる。 文書データを空間データとして分類すると,上述のように構造化のレベルによって 3 段 階に分類することができる。まず自然言語や画像などの生データを「非構造データ (Non-structured Data)」,XML のような構造化文書表現を利用したデータを「半構造化デ ータ(Semi-structured Data)」,そして地理データや表形式データのように特定のフォーマ ットに従ったデータを「構造化データ(Full-structured Data)」と分類する。これと直交す る 基 準 と し て , 地 理 デ ー タ の よ う に 位 置 を 座 標 値 で 表 現 し た 直 接 位 置 情 報 デ ー タ (Directly-referenced spatial data)と,位置を住所や地名で表現した間接位置情報データ (Indirectly-referenced spatial data)に分けることができる。以上の組み合わせにより,空 間データを図11 のように 6 種類に分類することができる。以下本稿ではそれぞれの頭文字 を 用 い て , 構 造 化 − 直 接 位 置 情 報 デ ー タ を F-D デ ー タ ( Full-structured, Directly-referenced spatial data),非構造化−間接位置情報データを N-I データ (Non-structured, Indirectly-referenced spatial data)のように表記する。
図11.空間データの分類 4.3 空間文書管理システム
本研究の目的である空間文書データの高度利用を実現するためのシステムとして,空間 文書管理システム(Spatial Document Management System)を実装・開発し,有効性を示 した。本システムでは,文章で記述されている文書データであれば(すなわち,画像や音声 のようなデータは除く),4.2 で分類した 6 種類の空間文書をすべて空間情報として利用す ることができる。たとえばレストランの情報であれば,ワープロで作成されたチラシやウ ェブページのような N-I 文書データもそのまま保存し,含まれている住所の情報を元に地 図上で検索,閲覧することができる。以下,まず空間文書管理システムで利用する2種類 の変換エンジンについて説明し,次に空間文書管理システムについて説明する。 4.3.1 ジオコーディング・エンジン 空間文書管理システムでは,間接位置情報を抽出して直接位置情報に変換するため,ジ オコーディングを行う必要がある。ジオコーディングは,住所や地名文字列を解釈し,対 応する位置の座標値(たとえば緯度経度)に変換する手法の総称である。欧米ではGIS の 基本機能として広く利用されているが,日本では,単語の間に空白やカンマなどのデリミ 構造化 Full-structured 半構造化 Semi-structured 非構造化 Non-structured 間接空間参照 Indirectly-Referenced Spatial 直接空間参照 Directly-Referenced Spatial F-Iデータ 表データ+住所等 F-Dデータ 幾何情報+名称, IDなど S-Iデータ XML+ 住所 S-Dデータ XML+(x, y) N-Iデータ 自然言語+住所 N-Dデータ 自然言語+(x, y)
空間情報
空間参照データ 空間データタが存在しないため分かち書き処理を行う必要があることや,京都市内の通名に代表され るように複数の住所体系が混在していることなどが障害となり,あまり普及していない。 特に一般文書データに含まれる住所などの記述は,読み手に理解できればよいという条件 で記述されているため,都道府県名や市町村名が省略されているなど曖昧な記述が多い。 われわれは,これらの曖昧な間接位置情報をロバストかつ高速にジオコーディングするた め,日本の住所体系に適したジオコーディングアルゴリズムを開発し,クライアント・サ ーバエンジン『SPAT』として実装した[17]。空間文書管理システムでも SPAT を呼び出し てジオコーディングを行う。ジオコーディングにより,S-I データは S-D データに,F-I デ ータはF-D データに変換される。 4.3.2 半構造化エンジン 非構造化データには,間接位置情報がどこに記述されているかという情報が含まれてい ない。そこで,文章をパース(parse)して,間接位置情報の可能性がある単語列を順番にジ オコーディングするという処理を行う。ジオコーディングの結果,対応する緯度経度が得 られれば間接位置情報であったことが分かると同時に,直接位置情報に変換することがで きる(対応する緯度経度が得られなかった場合は間接位置情報ではなかったと判断し,次の 単語列に移る)。また,直接位置情報の可能性がある単語列も抽出する。 さて,元の非構造文書データに含まれる間接・直接位置情報が抽出された時,その部分 をXML-like なタグでマークアップすると,非構造化データを半構造化データに変換するこ とができる。そこで,この処理を「半構造化(semi-structuralize)」と呼ぶ。実際には,同 時にタグの属性情報として直接位置情報を挿入するため,半構造化とジオコーディングが 行われる。すなわち,N-I データと N-D データが S-D データに変換される。以上の処理を 行う半構造化エンジンは,プログラムモジュール『芭蕉』[18]として実装した。 4.3.3 空間文書管理システムの仕組み SPAT および芭蕉を利用することで,6 種類に分類された空間文書データはすべて, S-D データまたはF-D データに変換できる。一般に S-D データはレストラン情報のように地図 上の点として表される情報,いわゆるPOI(Point of Interest)とみなすことができ(道路渋 滞情報のように線で表されるべき情報もある),地図に表すことができる。F-D データはそ のまま地図上に表示することができるため,6 種類の分類すべてが地図上に示せることにな る。 そこで,変換されたS-D データおよび F-D データを効率良く管理,検索する仕組みを開 発すれば,6 種類の空間文書データを地図上で管理できる新しい情報システムを構築するこ とができる。この空間情報システムを「空間文書管理システム」と呼ぶ。図 12 は SDMS のプロトタイプシステム画面例である。本システムのインタフェースはさまざまなOS 上の ウェブブラウザで動作するが,SDMS のメインシステム部分は UNIX 上の CGI アプリケー
ションとして構築されている。 4.3.4 検索インタフェース インタフェースは大きく 3 つの部分から構成されている。左上部は地図表示部であり, 地図をベースに,それぞれの位置にリンクされている空間文書のアイコンが表示される。 右上部は入力フォームになっており,表示したい場所や検索キーワード,時間的な検索範 囲を指定する入力フォームがある。下部は検索結果表示部で,地図に表示されている空間 文書の概要が一覧表示される。 図 12.空間文書管理システムのプロトタイプ画面 地図表示部の文書アイコンはそれぞれの文書のタイプを示している。現在のところ,文 書タイプとしてMicrosoft Word,Excel,PowerPoint,Adobe PDF,HTML および Plain Text に対応している。また,アイコンをクリックすると,検索結果表示部の対応するレコ ードにジャンプする。検索結果表示部には,文書ファイル名とその文書に含まれている住 所一覧,および文書の一部が表示される。文書ファイル名をクリックすると,直接ファイ ルを開いて編集を開始することもできる。住所一覧をクリックすると,その住所を中心と して地図を描き直し,その住所を中心に再検索が行われる。