• 検索結果がありません。

Web : Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web i

N/A
N/A
Protected

Academic year: 2021

シェア "Web : Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web Web i"

Copied!
34
0
0

読み込み中.... (全文を見る)

全文

(1)

特別研究報告書

Web

標識

:

利用者のアクティビティと

背後検索に基づく

Web

情報空間の周辺案内

指導教官

田中 克己 教授

京都大学工学部情報学科

池田 新平

(2)

i

Web

標識

:

利用者のアクティビティと

背後検索に基づく

Web

情報空間の周辺案内

池田 新平 内容梗概 近年のインターネットの普及により,Web 空間は情報収集における重要な情 報源の一つとなった.しかし,Web 空間には様々な情報が氾濫しており,Web 空間上で有益な情報を発見することは容易ではない. Web ナビゲーションの一つとしてリンクナビゲーションが挙げられるが,リ ンクナビゲーションでは,現在閲覧している Web ページのリンク構造的に近い Web ページ群を構造的周辺空間,内容的に類似している Web ページ群を内容的 周辺空間の情報を知ることはできない. 実世界と同じように地図や交通標識などの手段を用いることにより,現在閲 覧しているページの周辺空間の情報を得ることが出来れば,Web 空間において, より効率的な情報探索が出来ると考えられる. Web 空間の視覚化についての研究は現在までに数多く行われている.しかし, 実世界における交通標識のように,Web 空間の内部からの視点で Web 空間を視 覚化するような研究はされていない. そこで本研究では,利用者が現在閲覧している Web ページの周辺空間の情報 を,”利用者のアクティビティの一つである閲覧履歴から利用者の意図が抽出で きる”という考えに基づき,利用者の閲覧履歴を反映させた検索を背後で行い, その検索結果を交通標識メタファーを用いて,Web 標識という形で表示するシ ステムを提案する.Web 標識の役割はブックマークと対になるものとして考え ている.ブックマークがかつて閲覧したページへの案内であるのに対し,Web 標識は未閲覧の Web ページへの案内も表示することが出来る.この Web 標識に より,利用者が周辺空間を認知できることで,利用者が欲する情報を持つ Web ページに効率的に辿り着くことを支援することが出来ると考える.以下に周辺 空間の生成法,及び Web 標識の生成法について述べる Web 標識を生成するに当たって,現在閲覧している Web ページを含め,リン クナビゲート時の閲覧履歴に対する周辺空間を生成する.まず,各 Web ページ を特徴付けるために,Web ページ内の各単語の出現頻度に基づく特徴ベクトル を作成する.また,閲覧中の Web ページの周辺空間を生成するためのキーワー

(3)

ii ドとして,各 Web ページの特徴キーワードとアンカーキーワードを抽出する. 抽出した各単語のうち,出現頻度が最上位であるものをそれぞれのページの特 徴キーワード (K0,K1,・・・Kn),リンクナビゲートしたアンカー文字列の集合を アンカーキーワード (A1,A2,・・・An) とする. 次に,現在閲覧している Web ページの順リンクを 1 段辿った先の Web ページ のソースを全て取得する.取得した Web ページのソースに対して閲覧履歴の平 均特徴ベクトルと類似している特徴ベクトルほど順位が高くなるようなランキ ング付けを行う.このランキング上位の Web ページ群を現在閲覧している Web ページの構造的周辺空間とする. 次に,各 Web ページから抽出した特徴キーワードとアンカーキーワードを用い て AND 検索を行う.AND 検索は (Kn,An,Kn−1),(Kn−1,An−1,Kn−2),・・・,(K1,A1,K0) を検索キーワードとして n 回行う.これらの AND 検索の結果のうち各検索結 果におけるランキング上位の Web ページのみを抽出し,更にそれらランキング 上位の Web ページ群を統合した Web ページ群を,現在閲覧している Web ペー ジの内容的周辺空間とする.以上の操作により現在閲覧している Web ページの 周辺空間が生成できる. 本研究では FastMap を用いて,構造的周辺空間を生成する Web ページ群の 特徴ベクトル,内容的周辺空間を生成する Web ページ群の特徴ベクトル,及び 現在閲覧している Web ページの特徴ベクトルを,より低次元の空間に射影し, その射影結果を用いて Web 標識を構成する.Web 標識は,利用者がシステムに Web 標識の要求を通知した時や,一定のページ数を閲覧した時に表示すること とする.Web 標識内のノード及びノード名を選択すると,そのノードに対応し た Web ページにナビゲートする.Web 標識内に表示されるノードの個数、及び Web 標識の縮尺の規模は利用者の要求に応じて変更できるようにする.また, 利用者は Web 標識を利用しないで通常のリンクナビゲーションをすることもで きる. 上記の構成方法に基づきプロトタイプの実装を行い,その有効性を確認した.

(4)

iii

WebSign: Guidance of Peripheral Web Information

Space by User Activities and Background Retrievals

Shimpei Ikeda Abstract

Since the Internet had spread in recent years, Web space has been the important information resource. However, since Web space is flooded with a variety of information, it is not easy to discover useful information on Web space.

Although the link navigation is a useful way to explore infomation, the information on the structural and contents-circumference of the page visited nowis not visible.

If the information on the circumference space of the page visited now can be acquired, by a map, a traffic-control sign, etc.like the real world, more efficient information search can be performed in Web space.

Although many researches on visualization of Web space are done, research which visualizes Web space with the viewpoint from an inside, like the traffic-contro sign in the real world, is not done.

In this paper, we propose a system which retrieves the circumference space usingthe visited history as a user’s activity in the user’s background, and dis-plays the retrieval result in the form of the WebSign which used the traffic-control sign metaphor for Web space. The role of the WebSign is considered as what becomes a bookmark and a pair. Bookmark is a guidance to the page visited before, but the WebSign can also display guidance to a non-visited Web page.With the WebSign, a user can recognize circumference space. Then the WebSign support to arrive at the information which a user wants efficiently.We describe the method of generating circumference space, and the method of gen-erating a Web sign in the following texts.

We generate the circumference space to the visited history which include the Web page visited now, at the time of link navigation, in order to generate the WebSign. First, to characterize each Web page, we create the feature vector based on the frequency of appearance of each word in a Web page. And we extract the feature keyword and anchor keyword of each Web page as a keyword to generate the circumference space of the Web page visited now.

(5)

iv Next, we acquire all the sauce of the Web page of the 1 step of link place of the Web page visited now. Next, we rank to the sauce of a Web page, which ranking is as high as the feature vector similar to the average feature vector. We define the Web page group of a ranking higher rank as the structural circumference space of the Web page visited now.

Next, we perform AND retrieval using the feature keyword and anchor key-word which were extracted from each Web page. We define the Web page group of the ranking higher rank in each retrieval resultin the result of AND retrieval, as the contents-circumference space of the Web page visited now. By the above operation, we can generate the circumference space of the Web page visted now. In this paper, we project the Web page which generates structural circum-ference space, the Web page which generates contents-circumcircum-ference space, and the Web page visited now on the space of a low dimension using FastMap, and, we constitute the WebSign using the projection result. The WebSign is dis-played, when a user notifies the demand of a Web sign to a system, or when a user visits the fixed number of pages. If the node on the WebSign is chosen, it will navigate to the Web page corresponding to the node. Moreover, a user can also do the usual link navigation without using the WebSign.

A prototype is mounted based on the above-mentioned composition method, and the validity is checked.

(6)

Web

標識

:

利用者のアクティビティと

背後検索に基づく

Web

情報空間の周辺案内

目次

第 1 章 緒論 1 第 2 章 基本的事項と関連研究 3 2.1 基本的事項 . . . 3 2.1.1 背後検索 . . . 3 2.1.2 周辺空間 . . . 3 2.1.3 茶筌 . . . 3 2.1.4 FastMap . . . 3 2.2 関連研究 . . . 5 2.2.1 BookMap . . . 5

2.2.2 A Metro Map Metaphor . . . 5

第 3 章 Web標識の全体像 7 第 4 章 周辺空間の生成 9 4.1 特徴ベクトルの抽出 . . . 9 4.2 特徴キーワードの抽出 . . . 9 4.3 アンカーキーワードの抽出 . . . 9 4.4 構造的周辺空間の生成 . . . 10 4.5 内容的周辺空間の生成 . . . 12 第 5 章 Web標識 14 5.1 構成方法 . . . 15 5.2 利用方法 . . . 15 第 6 章 プロトタイプの実装 17 6.1 基本的概念 . . . 17 6.1.1 垂直軸 . . . 17 6.1.2 水平軸 . . . 17 6.1.3 ノードの再配置 . . . 17 6.2 実装 . . . 18

(7)

6.3 考察 . . . 20 6.4 アプリケーションの応用例 . . . 21 6.4.1 Web ページの自動的閲覧 . . . 21 6.4.2 クラスタリングを行った大規模な周辺空間への案内 . . . 22 第 7 章 結論 25 謝辞 26 参考文献 27

(8)

1

緒論

近年のインターネットの普及により,Web 空間は情報収集における重要な情 報源の一つとなった.しかし,Web 空間には多種多様な情報が存在しているが, 様々な情報が氾濫しており,Web 空間上で有益な情報を発見することは容易で はない. Web ナビゲーションの一つとしてリンクナビゲーションが挙げられる.リン クナビゲーションは,Web ページから張られたハイパーリンクを辿ることによっ て行うナビゲーションであり,Web ナビゲーションにおいては比較的簡単な部 類に入る.しかし,リンクナビゲーションでは,現在閲覧している Web ページ のリンク構造的に近い Web ページの情報は,実際にリンクを辿ってリンク先の ページを閲覧しなければ知ることはできない.同様に,現在閲覧している Web ページと内容的に類似している Web ページの情報は,検索エンジンを用いて内 容的に類似していると思われるページを検索し,実際にその検索結果のページ を閲覧することによってしか知ることはできない.この作業は利用者にとって 大きな負担であり,Web 空間における利用者の効率的な情報探索を妨げる,と 考えられる. 実世界において,ある地点から別の地点へ移動する際,現在地の周辺を見回 すことによって現在地の周辺空間の情報を得ることが出来る.例え,周辺を見 回すことによって現在地の周辺空間の情報を得ることが出来なくても,実世界 においては地図や交通標識などの手段を用いることにより,現在地の周辺空間 の情報を得ることが出来る.しかし Web 空間においては,現在地を認知するこ とは出来ても現在地の周辺空間の情報を得ることは出来ない.実世界のような 地図や交通標識も無い為,Web 空間では迷いやすい.実世界と同じように地図 や交通標識などの手段を用いることにより,現在閲覧しているページの周辺空 間の情報を得ることが出来れば,より効率的な情報探索が出来ると考えられる. Web 空間の視覚化に関連した研究のうち,Web 空間における地図的な視覚化 についての研究は現在までに数多く行われている.しかし,地図は Web 空間全 体を見ることが出来るが,実際にその空間の Web 内部に入り込んでいる利用者 にとって,あまり効率的でない場合がある.そのような利用者にとって,Web 空間を内部という視点から見た,交通標識のような Web 空間の視覚化も必要で あると考える.

(9)

そこで本研究では,現在閲覧している Web ページのリンク構造的に近い Web ページ群を構造的周辺空間,内容的に類似している Web ページ群を内容的周辺 空間として,利用者が現在閲覧している Web ページの周辺空間の情報を背後で 検索し,検索結果を交通標識メタファーを用いて Web 標識という形で表示する システムを提案する.周辺空間の情報の背後検索には,”利用者のアクティビ ティの一つである閲覧履歴から利用者の意図が抽出できる”という考えに基づき [1] 利用者の閲覧履歴を反映させる.このシステムにより,利用者が周辺空間を 認知できることで,利用者が欲する情報を持つ Web ページに効率的に辿り着く ことを支援することが出来ると考える.

(10)

2

基本的事項と関連研究

2.1

基本的事項

2.1.1 背後検索 本研究中において背後検索とは,利用者が自ら検索という行動を起こすこと なく,システムが利用者の背後で独自に検索を行うことである.本研究におけ る背後検索の目的は,現在閲覧している Web ページの周辺空間を検索すること である.背後検索には検索エンジンを利用する以外の方法も含まれる.また,背 後検索には,”利用者のアクティビティの一つである閲覧履歴から利用者の意図 が抽出できる”という考えに基づき利用者の閲覧履歴を反映させる.背後検索に 利用者の閲覧履歴を反映させる方法は後述する. 2.1.2 周辺空間 本研究中において周辺空間とは,Web ページのリンク構造的に近い Web ペー ジ群である構造的周辺空間や,内容的に類似している Web ページ群である内容 的周辺空間を指す.Web ページの周辺空間への案内を利用者に対して提示する ことで,利用者が欲する情報を持つ Web ページに効率的に辿り着くことを支援 することが本研究の目的である. 2.1.3 茶筌 茶筌 [2] とは,1997 年 2 月 19 日に version 1.0 正式版が奈良先端科学技術大学 院大学自然言語処理学講座からリリースされた,フリーの日本語形態素解析器 である.京都大学長尾研究室,および奈良先端科学技術大学院大学 松本研究室 において開発された形態素解析器 JUMAN version 2.0 を原形として大幅な改 良を加え,解析速度と解析精度を向上させたものである. 2.1.4 FastMap FastMap[3] とは,C.Faloutsos らによって提案された,与えられた多次元デー タに対して,次元を落とした空間への正射影を行う手法である.データ同士の 類似度の関係をある程度保ったまま,低次元の空間に射影することができる. 図_に FastMap のアルゴリズムを示す.元の多次元データ内において,オブ ジェクトOa及びObを pivot objects として選択し,直線OaObに対して全ての 点を射影する.直線OaObへの射影は余弦定理を用いて行う. d2b,i = d2a,i+ d2a,b− 2xida,b

(11)

上記の余弦定理をxiについて解くと xi = d

2

a,i+ d2a,b− d2b,i

2da,b となる.このxiがオブジェクトOiの最初の座標である.以下同様の射影を再 帰的に k 本の直線に対して行えば,元の多次元データを k 次元空間に射影する ことが出来る.この方法による射影は各オブジェクト間のユークリッド距離の みを用いて行うことが出来る.

Oa

Oi

xi

E

dai

dbi

Ob

dab

図 1: FastMap のアルゴリズム

FastMap による射影は pivot objects の選択が重要である.射影後の各オブジェ クト間の距離が出来るだけ長くなるような pivot objects を選択するべきである. そのためにはOaOb間の距離が最も長くなるようなオブジェクト (Oa,Ob) を選択 する必要がある.しかし,厳密に最も 2 点間のユークリッド距離の長いオブジェ クト (Oa,Ob) を選択するには O(N2) の計算量が必要となるため,C.Faloutsos ら は pivot objects を決定するヒューリスティックアルゴリズムを提案している.以 下にこのヒューリスティックアルゴリズムを示す. 1. 任意のオブジェクトを選択し,そのオブジェクトを pivot objectObとする 2. Obから最も距離の離れているオブジェクトをOaとする 3. Oaから最も距離の離れているオブジェクトをObとする 4. Oa及びObを pivot objects の組とする

(12)

2.2

関連研究

2.2.1 BookMap

BookMap[4] とは,Mountaz Hascoet によって提案された,Web ナビゲーショ ンの為のユーザインターフェースである.利用者のブックマークや閲覧履歴の ページなどの内容や関係をグラフにして,視覚的に提示している.これにより, しかし,ブックマーク自体は以前訪れたことのあるページに対する案内である ため,現在閲覧している Web ページの周辺空間が未閲覧の Web ページであった 場合,周辺空間に対する案内を提示することはできない.本研究は,未閲覧ペー ジへの案内をすることも出来るという点で Mountaz Hascoet の研究と異なって いる. 図 2: BookMap

2.2.2 A Metro Map Metaphor

A Metro Map Metaphor[5] とは, Elmer S らによって提案された,Web 空 間における Guided Tour システム内で使用されている,Guided Tour の視覚化 を行う為の手法である.この手法は Guided Tour を地下鉄の路線図に例えて, Guided Tour の視覚化を行っている.この手法により,Guided Tour の構造を 直観的に理解することが出来る.しかし,この手法は Guided Tour という,閲 覧範囲や閲覧ルートがあらかじめ決められた Web 空間内における,地図的な視 覚化の手法である.本研究は,あらかじめ決められた範囲やルートに存在しな い Web ページへの案内をすることも出来るという点,地図的ではなく,交通標 識的な Web 空間の視覚化の手法であるという点において Elmer S らの研究と異

(13)

なっている.

(14)

3

Web

標識の全体像

ここでは,本研究で提案した Web 標識を利用する全体像を述べる.また,図 4 に Web 標識利用までの全体の流れを示す. 1. 利用者が情報探索を目的として,リンクナビゲーションを行う. 2. 利用者が,Web 標識生成の要求をシステムに知らせる.または,一定のペー ジ数の Web ページを閲覧する. 3. 閲覧履歴,及び現在閲覧している Web ページから特徴ベクトル,特徴キー ワード,アンカーキーワードを抽出する. 4. 抽出された特徴量を利用して,現在閲覧している Web ページの構造的周辺 空間,及び内容的周辺空間を生成する. 5. 生成された周辺空間を用いて,Web 標識を生成する.

6. 利用者は,Web 標識を利用して次の Web ページへ移動する.または,Web 標識を利用せずに次の Web ページへ移動する. このうち本研究で提案したシステムは次の二つの部分である. 1. 背後検索による周辺空間の生成 2. Web 標識の生成 以降,第 4 節で背後検索による周辺空間の生成,第 5 節で Web 標識の生成につ いて述べる.

(15)

Web

Web Web

Web

(16)

4

周辺空間の生成

現在閲覧している Web ページの周辺空間とは,構造的周辺空間と内容的周辺 空間の両方を統合した情報空間を指す.現在閲覧している Web ページを含め, リンクナビゲート時の閲覧履歴に対する周辺空間を生成する.対象とする閲覧 履歴中の Web ページ数は n ページ (P0,P1,・・・,Pn)(n ≥ 1) とし,n ページ前に 閲覧した Web ページを Pn,現在閲覧している Web ページを P0とする.以下 に各 Web ページの特徴ベクトル,特徴キーワード,及びアンカーキーワードの 抽出方法と,周辺空間の生成方法について述べる.また,各 Web ページからの 単語の抽出には茶筌を用いた.

4.1

特徴ベクトルの抽出

各 Web ページを特徴付けるために,Web ページ内の各単語の出現頻度に基づ く特徴ベクトルを作成する.各 Web ページの特徴ベクトルの要素として Web ページ内に出現する各単語の出現回数である tf 値を用いる.

4.2

特徴キーワードの抽出

Web ページを特徴付けるものの一つに,Web ページ内に出現する単語が挙げ られる.Web ページ内に出現する単語のうち,その Web ページにおいて出現頻 度が最も高い単語は,その Web ページを最も特徴付ける特徴として考えること が出来る. 本研究では,現在閲覧している Web ページの周辺空間を生成するためのキー ワードとして,各 Web ページの特徴キーワードを抽出する.Web ページから 抽出した各単語のうち,その Web ページにおいて出現頻度が最上位であるもの を,それぞれの Web ページの特徴キーワード (K0,K1,・・・Kn) とする.

4.3

アンカーキーワードの抽出

リンクナビゲート時に,ある Web ページから張られた順リンクを辿って他の Web ページを閲覧した際に,利用者はアンカー文字列を参考にして,次に自分 が閲覧するページを決定する.よって,リンクナビゲート時のアンカー文字列 から,利用者の意図が抽出できると考えることが出来る. 本研究では,現在閲覧している Web ページの周辺空間を生成するためのキー

(17)

ワードとして,各 Web ページのアンカーキーワードを抽出する.Web ページか ら抽出した各単語のうち,リンクナビゲート時のアンカー文字列の集合を,そ れぞれの Web ページのアンカーキーワード (A1,A2,・・・An) とする. Kn-1 Pn-2 1 Kn Pn Kn-2 K1 0 K0 An An-1 An-2 A1 Pn-1 Kn-1 Pn-2 1 Kn Pn Kn-2 K1 0 K0 An An-1 An-2 A1 Pn-1 図 5: 特徴キーワードとアンカーキーワードの抽出

4.4

構造的周辺空間の生成

構造的周辺空間とは,現在閲覧している Web ページのリンク構造的に近い Web ページ群である.リンク構造的に近い Web ページ群を構成するページ数 は,リンクを何段先まで考慮するかによって大きく変わってくる.本研究では 簡単のため,順リンク一段先までをリンク構造的に近い Web ページ群とする. また,閲覧履歴ページの特徴ベクトルの変化の方向性を考慮することにより, 利用者が次に欲すると思われる Web ページを推測することが出来る.本研究で は簡単のため,閲覧履歴ページの平均特徴ベクトルを取ることにより,閲覧履 歴ページの特徴ベクトルの変化の方向性を推測する. 本節では構造的周辺空間の生成法について述べる.まず現在閲覧している Web ページの順リンクを 1 段辿った先の Web ページのソースを全て取得する.取得 した Web ページのソースに対して次のような方法でランキング付けを行う.現 在閲覧している Web ページから m ページ前 (n ≥ m ≥ 1) までの閲覧履歴の各 Web ページの特徴ベクトルを平均したベクトルを,閲覧履歴の特徴ベクトルと

(18)

=

=

図 6: 閲覧履歴ページの特徴ベクトルの変化の方向性 する.この特徴ベクトルと類似度の高い特徴ベクトルを持つリンクを 1 段辿っ た先の Web ページのランキングを高くする.このランキング上位の Web ペー ジ群を現在閲覧している Web ページの構造的周辺空間とする. このようにして生成した構造的周辺空間は,閲覧履歴内の Web ページの変化 の方向性を考慮して,その方向性に沿うような Web ページを収集した Web ペー ジ群である.よって,構造的周辺空間は,利用者が次に欲する Web ページと推 定される Web ページに類似している Web ページ群と見ることが出来る.

A

B

C

D

1

2

m

図 7: 構造的周辺空間の生成

(19)

尚,類似度の算出方法としては様々な方法が考えられるが,後述のプロトタ イプでは,各 Web ページの特徴ベクトルを元にコサイン相関数によって類似度 を求めた.

sim(x, y) = |x||y|x · y

4.5

内容的周辺空間の生成

内容的周辺空間とは,現在閲覧している Web ページと内容的に類似している Web ページ群である.そこで本研究では,内容的に類似している Web ページを 検索する方法として,各 Web ページから抽出した特徴キーワードとアンカーキー ワードを組み合わせ,ロボット型検索エンジンを用いた AND 検索による検索を 行った.本節では内容的周辺空間の生成法について述べる.以下で行う Web ペー ジ検索には既存の検索エンジンを利用する.まず閲覧履歴から各 Web ページの 特徴キーワードとアンカーキーワードを抽出し,これらを用いて AND 検索を行 う.AND 検索は図 8 のように (Kn,An,Kn−1),(Kn−1,An−1,Kn−2),・・・,(K1,A1,K0) を検索キーワードとして n 回行う.これらの AND 検索の結果のうち各検索結 果におけるランキング上位の Web ページのみを抽出し,更にそれらランキング 上位の Web ページ群を統合した Web ページ群を,現在閲覧している Web ペー ジの内容的周辺空間とする. Kn-2 An-1 Kn-1 Kn-1 An Kn K0 A1 K1 Pn Pn-1 0 Pn-2 AND AND AND Kn-2 An-1 Kn-1 Kn-1 An Kn K0 A1 K1 Pn Pn-1 0 Pn-2 AND AND AND 図 8: 内容的周辺空間の生成

(20)

(Ki,Ai,Ki−1)(n ≥ j ≥ 1) について考えると,Kiはリンク元の Web ページを

最も特徴付けるキーワードであり,Aiはリンクナビゲートする際の利用者の意図

を反映したキーワードであり,Ki−1はリンク先の Web ページを最も特徴付ける キーワードである.よって (Ki,Ai,Ki−1) を検索キーワードとした AND 検索の 検索結果の Web ページ群は,Piから Pi−1への Web 空間上での経路と,内容的 に類似している Web ページ群と考えることが出来る.上記の理由により,内容 的周辺空間は n ページ前までの閲覧履歴に類似しているページ群と考えること ができる.

Ki Ai Ki-1 Ai-1 Ki-2

Pi-2 Pi-1

Pi

(21)

5

Web

標識

本研究で提案した Web 標識は,Web 空間に交通標識メタファーを導入したも のである.Web 空間で情報探索を行って Web ページ間を移動することは,実世 界に置き換えると,ある地点から他の地点へ移動する,ということに似ている と考えられる.そこで,実世界において移動する際に利用者の為に役立ってい る交通標識を Web 空間に導入することで,Web 空間において利用者が理解し やすく,且つ利用者の役に立つものを提案できるのではないかと考える.また, 交通標識は利用者が普段見慣れている可能性が高い.よって,Web 空間に交通 標識メタファーを導入して生成された Web 標識は,一見しただけでその概念を 理解しやすいと思われる.この Web 標識の利用により,利用者が欲する情報に 効率的に辿り着くことを支援することが出来ると考える. Web 標識の役割はブックマークと対になるものとして考えている.ブックマー クがかつて閲覧したページへの案内であるのに対し,Web 標識は未閲覧の Web ページへの案内も表示することが出来る.図 10 は実際に kakaku.com のトップ ページからスタートして 4 回リンクを辿った時に表示される Web 標識をイメー ジしたものである. / [ ] 図 10: Web 標識のイメージ

(22)

5.1

構成方法

生成した周辺空間を Web 標識に表示する際に,各ページに対応するノード を Web 標識内のどの場所に表示するかを決定する必要がある.その決定方法は 様々な手法が考えられるが,本研究では FastMap を用いて,構造的周辺空間を 生成する Web ページ群の特徴ベクトル,内容的周辺空間を生成する Web ペー ジ群の特徴ベクトル,及び現在閲覧している Web ページの特徴ベクトルを,よ り低次元の空間に射影し,その射影結果を用いて Web 標識を構成する. FastMap を利用する以外にも構成方法は様々考えられる.FastMap 以外の構 成方法で構成した Web 標識の一例のイメージ図として図 11 を示す. / [ ] 図 11: その他の構成方法で構成した Web 標識のイメージの一例

5.2

利用方法

Web 標識内の各ノードは各 Web ページに対応する.Web 標識は,利用者が システムに Web 標識の要求を通知した際や,一定のページ数を閲覧した際に表 示することとする.Web 標識内のノード及びノード名を選択すると,そのノー ドに対応した Web ページにナビゲートする.また,利用者は Web 標識を利用 することなく通常のリンクナビゲーションをすることもできる. Web 標識内に表示されるノードの個数、及び Web 標識の縮尺の規模は利用者 の要求に応じて変更できるようにする.図 12 は Web 標識の縮尺の規模を変更

(23)

する様子のイメージ図である.

(24)

6

プロトタイプの実装

6.1

基本的概念

FastMap をどのように用いるかによって生成される Web 標識は異なってく る.本研究のプロトタイプでは,構造的周辺空間を生成する特徴ベクトルと閲 覧履歴の特徴ベクトルを 2 次元空間に,内容的周辺空間を生成する Web ページ 群と現在閲覧している Web ページの特徴ベクトルを 1 次元空間に射影する.そ の後,この 2 つの射影空間を統合し,統合した射影空間を用いて Web 標識を構 成する.また,Web 標識内の垂直軸を基準に構造的周辺空間を,水平軸を基準 に内容的周辺空間を表示する. 6.1.1 垂直軸 FastMap を用いて,構造的周辺空間を生成する特徴ベクトルと閲覧履歴の特 徴ベクトルを 2 次元空間に射影する.2 次元空間に射影する際の基準となる pivot objects は,元の特徴ベクトル空間において,現在閲覧している Web ページに 対応する点とその点からのユークリッド距離が最も長い点の対,及び 2 点間の ユークリッド距離が最も長い 2 点の対,の 2 組とする.ここで,pivot objects に現在閲覧している Web ページに対応する点を利用したのは,FastMap によっ て低次元に射影した空間における 2 点間の距離に,現在閲覧している Web ペー ジからの類似度が反映されるようにする為である. 6.1.2 水平軸 FastMap を用いて,内容的周辺空間を生成する Web ページ群と現在閲覧し ている Web ページの特徴ベクトルを 1 次元空間に射影する.1 次元空間に射影 する際の基準となる 2 点は元の特徴ベクトル空間において,現在閲覧している Web ページに対応する点とその点からのユークリッド距離が最も長い点の対と する.ここで,pivot objects に現在閲覧している Web ページに対応する点を利 用したのは,FastMap によって低次元に射影した空間における 2 点間の距離に, 現在閲覧している Web ページからの類似度が反映されるようにする為である. 6.1.3 ノードの再配置 これらの 1 次元空間と 2 次元空間を統合した後,原点が現在閲覧している Web ページとなるように配置する.また,Web 標識内において原点より上方に全て のノードが表示されるように再配置する.再配置の方法としては,再配置前の ノード同士の位置関係をできるだけ保つようにする為に,回転行列を用いて再

(25)

配置を行った.

6.2

実装

上記の構成方法に従った Web 標識を生成するシステムのプロトタイプを実 装した.図 13 にユーザインタフェースであるブラウザの画面を,図 14 に実際 の Web 標識の画面を示す.水平軸上のノードは内容的周辺空間を構成する Web ページ群であり,水平軸より上方のノードは構造的周辺空間を構成する Web ペー ジ群を示している. 図 13: 実装した Web 標識を付加したブラウザ

(26)

Web

Web

(27)

6.3

考察

実装した Web 標識について考察を行った.

• Web 標識内に表示される Web ページには,現在閲覧している Web ページ

と関連のあるものが存在した.例としては,asahi.com のプロ野球に関する Web ページを閲覧している際に Web 標識を表示すると,関連ページとし て,プロ野球の歴史を扱った Web ページやプロ野球選手会公式 HP などが 表示された.このことから,現在閲覧している Web ページの構造的周辺空 間,及び内容的周辺空間を認知し,効率的な情報探索を行うことが可能で あると考えられる. • Web 標識の有効性は,現在閲覧している Web ページに大きく左右された. FastMap を用いて多次元データを低次元空間に射影する際,多次元データ が高次元であればあるほど各点間の距離は増大する.このため,現在閲覧 している Web ページの周辺空間の次元数によって,Web 標識内に表示でき るノードの個数が大きく異なり,Web 標識の縮尺も大きく変えなければ効 率的に Web 標識を利用することが出来なかった.従って,Web 標識を生成 する際の構成方法として FastMap 以外の手法も検討する必要があると考え られる. • 本研究にて実装したプロトタイプでは FastMap を用いて多次元データを低 次元空間に射影し,Web 標識の生成を行った.しかし,Web ページの特徴 ベクトルを各単語の出現頻度に基づいて作成したため,周辺空間の次元が かなり高次元になる Web ページもあった.特に順リンク先の Web ページ を多量に持つ Web ページにおいて,その傾向は顕著なものであった.その 結果,特徴ベクトルの作成,Web ページ間の類似度の計算,FastMap によ る低次元空間への射影に,かなりの時間を要する Web ページもあった. • Web 標識の表示をシステムに要求してから Web 標識表示までの時間は, Web 空間とのデータ通信速度に大きく左右された. • 本研究ではリンクナビゲーションをしている利用者を対象として,Web 標 識を表示することを考えてきた.しかし,それ以外のナビゲーションをし ている利用者については考慮していない.今後は,その他のナビゲーショ ンをしている利用者に対してどのような Web 標識を表示すれば,効率的な 情報探索を支援できるか検討する必要がある.

(28)

• 現在のプロトタイプでは交通標識メタファーのうち,案内標識のみを Web 標識に導入している.しかし,実世界の交通標識には,案内標識以外にも, Web 空間に導入した際に有益と思われる標識が数多く存在する.今後は案 内標識以外の Web 標識を表示することも検討する. 図 15: 関連ページを表示する Web 標識の例

6.4

アプリケーションの応用例

6.4.1 Webページの自動的閲覧 Web ページの閲覧において,現在閲覧しているページと内容的に類似してい るページへの順リンクを辿り,現在閲覧しているページの後に続けて閲覧した い,という利用者の要求が考えられる.構造的周辺空間を構成する Web ページ 群の中で,現在閲覧している Web ページと内容的に類似している Web ページ は,Web 標識内で垂直軸に沿って表示される.このことを利用すれば,そのよ うな要求を持つ利用者に対して,常に現在閲覧しているページと内容的に類似 度の高いリンク先のページに自動的に閲覧させるような機能を,Web 標識シス

(29)

テムに付加させるようにすることも可能である.この機能を付加させた Web 標 識を利用することは,Web ページの閲覧の簡単化につながると考える.更に, Web 標識は交通標識メタファーを導入したものであるため,実世界において自 動車を運転しているように利用者が振舞うことで,Web 空間をドライビングす るような感覚で Web ページの閲覧を行うことの出来るシステムも考えられる. 図 16: Web ページの自動的閲覧 6.4.2 クラスタリングを行った大規模な周辺空間への案内 本研究では,Web 標識を現在閲覧している Web ページの周辺空間への案内と して利用した.Web 標識のその他の利用方法として,より大規模な周辺空間に 対しての周辺案内が考えられる.Web ページの閲覧を全て終えた後,自分が今 回閲覧した Web ページの周辺には一体どんな未閲覧ページがあったのか,自分 がどんな情報空間のどのあたりを閲覧していたのか,を利用者に提示する為の 表示方法として Web 標識を利用する. 本節ではより大規模な周辺空間を生成し,その周辺空間に対しての案内とし

(30)

まず,第 4 節で述べた内容的周辺空間の生成法においてPn = ( その回の閲覧 履歴において最初に閲覧した Web ページ ) として,ある回の閲覧履歴の全ての 内容的周辺空間を生成する.次に,この内容的周辺空間を構成する Web ページ 群を,各 Web ページの特徴キーワードごとにクラスタリングし,各クラスタ名 はその特徴キーワードとする.クラスタ名となっている特徴キーワードは,そ のクラスタを構成する Web ページ群における主な話題と考えることが出来る. ここで閾値を設けて,ある一定数以上のページ数を持たないクラスタは破棄す る.このようにして収集されたクラスタ群は,ある回の情報探索における閲覧 履歴内の全ての経路の周辺空間となっている.次に各クラスタのそれぞれの平 均特徴ベクトルを計算し,これを各クラスタの特徴ベクトルとする.閲覧履歴 の各ページの特徴ベクトルと,各クラスタの特徴ベクトルを FastMap などの方 法でマッピングし,閲覧履歴内の各ページにおける Web 標識を生成・表示する. クラスタの大きさを利用者に提示すれば,利用者は,大きな話題を持つ未閲覧 の Web ページ群を発見することができる.このことにより,次回以降の Web ページ閲覧において,利用者にとってより有意義で効率の良い情報探索を支援 することが出来ると考える.

(31)

Kn-1 Pn-2 1 Kn Pn Kn-2 K1 0 K0 An An-1 An-2 A1 Pn-1 図 17: クラスタリングを行った大規模な周辺空間への案内

(32)

7

結論

本研究では,利用者が現在閲覧している Web ページの周辺空間への案内を, 利用者に対して提示することにより,利用者の効率的な情報探索を支援するた めの.交通標識メタファーを用いた Web 標識の提案を行った.Web 標識は以下 の方法で生成を行う. • ”利用者のアクティビティの一つである閲覧履歴から,利用者の意図が抽出 できる”という考えに基づき,利用者の閲覧履歴から特徴量を抽出する. • 抽出した特徴量を利用して現在閲覧している Web ページの周辺空間を検 索・生成する. • 生成した周辺空間への案内をする,Web 標識を生成する. また,本研究で提案した Web 標識のプロトタイプを FastMap を用いて実装 し,現在の Web 標識の構成方法による問題点についても検討した.今後は案内 標識以外の交通標識メタファーを用いた Web 標識についても検討し,現在の問 題点についての解決策についても検討していく予定である.

(33)

謝辞

研究全般にわたってご指導賜りました情報学研究科田中克己教授,角谷和俊 助教授に厚く御礼申し上げます. また、研究全般にわたって御助言を頂きました中島伸介氏に深く感謝の意を 表します. そして,その他全般に対し御協力頂きました田中研究室の皆様に深く感謝の 意を表します.

(34)

参考文献

[1] 中島伸介,黒田慎介,田中克己 : 閲覧履歴を反映したコンテクスト依存型 Web ブックマーク,Proc.of.DBWeb2001,情報学会シンポジウムシリーズ Vol.2001, No.17,pp.201-208 (2001).

[2] http://chasen.aist-nara.ac.jp/index.html.ja

[3] C.Faloutsos and K.I.Lin : FastMap: A fast algorithm for indexing, data-mining and visualization of traditional and multimedia datasets, Proc.ACM SIGMOD June, pp.163-174 (1995).

[4] Mountaz Hascoet : A User Interface Combining Navigation Aids, Proc.of.the eleventh ACM on Hypertext and hypermedia, pp.224-225 (2000).

[5] Elmer S. Sandvad, Kaj Gronbak, Lennert Sloth and Jorgen Lindskov Knud-sen : A Metro Map Metaphor for Guided Tours on the Web: the Webvise Guided Tour System, www10 Conference Proceedings, pp.326-333 (2001).

図 3: A Metro Map Metaphor
図 4: Web 標識利用の流れ
図 9: 経路の周辺空間
図 12: Web 標識の縮尺の規模の変更
+2

参照

関連したドキュメント

Webカメラ とスピーカー 、若しくはイヤホン

When change occurs in the contact person name, address, telephone number and/or an e-mail address, which were registered when the Reporter ID was obtained, it is necessary to

特に LUNA 、教学 Web

ユーザ情報を 入力してくだ さい。必要に 応じて複数(2 つ目)のメー ルアドレスが 登録できます。.

[r]

 KSCの新たなコンセプトはイノベーションとSDGsで

教職員用 平均点 保護者用 平均点 生徒用 平均点.

[r]