第 6 章 考察
6.2 処理時間について
本システムではまずGoogleAPIを用いて検索結果のURLを取得し、URLからHTMLファ イルを得て分析し、クラスタリングを行っている。これらの処理を検索の度にすべて実行し ていては処理時間がかかりすぎるため現実的とはいえない。処理時間を短縮し、実用性のあ るシステムにする必要がある。
クラスタリング処理については検索ごとに変化するが、HTMLファイルの分析結果はWeb ページの内容が変化しない限り不変であるので、HTMLファイルの分析までを前処理として 事前に処理しておくことで、全体の処理時間が短縮できると考えられる。
処理を行うタイミングは、一度得たURLのHTMLファイル分析結果をデータベースに蓄積 しておき、以降の検索ではデータベースに登録されているURLであれば処理を行わずにデー タベースから取り出すという方式が考えられる(図6.1)。また、定期的にWebを巡回してデー タベースにURLとHTMLファイルの分析結果を登録し、検索時に分析結果を利用するとい う方式も考えられる。前者の方式は一度目の検索に時間がかかり、後者の方式はWebの規模 が膨大であるために分析結果を保存しておく記憶容量が膨大になるという問題点がある。こ れらの問題については今後検討しなければならない。
また、階層的クラスタリングの一般的な時間計算量はO(n3)であるが、これを改善する高 速化アルゴリズムが提案されている[26][27]。また、文書ベクトルの次元数を圧縮することで クラスタリング計算時間を短縮することが可能である。
図6.1:処理時間の短縮
第 7 章 まとめ
本研究ではWebとWeb検索の現状について考察し、既存の検索インタフェースを用いて情 報指向型検索を行う際の問題点を解決する決手法として概観提示インタフェースの提案と実 装を行った。また、情報収集をより効率よく行い、情報検索と情報の保存を一連の作業とし て行うために概観提示インタフェースの機能拡張を行った。これによってユーザは情報指向 型検索を行う具体的な場面において情報収集インタフェースとして本インタフェースの利用 が可能となった。
謝辞
本研究を進めるにあたり、指導教官である田中二郎教授に様々な助言やご指導をいただき ました。深く感謝いたします。また、志築文太郎講師にはグループミーティングなどにおき まして適切なご指導をいただきました。深く感謝いたします。有益な助言、ご指導を下さっ た三末和男助教授ならびに高橋伸講師に心から感謝いたします。また、田中研究室の皆様お よびWAVEグループの皆様には研究の全般にわたり丁寧なアドバイスをいただきました。本 当にありがとうございました。最後に、私を支えてくださった家族や友人に改めて感謝いた します。
参考文献
[1] Inc. Internet Systems Consortium. http://www.isc.org/index.pl?/ops/ds/.
[2] Yahoo!Japan. http://www.yahoo.co.jp/.
[3] John Lamping, Ramana Rao, and Peter Pirolli. A focus+context technique based on hyperbolic geometry for visualizing large hierarchies. In CHI ’95: Proceedings of the SIGCHI conference on Human factors in computing systems, pp. 401–408. ACM Press/Addison-Wesley Publish-ing Co., 1995.
[4] Google. http://www.google.co.jp/.
[5] Andrei Broder. A taxonomy of web search. SIGIR Forum, Vol. 36, No. 2, pp. 3–10, 2002.
[6] Barnard J.Jansen, Amanda Spink, and Tefko.Saracevic. Real users, and real needs:A study and analysis of usr queries on the web. Information Processing and Management, Vol. 36, No. 2, pp. 207–227, 2000.
[7] 原田昌紀,佐藤進也,風間一洋. 索引篩法‐大規模サーチエンジンのための高速なランキ ング検索法. DEWS, 2003.
[8] Wojciech Wiza, Krzysztof Walczak, and Wojciech Cellary. Periscope: a system for adaptive 3D visualization of search results. In Web3D ’04: Proceedings of the ninth international conference on 3D Web technology, pp. 29–40. ACM Press, 2004.
[9] Jonathan Roberts, Nadia Boukhelifa, and Peter Rodgers. Multiform Glyph Based Web Search Result Visualization. the Sixth International Conference on Information Visualisation (IV 02), pp. 549–554. IEEE, 2002.
[10] Jock D. Mackinlay, George G. Robertson, and Stuart K. Card. The perspective wall: detail and context smoothly integrated. In CHI ’91: Proceedings of the SIGCHI conference on Human factors in computing systems, pp. 173–176. ACM Press, 1991.
[11] Vivisimo. http://search.vivisimo.com/.
[12] Clusty. http://clusty.jp/.
[13] Kartoo. http://www.kartoo.com/en index.htm/.