• 検索結果がありません。

小田耕平 名城大学理工学部情報工学科 GOOGLE を支える技術

N/A
N/A
Protected

Academic year: 2021

シェア "小田耕平 名城大学理工学部情報工学科 GOOGLE を支える技術"

Copied!
16
0
0

読み込み中.... (全文を見る)

全文

(1)

GOOGLE

を支える技術

名城大学理工学部情報工学科 小田耕平

(2)

書籍紹介

Google

を支える技術

-巨大システムの内側の世界 技術評論社

西田圭介 著

(3)

Google

とは

Web

検索エンジン

1998

年に米国の二人の学生によって作られた。

いかに役立つ情報を見つけられるかを重視。

(4)

役立つ情報を見つけるために

(1)

Page Rank

役にたつページはあちこちからリンクされている

概念

webページは自分の点数を持つ

他のページにリンクすると、自分の点数を配分する。

自分の点数は、他のページからもらった点数の合計 で決まる。

(5)

役立つ情報を見つけるために

(2)

概念図

1

10

6

2 8

1

1 1

2

1 5

3

1

5 3

4 4

(6)

役立つ情報を見つけるために

(3)

アンカーテキスト

リンクに付けられた文字列

ユーザーがそれを検索しようとした時にだけ意味 を持つ

名城大学はいい大学だね。

(7)

役立つ情報を見つけるために

(4)

単語

(

単語情報

)

による検索

web

ページに含まれるすべての単語を記録 複数の単語で検索

京都 大学

大学 京都

(8)

前半まとめ

役立つ情報を見つけるためには

Page Rank

アンカーテキスト

単語による検索

(9)

検索エンジンのしくみ

(1)

検索エンジンの基本構造

検索エンジン

利用者 検索

サーバ インデックス

検索

バックエンド

インター ネット

(10)

検索エンジンのしくみ

(2)

検索サーバ

利用者との通信を管理する

利用者からのリクエストを解析し、行うべき処理を判断する。

インデックスから必要な情報を管理する。

結果を見やすくレイアウトし、利用者に送り出す。

利用者

検索サーバ

検索サーバ

検索サーバ

インデックス

(11)

検索エンジンのしくみ

(3)

検索バックエンド

インデックス

インターネット クローリング

クローラ

クローラ

クローラ

リポジトリ インデックス生成

構造解析

単語処理

リンク処理

ランキング

(12)

検索エンジンのしくみ

(5)

インデックス

データを安全に格納する。

求められたデータを高速に見つける。

インデックス

リンク情報

ドキュメント情報

単語情報

(13)

検索エンジンのしくみ

(6)

インデックスの構造

検索語 大学

タイトル 名城大学

URL http://meijo/

キー 値1 大学 101

キー

11 名城大学

21 http://meijo/

キー 値1 値2

101 11 21

(14)

効率化をはかるポイント

あらかじめ検索バックエンドによって

web

ページの 情報を解析しておく。

インデックスに格納する際に数値を使って格納を 行う。

3つの構造の連携

(15)

まとめ

検索エンジンのしくみ

検索サーバ

検索バックエンド

インデックス

(16)

ご清聴ありがとうございました。

参照

関連したドキュメント

東京工業大学

東京工業大学

情報理工学研究科 情報・通信工学専攻. 2012/7/12

関東総合通信局 東京電機大学 工学部電気電子工学科 電気通信システム 昭和62年3月以降

理工学部・情報理工学部・生命科学部・薬学部 AO 英語基準入学試験【4 月入学】 国際関係学部・グローバル教養学部・情報理工学部 AO

学識経験者 小玉 祐一郎 神戸芸術工科大学 教授 学識経験者 小玉 祐 郎   神戸芸術工科大学  教授. 東京都

講師:首都大学東京 システムデザイン学部 知能機械システムコース 准教授 三好 洋美先生 芝浦工業大学 システム理工学部 生命科学科 助教 中村

物質工学課程 ⚕名 電気電子応用工学課程 ⚓名 情報工学課程 ⚕名 知能・機械工学課程