図書館活用法 第12講
文献・情報の探し方(7)
インターネット
和泉春学期 2018年7月4日(水)
コーディネーター 文学部 齋藤泰則先生 図書館総務事務室 角 祐⼆郎 (4時限) 中野教育研究支援事務室 久保木 和義(4時限) 図書館総務事務室 緒方 智弘 (5時限) 和泉メディア支援事務室 井上 拓弥 (5時限)本日の目標
検索エンジンを理解する
インターネット情報の特徴,注意点,
評価方法などを知る
電子資料
(
電子ジャーナルなど
)
を
使えるようになる
インターネット情報と学術データ
ベースを使い分けられるようになる
インターネットとは
全世界規模のコンピュータネットワークのネット
ワーク
1990
年頃から世界で広く使われ,近年その利活
用が目覚ましく進展,社会基盤
(
インフラ
)
家庭,企業,大学など個々のネットワークを相互
に接続するしくみ
ISP(
インターネットサービスプロバイダー
)
や学術
ネットワークに接続,それらも相互に接続
個々のネットワークはそれぞれ管理,他に調整
する非営利団体がある
3インターネットについて
メールサーバや
Web
サーバなど各種サーバが
多数設置されている
クライアント
:
サーバから提供された情報やサー
ビスを利用するコンピュータ
TCP/IP(
標準化されたプロトコル
)
IP
アドレス
(
コンピュータに割り振られる
)
ドメイン名 例
) www.meiji.ac.jp
組織名 第3レベルドメイン 業種・団体名 第2レベルドメイン 国名 トップレベルドメインWeb
インターネットにある情報やサービスのプラットフ
ォーム的なもの
ファイルのありかをリンクで指し示すしくみ
世界中にリンク
=
世界中に広がる蜘蛛の巣
(World Wide Web)
5
WWW
Webサーバ HTML 文書 ③ブラウザがHTML 文書を解釈して画面 に表示する ①ブラウザが HTTPでHTML文 書をリクエスト ②サーバがHTML文 書を返すhttp(Hyper Text Transfer Protocol) html(Hyper Text Markup Language) URL(URI, アドレス)
http://www.meiji.ac.jp/index.html
インターネットの統計
インターネット利用者数
33憶8500万人(2016年,ITU, ICT statistics)
Web
サイト数
15憶以上(2017年,http://www.internetlivestats.com その内,少なくとも2憶がActive) 7検索エンジン
Web
ページから必要な情報を検索するサービス
Yahoo! Japan
Bing
Baidu
検索エンジンのマーケット・シェア
(
日本
)
Google 70.31% Yahoo! 24.03% Bing 4.78% Baidu 0.58% 2018年5月日本のシェア, Statcounter GlobalStatsによる 9
1995
年頃 アルタビスタ,
Yahoo!
,インフォシー
クなどの検索エンジンが競合
1996
年 ラリー・ペイジとセルゲイ・ブリンが
BackRub
という検索エンジンプロジェクトに着手
ページランクを確立,しかし企業には売れず
1998
年
スタート
2000
年
検索広告
AdWords
開始,その
後サイト連動型広告
AdSense
も
2004
年
株式公開
検索エンジンのしくみ
ページランク
多くの重要なページからリンクされているページは重 要である 11 1 5 3 1 1 2 1 1 4 5 4 6 8 3 10 1 2検索エンジンのしくみ
クローラー
Web
のコピーを作る
索引の作成
転置ファイル 形態素解析検索エンジンのしくみ
検索結果の評価
(
ランキング
)
Webぺージ自身から決められる重要性(ページランク やアドレスなど) 検索語の出現回数や位置 ユーザー情報(ユーザーがこれまで何を検索したか, 推定される性別や年齢など) 検索時のコンテキスト情報(検索時の時間,PCとモバ イルのどちらから,モバイルなら場所はどこから,現 在人気の検索結果など) 100以上の指標がある 13検索と結果画面
で,「小学校 英語教育」で検索してみる
次のことも考えてみよう
学術情報として利用可能な情報をどのように見分け るか? 検索エンジンの結果だけで充分か?実習
検索結果
15 Google Scholar(後述) スニペット キャッシュ,類似 ページ 対象切替 地図,書 籍など検索結果 ツール
ツールをクリックすると言語や期間指定,完全一致指定ができるインターネット情報の評価
情報の信頼性の問題
発信者
サイトの運営者,ページの作成者 公式サイト/非公式サイト 機関・団体/企業/個人出典が明記されていること
できるだけ出典に遡って参照することも必要最新の情報が反映されているか
(
いつの情報か
)
17いろいろな検索機能
検索演算子
-(マイナス)記号 検索除外 「小学校 英語教育 -ゼミ」 OR検索 A OR B 「ORは大文字」 「(小学校 OR 中学校) 英語教育 -ゼミ」実習
いろいろな検索機能
便利機能
Site: サイト内検索 「小学校 英語教育 site:go.jp」 日本の政府サイトだけ “ “ フレーズ検索 完全一致“小学校の英語教育” Cache: キャッシュ検索 cache:www.meiji.ac.jp Filetype: ファイル指定検索 filetype:pdf Related:関連ページ検索 related:www.asahi.com 19実習
いろいろな検索機能
便利機能
スペルチェック機能 「うろおぼえな単語」 電卓機能 「22*37」 天気予報 「天気 杉並」 乗り換え検索 「明大前から横浜」 郵便番号 「住所」 数値範囲(予算,サイズなど) 5000..10000円 通貨換算、荷物配達状況 「ユーロ」実習
インターネット情報利用の注意点
レポートなどへ引用した場合は出典,アクセス情
報を明記
記載方法,SIST02形式では 著者名.“ウェブページの題名”.ウェブサイトの名称 .更新日付.(媒体表示),入手先,(入手日付). 例) 文部科学省. “大学図書館における先進的な取組 の実践例(Web版) 平成29年度”. 文部科学省. http://www.mext.go.jp/a_menu/kaihatu/jouhou/140 0575.htm, (参照2018-06-10). ※この例では更新日付,媒体表示”(オンライン)”は省略 21インターネット情報利用の注意点
再現性のなさ
Webページは改変が容易,同一のURLでも内容が変 化 Webサーバーから無くなることも多い Webページの保存 キャッシュの利用 Internet ArchiveInternet Archive
WayBackMachine
http://www.archive.org/ Webページを収集,保存,提供 1996年以降 URLを入れて検索してみる 著作権者が非公開とした情報を利用する場合には, 注意が必要国立国会図書館
WARP
http://warp.da.ndl.go.jp/ 2002年以降,日本国内 23実習
インターネット情報利用の注意点
検索エンジンでは到達できない情報がある
リンク関係でクローラーの収集対象となっていないペ ージ クローラーの収集を拒否設定していたり,パスワード が必要なページ Webアプリケーションで動的に生成されるページ データベース・サービス(OPAC,新聞DB等々) サービスの入り口までは到達できることも多い,有料サー ビスは不可のことも 例外もあるGoogle Scholar
https://scholar.google.co.jp/
25 「小学校 英語教育」 で検索してみるGoogle Schalor
学術資料を対象にした検索エンジン
学術雑誌の論文情報,抄録,[本文] 学術図書 機関リポジトリCiNii Articles, 電子ジャーナル(J-STAGE), 日本の 機関リポジトリ論文も対象になっている
本文[PDF]表示
Find it@Meijiは,[Meiji More]と同じ(学内で使うと表
示される) 電子ジャーナル有無確認や幅広く論文を探す時に