情報通信ネットワーク２００５・４・１５

(1)

情報通信ネットワーク

WWW編

京都教育大学産業技術科学科

多田知正

[email protected]

(2)

用語の定義

⚫ 計算機 ⚫ コンピュータのこと ⚫ データ ⚫ 計算機で扱う情報のこと ⚫ 文字（テキスト），画像，音声など ⚫ 通信 ⚫ 計算機間でデータをやり取りすること ⚫ ネットワーク ⚫ 複数の計算機が接続され，通信を行うことができる仕組み ⚫ 送信，受信 ⚫ データを送ること，受け取ること ⚫ サーバ ⚫ 他の計算機にサービスを提供する計算機 ⚫ クライアント ⚫ サーバからサービスを受ける計算機 ⚫ ユーザ ⚫ 計算機を使う人間

(3)

今回のテーマ

今や_{インターネットといえばWWW} _{(World Wide Web)}

「ネットしてる」？インターネット自体は WWWの登場する前から存在したしかしインターネットが爆発的に普及したのは WWWのおかげインターネット実際は，WWWはインターネットの利用法の一つ電子メールファイル転送など

(4)

今回のテーマ

Internet Explorer 1.0の登場が1995年当時，WWWなんて知っている人はほんのわずか今ではWWWは誰でも知っている当たり前の存在になったこの間_{たったの23年} ⚫ あっという間にWWWがこんなに普及したのはなぜか？ニコ動はおもしろいねぇ

(5)

インターネットでできること

世界中の計算機とデータのやりとりができる

diary.txtを送ってください

世界的な規模での情報の共有が可能になった

(6)

ところが

インターネットが生まれた当初

ほとんどの人は利用していなかったなぜか？

(7)

ファイルの入手

ある会社の地図のファイルが欲しいとき計算機の名前やファイル名を調べるのは面倒そちらの地図を保存している計算機の名前は？地図のファイル名は？さあーよく分かんない_ですねえ

(8)

テキストと絵

絵の入った文書を扱うとき文書のファイルと絵のファイルを別々に取ってくるのは面倒テキストの中に絵を埋め込むことができないこの前旅先で見た並木道がきれいだったので思わず写真をとりました photo1.jpgを見てください … diary20020901.txt photo1.jpg

(9)

「できる」と「する」の違い

人間は基本的に「面倒なことはやらない」面倒利用者多当時のインターネット簡単当時のインターネットはできることは確かにすごいがかなり面倒だった →本当に必要な人しか使わない利用者少

(11)

「できる」と「簡単」の違い

WWWによって情報の共有が簡単になった WWW WWWは技術的にはそれほどすごくないが「簡単になった」ことで使う人が増え始めた面倒利用者多簡単利用者少その結果すごいことが．．．

(12)

WWWの爆発

使う人が増える情報提供者が増える便利になる情報が増えるますますますますますますますますかくしてWWWを使う人はますます．．．．増えていったこういうのをポジティブ・フィードバック(positive feedback)という

(13)

WWWの構成要素

代表的なもの Microsoft Edge mozilla Firefox Google Chrome Opera など WWWブラウザ WWWサーバユーザの代わりに面倒なことを引き受けてくれる WWWで共有する情報を保存している計算機

(14)

WWWブラウザがやっているこ

と

• URLからWWWサーバのIPアドレスの問い合わせ（DNS）を行い • WWWサーバからURLで指定された文書のファイルを入手して • 画像が埋め込まれているときは画像のファイルも入手して • 文書と画像をいい感じに配置して表示して • とってきたファイルが音声ファイルならば音を再生して • リンクがクリックされたときには指定されたファイルを入手して表示して．．． WWWサーバ WWWブラウザ実はかなり複雑なプログラム

(15)

WWWのお約束

WWWブラウザとWWWサーバは

HTTP (HyperText Transfer Protocol)というプロトコル

にしたがってデータをやり取りする

WWWでやりとりされる文書は

HTML (HyperText Markup Language)という言語

で書かれている

HTTP

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">

(16)

HTMLとは？

HTMLとは

WWWで共有する文書を作る際に

構造を正しく伝えるために守らないといけない約束ごと

(17)

文章の構造

人間はふだん見た目から文書の構造を把握している節の表題段落データグリッドにおける並列ファイル転送手法 1. はじめにデータグリッドは世界中に分散した計算機とストレージ資源を接続し，データの共有を行うシステムである. データグリッドは，近年の科学的アプリケーションの生成するデータを保存，共有することを目的としており，そのデータ量は将来的にはペタバイトにも達すると予想されている. データグリッドには，以下のような特徴がある． • 生成されたファイルが更新されることはまれである． • 個々のファイルのサイズが非常に大きい． • ネットワーク帯域が比較的大きい本研究ではこれらの特徴を考慮して，サイト間のデータ転送を効率良く行う手法を提案する．：強調箇条書き文章の表題

(18)

文書の構造の表し方

構造をどのようにあらわすかは場合によってばらばら →人間なら見た目から推測できるデータグリッドにおける並列ファイル転送手法Ｉ. はじめにデータグリッドは世界中に分散した計算機とストレージ資源を接続し，データの共有を行うシステムである. データグリッドは，近年の科学的アプリケーションの生成するデータを保存，共有することを目的としており，そのデータ量は将来的にはペタバイトにも達すると予想されている. データグリッドには，以下のような特徴がある． ➢ 生成されたファイルが更新されることはまれである． ➢ 個々のファイルのサイズが非常に大きい． ➢ ネットワーク帯域が比較的大きい本研究ではこれらの特徴を考慮して，サイト間のデータ転送を効率良く行う手法を提案する． :

(19)

文書の構造の記述

計算機は文書の見た目から構造を推測することができない「ある決められた方法」で文書の構造を記述する必要がある HTMLは文書の構造を記述する方法を決めている • 表題 • 段落 • 箇条書き • 強調．．．など

(20)

構造を表すタグ

HTMLはタグというものを使って文の構造を表す <TITLE>データグリッドにおける並列ファイル転送手法</TITLE> <H1>1. はじめに</H1> データグリッドは世界中に分散した計算機とストレージ資源を接続し，データの共有を行うシステムである. データグリッドは，近年の科学的アプリケーションの生成するデータを保存，共有することを目的としており，そのデータ量は将来的にはペタバイトにも達すると予想されている. データグリッドには，以下のような特徴がある． <UL> <LI>生成されたファイルが更新されることはまれである．</LI> <LI>個々のファイルのサイズが非常に大きい．</LI> <LI>ネットワーク帯域が比較的大きい．</LI> </UL> 本研究ではこれらの特徴を考慮して，サイト間のデータ転送を効率良く行う手法を提案する． ：

(21)

画像の埋め込み

<IMG SRC=“photo.jpg” ALT=“並木道の写真”>これはイギリスの並木道の

写真です．みどりの木々がいい感じですね．

これはイギリスの並木道の写真です．みどりの木々がいい感じですね．

埋め込む画像ファイルのファイル名

(22)

HTMLの最大の特徴

HTMLで書かれた文書の中にリンクを埋め込める

どこがハイパーなのか？

これにより普通のテキストではなく

(23)

普通のテキスト

… TCPの概要は以上です．詳しくは詳細.txtを参照ここでは TCPについて詳しく説明します UDPについては付録.txtを参照ここでは UDPについて説明します TCPについては概要.txtを参照概要.txt 詳細.txt 付録.txt ある文書と別の文書の関係が分かりにくい別の文書を開く際にファイル名を気にしなければならない

(24)

… TCPの概要は以上です．詳しくは TCPの詳細を参照ここでは TCPについて詳しく説明します UDPについては UDPの説明を参照ここでは UDPについて説明します TCPについては TCPの概要を参照概要.txt 詳細.txt 付録.txt

ハイパーテキスト

リンクで文書を結びつける →ファイル名を知らなくても別の文書を開ける

(25)

読み方の違い

普通のテキストは前から順に読むだけ

ハイパーテキストはリンクを使って

(26)

リンクの埋め込み

昨日おいしいレストランをみつけました

昨日_{<A HREF=“http://www.triplestar.co.jp/”>}おいしいレストラン_</A>をみつけました

リンクをクリックすると表示されるURL

HTMLでは<A>タグを使ってリンクを表す

詳しくは日記のページに書いています

詳しくは_{<A HREF=“diary.html”>}日記のページ_</A>に書いていますリンクをクリックすると表示されるファイル名

(27)

構造と見た目

HTMLは文書の見た目を指定するものではない

たとえば，文字の色や

大きさ

_{はHTMLで指定すべきではない}

たとえば，文字の_{}色_や

大きさはHTMLで指定すべきではない

でも実際はできてしまう（歴史的な事情により）

でも本当はやるべきでないなぜか？

(28)

WWWページ

あなたが作成したWWWページ

(29)

アクセシビリティ

いろいろな人がWWWで情報を入手する弱視や老眼の人 →字が小さいと読みづらい目が全く見えない人（読み上げソフトを使う） →見た目から構造を把握できない色覚異常の人 →配色によっては見えない人によって，「見やすいページ」は異なる

(30)

見た目より構造

文書の見た目_{を変える→}何らかの構造を表したい • ここが段落の切れ目 • ここが箇条書き • ここを強調したいできるだけ多くの人に内容を正しく伝えるには文書の構造をきちんと伝えないといけない文書の構造をどのように表示するかはそれを読む人が決めるべき

(31)

それでも見た目にこだわりたい

そうは言っても，多くの人にとって，見た目の_{きれいなWWWページはアピールする}のは確か HTMLの各要素ごとにどのように表示するかを書いておくファイル背景は薄い水色通常の文書は黒の明朝体強調は赤のゴシック体のイタリック．．．ページの見た目を整えたい場合 →スタイルシートで指定する

(32)

自分用のスタイルシート

ユーザはページ作成者の提供するスタイルシートではなく自分用のスタイルシートを利用することができる →どんなページも自分の好きな形で見られる私のホームページへようこそ私のホームページへようこそ ☆ 自転車について ☆ 日記 ☆ 掲示板 • 自転車について • 日記 • 掲示板元々のスタイルシート自分用のスタイルシート

(33)

情報の発見

京都教育大のWWWサイトに行けば • 住所 • 地図 • 最寄り駅などの情報がすぐ手に入る京都教育大のWWWサイトのURLは？ WWWのおかげで情報を入手するのはすごく簡単になった情報の「発見」は難しい京都教育大の場所が知りたい

(34)

検索エンジン

WWWの場所を教えてくれる情報の「発見」を簡単にするディレクトリ型検索エンジン (昔の)Yahooなどロボット型検索エンジン Googleなどディレクトリ型の検索エンジンは絶滅

(35)

ロボット型検索エンジンのしく

み

ロボットと呼ばれるプログラムが自動的にいろんな_{WWWサーバを回って} WWWページの情報を集めてくるロボットが集めたWWWページからキーワードを抜き出し，自動的にインデックス（索引）を作成するキーワードの問い合わせが来たらインデックスを探して該当するWWWページへのリンクを表示する

(36)

ロボット型検索エンジンの欠点

キーワードを含んでいればどのようなページも表示 →関係のないページが多数表示されるたとえば「旅行」で検索すると．．．旅行会社のページ旅行ガイドのページ誰かの日記のページ ABCトラベル初めての海外旅行の手引き修学旅行の思い出この前の旅行楽しかったどこかの学校のページ

(37)

Google

ところが

「探しているページ」が検索結果の上位に表示される

いったいなぜか？

(38)

Googleのからくり

すべてのWWWページに得点をつけてランクづけしている与えられたキーワードに一致するページを得点の順に表示する 1 2 3

(39)

Googleの得点のつけ方

WWWページのリンクに着目誰かが自分のページからあるページにリンクを張る →その人がそのページは価値があると判断した多くのページからリンクが張られているページはおそらく価値の高いページ →高い得点をつける高い得点を持つページからリンクが張られているページはやはり価値の高いページ →高い得点をつける

(40)

Googleの得点

Googleの得点はキーワードとは関係なくつけられる →得点の高いページはどのキーワードで検索しても上位にくる日本ハム優勝？そんなバナナ野球の超有名サイト（多くのページからリンクされている）「バナナ」で検索しても上位に来てしまう？この話は一部を除いてフィクションです「野球」で検索するともちろん上位に来る実際にはそれほど問題にはなっていない →良いページは誰にとっても良いページ

(41)

WWWによる新しいコミュニ

ケーション

ブログ

(42)

ブログ

個人や数人のグループで運営され，日々更新される日記的なWebサイトコメント：他人の記事にコメントを付けるトラックバック：他人の記事にリンクするとともに，相手の記事に自分の記事へのリンクを掲載する

(43)

ブログのインパクトその１

簡単に作れる • HTMLの知識が不要 • 特別な道具（ホームページビルダなど）も不要これまでWebサイトに興味の無かった人がブログを書き始めた • プロスポーツ選手 • 芸能人 • 会社の社長など．．．本当の意味で「誰でも情報発信できる」時代の到来

(44)

ブログのインパクトその２

従来のWWWは基本的に一方通行書き手にとって読み手の反応を知ることができるアクセスカウンタ掲示板リンク不特定多数との双方向コミュニケーションブログのコメントやトラックバック読み手にとって作者に感想を伝えたり反論したりできる他の人の意見を知ることができる

(45)

ブログのダークサイド

ブログが原因でトラブルに巻き込まれることも．．．書き込みが元で会社をクビになるブログの炎上ブログに多数の閲覧者がコメントを集中的に寄せる状態身元を知られ，現実に被害を受けることも

(46)

SNS（Social Network

Service）

友人，知人間のコミュニケーションを目的としている現実世界の人間関係をネット上で実現

(47)

SNSのダークサイド

SNSへの書き込みが元でトラブルになるケースが増えている反社会的な発言をして告発されるなど

「自分の知り合いしか見ていない」という意識何でも気軽に書いてしまう

(48)

時代は繰り返す

WWWが登場し始めたころ，個人のWebサイトに個人情報（実名，写真など）を掲載して，トラブルに巻き込まれた人は結構いた手軽な手段の登場により事情を知らない人がネットの世界にどんどん入ってきている昔と同じことが繰り返されている「ネットに個人情報を出すのは危険」という意識が定着

(49)

ネットワークの基本

ネット上の情報は誰に見られるか分からないいったん流出した情報は止められない企業で厳重に管理されている（はずの）情報ですら流出する「公開範囲の限定」も完全には信用できないサイトが乗っ取られることもありうるコピーし放題すさまじいスピードで広まっていくすべてのコピーを追跡し，削除するのは不可能

(50)

Webアプリケーション

(51)

Webアプリケーションのしくみ

WWWサーバからプログラム（スクリプト）をダウンロード

ダウンロードしたプログラムをWWWブラウザ上で実行

(52)

Webアプリケーションの

メリット

• インストールが不要 • どのパソコンからでも使える • パソコンがしょぼくてもOK • しんどい処理はサーバで行う • パソコンは結果を表示するだけ • そもそもパソコンではできないこともできる • とんでもなく大量のデータ，計算が必要なサービスも提供できる • ソフトウェアの管理が楽 • いつでも修正，更新できる • 全員が同じバージョンを使用 • 客からお金を取りやすい • 違法コピーの心配がない

(53)

まとめ

⚫ インターネットによって情報の共有が可能になった ⚫ WWWによって情報の共有が簡単になった

⚫ HTML (HyperText Markup Language)による文書の記述 ⚫ 画像を埋め込まれた文書が表示できる ⚫ リンクによる文書間のジャンプ ⚫ 検索エンジンによって情報の発見が簡単になった ⚫ キーワードによる検索 ⚫ Google: リンクされている数によるページのランク付け ⚫ WWWの新しいコミュニケーション ⚫ ブログ，SNS，Twitter ⚫ 個人情報の扱いには注意 ⚫ Webアプリケーション ⚫ 新しいソフトウェアの形

情報通信ネットワーク ２００５・４・１５