• 検索結果がありません。

基礎情報処理Ⅱ 第2回

N/A
N/A
Protected

Academic year: 2021

シェア "基礎情報処理Ⅱ 第2回"

Copied!
48
0
0

読み込み中.... (全文を見る)

全文

(1)

情報システム入門

B

2-3回

担当:三笠俊哉

(2)

情報化社会における「情報」

情報とは・・・ ① 知識(実質的定義) ② 知識+ネットワーク+流れ(存在論的定義) ③ データ(形式的定義) 2

(3)

情報は誰のものか?

• ICT出現以前 ▫ 創作者に帰属する(オリジナルの優越性) • ICT出現以後 ▫ 共有財(オリジナル/コピーの違いがない) 3

(4)

メディアとは何か

メディア=「媒介するもの」

送信者から受信者へのメッセージ伝達手段

(5)

メディアと人間

「メディアとは人間の拡張」 • メディアの技術によって個人が拡張する ▫ 遠くと意思疎通ができる ▫ 速く意思伝達ができる • 社会的関係性が変化する ▫ 消費者と生産者 ▫ 支配者と被支配者 5

(6)

インターネットと人間

サイバー空間は現実世界と違うのか? • 「身体を持たない」という意味では現実世界と サイバー空間は異なる。 • 行為の帰結が「現実社会に影響を与える」とい う意味では両者は異なるものではない。 6

(7)

サイバー空間の危険性

• ウェブサイト,掲示板,SNSなどの悪意ある書 き込みや炎上 • 非合法行為の巣窟化するサイトの登場 • 無意識のうちに非合法行為へ加担してしまう。 • ネットストーカー 7

(8)

なぜ問題化するのか?

• 「ネットの身体性の欠如,匿名性」を現実世界 からの独立と取り違える。 ▫ 「私」がないかのような錯覚 • 一度出てしまった情報をコントロールできない。 ▫ ログを消えない 8

(9)
(10)

情報流通の構造

10 直接的,マスメディア的から ネットワーク型へ • 双方向 • 広範囲に分布 • コントロールなし (不可能)

(11)

シングルチャンネル化する情報流通

多様な流通パターンのために 経路(手段)が限られる。 マルチメディアとは 「すべてが0か1で表現されるデジタルデータに還 元され,それによってインターネットというただ ひとつのネットワークを介してやり取りできるよ うになること」 11

(12)

情報流通という力

20世紀までは,国家単位で情報を統制できた • 戦時下の情報統制 21世紀には • 国家単位で情報を統制することは難しい。 • 国以外の団体が,国境を越えて大きな影響を持 つ傾向がある。(宗教,多国籍企業) 12

(13)

アーキテクチャーによる支配

• 法律以外の方法で社会が支配される • 「グーグル八分」 ▫ グーグルの検索結果から排除されるサイトは,誰 も到達できない。 ▫ 排除する理由はグーグルが決める。  犯罪にからむサイト  権利侵害の通報があったサイト  その他? 13

(14)

規制の多重化

国による法規制と団体による規制

両方の規制は 同じ方向を向いているかもしれないし, 相克するかもしれない。 規制が複雑で巧妙になる 14

(15)

• 普段,用いられている数字の表記法は,十進数 表記法という。 ▫ 十進数表記法では,数字が書かれている場所に よって,表現している数の重みが決まっていた。 ▫ 2008 を例にとると,「2」の重みは右から4番目 なので,右端を0とすると103=1000となる。 ▫ 全体としては下のようになる。

0と1の世界(二進数表記法)

2008

10

8

10

0

10

0

10

2

3

2

1

0

15

(16)

• 二進数表記法で用いる数字は,0, 1 の二つだけ • すると,二進数では<0, 1,2,3,4,5,

6>という数列は,

≪0, 1, 10, 11, 100, 101, 110≫となる。

(17)

数と記数法

• 数(自然数)とは何か? 「1, 2, 3, ・・・」 「一,二,三,・・・」 • 自然数の公理(ペアノの公理) 1. 1は自然数である。 2. xが自然数ならば,x+1(xの後継者)は自然数である。(自 然数にはかならず後継者がある) 3. x+1=y+1ならばx=yである。(後継者が同じなら同じ数) 4. x+1=1となるようなxは自然数ではない。(後継者と自身が 同じになることはない) 5. 数学的帰納法 A) 1がある性質Sを満たす。 B) xがSを満たすとき,x+1もSを満たすなら,すべ ての自然数はSを満たす。 17 自然数の公理を満たすも の

(18)

十進法と数

• 特徴 ▫ 十個の数字を用いる ▫ 数えるときは,十個でまとめる。 • 十進法はペアノの公理を満たす • 十進法は日常的な計算の場面でほどほどに使い勝手がよい。 • だからといって,他の記数法に比べて,絶対的に優位なわけではな い。 18

(19)

二進数と数

• 特徴 ▫ 数を二つずつまとめる。(0,1) ▫ ペアノの公理を満たす。 • 各桁の0 / 1を,電気信号のon/offに対応させる ことで,コンピュータで用いる数体系として適 当。 19

(20)

十六進法

• 特徴 ▫ 16個の数を用いる。 ▫ 数字={0,1,2,3,4,5,6,7,8,9,a,b,c,d,e,f} ▫ ペアノの公理を満たす。 ▫ 大きな数を少ない桁数で表すことができる。 • 色指定やIP ver.6で用いられる。 20

(21)

N進法

• 一般にN進法とは,数をN個ずつまとめて表すや り方。 • あるN進法で表された数a1a2a3a4a5(a1a2a3a4a5)N と表記することにすると, 21 0 1 1 1 1 0 1

)

(

a

k

a

k

a

N

a

k

N

k

a

k

N

k

a

N

a

(22)

十進法←→二進法の変換

22 • 十進法→二進法 ▫ 20を変換する • 二進法→十進法 (10100)2を変換する 20=(10100)2

(23)

問題の解答

• (10100)2を十進数に変換する。

1 0 1 0 0

23 24 22 20 23 21

18

)

10100

(

0

2

0

2

1

2

0

2

1

2

)

10100

(

2 0 1 2 3 4 2

(24)

練習問題

• (1) IP v.6 のアドレス ABCD:EF01:2345:6789:ABCD:EF01:2345 :6789 • の下線部分を十進法に直せ。 • (2)#ffb6c1 は色の十六進法による表記の一例 である。この数値を十進法にせよ。 24

(25)

コンピュータと言語

• コンピュータにとって言語とは何か?

• コンピュータの多言語処理

• インターネットと日本語

(26)

コンピュータにとって言語とは何か?

• 人間の言語 【自然言語(日本語,英語,ドイツ 語,中国語)】 ▫ コミュニケーションの手段 ▫ 記録の手段 • コンピュータの言語 【人工言語(C言語,Java, Perl)】 ▫ コンピュータの実行手続きを定める命令 ▫ プログラミング言語 26

(27)

コンピュータにとって自然言

語とは?

• 文字,テキスト ▫ 記号の羅列(コード) • 文章 ▫ 文字の羅列(コード) 文字の羅列 1. 「今日はよい天気です」(理解可能) 2. 「す今で日よは気い天」(理解不可能) 27

(28)

自然言語はなぜコンピュータにとって

難しい?

• 「文」と「文でないもの」の区別をつけ難い ▫ 「本日は晴天なり」 ▫ 「日は本な晴り天」 • 同じ単語でも色々な意味がある ▫ (酒の)さかな(肴) ▫ (海の)さかな(魚) • 同じ構文でも色々な解釈がある ▫ 「黒い瞳の大きな女の子」 ▫ 「かいだんからおちてくびをおった」 28

(29)

コンピュータの多言語処理機構

• 言語を処理するのに必要なモノ 1. コード体系  文字集合  エンコード方式 2. コード列を処理するプログラム 3. 文字の入出力システム 29

(30)

文字集合

文字コードに収録したい文字を区画番号に従って配列した表 • JIS X 0201:アルファベットと半角カナ文字 • JIS X 0208:漢字を含む規格。第1水準と第2水準 にわけて使われていた。 • JIS X 0211:制御文字の規格。 • JIS X 0212:JIS X 0208を補うために制定された 規格 • JIS X 0208:(第3水準第4水準) • Unicode:世界中の文字をすべて16ビットコード に収めようという規格 30

(31)

JIS X 0208:1997,第4区 0 1 2 3 4 5 6 7 8 9 400 ぁ あ ぃ い ぅ う ぇ え ぉ 410 お か が き ぎ く ぐ け げ こ 420 ご さ ざ し じ す ず せ ぜ そ 430 ぞ た だ ち ぢ っ つ づ て で 440 と ど な に ぬ ね の は ば ぱ 450 ひ び ぴ ふ ぶ ぷ へ べ ぺ ほ 460 ぼ ぽ ま み む め も ゃ や ゅ 470 ゆ ょ よ ら り る れ ろ ゎ わ 480 ゐ ゑ を ん 490 31

(32)

ASCIIコード表

(33)

エンコーディング方式

文字表をエンコーディングスキームに従って0と1の組み合 わせに置き換える • ASCIIコード:7ビットを1単位。128通りの文字が収録可 能。8ビットの拡張ASCIIで欧米文字全般が収録可能な ように拡張された。 • JISコード:16ビットを1単位。65536通りの文字が収録 可能。 33

(34)

文字の符号化

- ASCIIコード

• American Standard Code for Information Interchange • もっとも初期からある基本的な文字コード • 1文字を7ビットで表現する。 • 収録文字 ▫ アルファベット:26×2 ▫ 特殊記号,制御文字,空白 • ASCIIコードをもとに,後にISO 646が制定され た。 34

(35)

漢字コード

• 日本語 ▫ ひらがな ▫ カタカナ ▫ 漢字 • 多くの文字が多いので1文 字に2バイト使う 代表的な日本語コード • Shift JIS • EUC • UNICODE 35

(36)

ASCIIコード(1963年)とISO 646

ASCII • アメリカで標準化さ れた文字コード (American Standards Association ) ▫ ローカルコーディン グの乱立を防ぐ • 7ビット(2の7乗) コード • アルファベット、数 字、英語で用いられ る記号 ISO 646 • ほぼASCIIと同じ国際 コード • 通貨単位など,国ごと に違うものについては, 国ごとの変更がある。 36

(37)

http://e-words.jp/p/r-ascii.html

(38)

ASCII(ISO 646)でできないこと

• 拡張アルファベットの表示 ▫ À Á Ä Â à á â ä アクセント記号付き文 字 ▫ ß œ • アジア系言語の表示 拡張アルファベットの表示のため、ローカルが拡 張を行う (ISO 2022) 38

(39)

ISO 2022(1968年)

• 各国ごとに文字を文字集合として定義。 • 入力時には,文字集合を指定する。 ▫ 同じコードに複数の文字を割りあてる。 ▫ より多くの文字を収録することが可能。 39

(40)

日本語の文字コード

– JISローマ字 カナ

• JIS C 6220 : ISO 646と並列して使うため制定。 • ISO 646 との共存方法 ▫ 制御記号のシフトアウト,シフトインでの切り替 え。 ▫ 8ビット二階建方式  カナコードの前には1をつける  一つのコードに二つの文字を割り当てる。 40

(41)

日本語コード化の問題点

• 字種の不足と異体字の存在 ▫ 漢字の数は膨大(「諸橋大漢和辞典」親字5万) ▫ 文字そのものがコード化されていない場合,コン ピュータでその字は使えない(字種の欠如) ▫ 同じ字でも別の字体がない場合  鴎 鷗,間 閒,斉 齋 • 異体字が発生するメカニズム ▫ 伝統的な漢字が近代以降に簡略化された ▫ 人名異体字 ▫ 学術的な要請 41

(42)

ユニコード(

UNICODE)

の誕生

• 日本,中国,台湾,韓国(漢字文化圏)でのコードの違 いが大きい ▫ JIS(日本), GB(中国),BGI5(台湾),KS(韓国) • 複数の漢字コードを統合する ▫ ユニコード・コンソーシアムによる業界標準コード ▫ 主要な企業の参加(マイクロソフト,ゼロックス,アップ ル,IBM) • UNICODE 2の誕生(1993年) ▫ 3万8千字以上の文字を収録 ▫ JISコードのほとんどを収録 42

(43)

UNICODE 2の意義と問題点

• 地域,国籍を問わず,地球上の 字をとにかく集めて収録しよう とした。 • 万国共通コード • 独自コードからの移行コストの 負担が大きい • 文字収録にあたって,地域固有 の文化的背景はどの程度考慮さ れたのかが曖昧 地球連邦的発想 国家主導的発想 43

(44)

今後の課題は?

• 東南アジア,南アジア,アフリカといった地域 の言語をどう扱うのか。 • インターネットでの情報交換に用いられる言語 は? ▫ 実質共通語としての英語を使う ▫ ウェブサイトの多言語対応を促進する ▫ 機械翻訳の開発をする 44

(45)

演習

• Excelのcode関数を用いて次の文字のASCIIコー ドまたはJISコードを調べなさい。 1. A 2. a 3. 7 4. 9 45

(46)

演習

1. 配布されたプリント(次ページ)のHTMLソー スをエディタを用いてファイルに入力する。 2. ファイルをcoding-sjis.htmlとして保存する。 3. ブラウザで開く。 4. ブラウザの[表示]から「エンコード」と辿り, エンコード方式を別のUNICODE 8に変更して みなさい。 46

(47)
(48)

excelと文字コード

• code関数:セルに入力されている文字列の先頭 文字をASCIIまたはJISコード番号に変換する。 • char関数:セルに入力されているASCIIまたは JISコード番号を文字に変換する。 • jis関数:半角英数カナ文字を全角文字に変換す る。 • asc関数:全角英数カナを半角英数カナ文字に変 換する。

参照

関連したドキュメント

アメリカ心理学会 APA はこうした動向に対応し「論 文作成マニュアル」の改訂を実施してきている。 21 年前 の APA Publication Manual 4th Edition(American

事務情報化担当職員研修(クライアント) 情報処理事務担当職員 9月頃

QRコード読込画面 が表示されたら、表 示された画面を選択 してウインドウをアク ティブな状態にした 上で、QRコードリー

地図・ナビゲーション 情報検索・ニュース 動画配信 QRコード決済 メッセージングサービス SNS 予定管理・カレンダー オークション・フリマ

Google マップ上で誰もがその情報を閲覧することが可能となる。Google マイマップは、Google マップの情報を基に作成されるため、Google

平成 30 年度介護報酬改定動向の把握と対応準備 運営管理と業務の標準化

NCP43080 Secondary Side Synchronous Rectification Driver SOIC-8, DFN-8, WDFN-8 NCP4305/8 High Performance Secondary Side Synchronous Rectification Driver SOIC-8, DFN-8,

Screening test methods for efficacy of anti-fouling