Microsoft PowerPoint - 情報科学概論-10.ppt [互換モード]

(1)

情報科学概論２回目

「モノとしての情報」「モノとしての情報」「情報」を，工学の対象物として取り扱うための理論と技術情報を測る情報の量情報伝達系の性能を数値として測る情報の量，情報伝達系の性能を数値として測る確率論をベースに，人間の直観にあった定式化を行う情報を伝える情報をできるだけコンパクトに表現する情報をできるだけコンパクトに表現する情報をできるだけ確実に伝える 1

出欠確認課題

出欠確認・課題

情報通信以外の分野で情報理論の技術や考え方が情報通信以外の分野で，情報理論の技術や考え方が利用できる分野，技術，応用，ビジネスを考えよ出席届兼用の用紙に記入，本講義終了時に提出知識を問うのではなく，「発想」「着眼点」を評価します．「ナルホド」「面白い」と思わせる回答を期待しています「ナルホド」「面白い」と思わせる回答を期待しています情報の学生に対する注意情報の学生に対する注意：今回の内容は「情報理論」のサブセット上記課題について高いレベルの回答を期待します 2 上記課題について，高いレベルの回答を期待します http://narayama.naist.jp/~kaji/lecture/

第

部「情報量」をどうとらえるか

良い自動車を作りたい

第一部：「情報量」をどうとらえるか

良い自動車を作りたい... 時間や距離，燃料の量などを正確に計量できないと難しい良い「情報システム」を作りたい... 情報の量を測り数値として表現することが必要情報の量を測り，数値として表現することが必要情報の「量」：情報の「量」：人間の直観と乖離した定義では意味がない我々が漠然と考えている「情報量」にマッチする定義が必要我々が漠然と考えている「情報量」にマッチする定義が必要どういうときに「情報を得た」と考えるか？どういうときに「情報を得た」と考えるか？ http://narayama.naist.jp/~kaji/lecture/

情報の獲得

情報を得る＝対象物に関する「不確かさ」が減少すること情報を得る＝対象物に関する「不確かさ」が減少すること昨日の野球の試合結果何も知らないと勝敗はわからない昨日の野球の試合結果，何も知らないと，勝敗はわからない友人から「昨日の試合，勝てなかった」と聞いた（情報を得た）情報を得る前：勝ち，負け，引き分けの３通り...不確かさ大情報を得た後：負け引き分けの２通り不確かさ小情報を得た後：負け，引き分けの２通り...不確かさ小「情報量不確かさの減少量」とするのが自然「情報量＝不確かさの減少量」とするのが自然「不確かさ」の定量化が先決

(2)

情報源と通報

情報伝達のモデル：情報伝達のモデル：情報源で発生した事象を，通信路が伝達し，観測者が受信事象を表現する具体的な「モノ」通報と呼ぶ事象を表現する具体的な「モノ」...通報と呼ぶ「通報≠ 情報」である点に注意 e ? 通信路情報源 e ? e’ e 観測者情報源の統計的性質は既知，実際に発生する通報は未知通信路は，正確に通報を伝達しないかもしれない 5

情報伝達の例

情報伝達の多くは概念上前スライドのモデルとして表現可能情報伝達の多くは，概念上，前スライドのモデルとして表現可能「イベント」「通信路の出力」：「イベント」– 「通信路の出力」：「野球の試合結果」– 「友人からの速報メール」「プログラムの出力」「ファイルからの読み出しデータ」「プログラムの出力」– 「ファイルからの読み出しデータ」「明日の天気」– 「天気予報」「画像デタ」「ＪＰＥＧ圧縮デタ」「画像データ」– 「ＪＰＥＧ圧縮データ」「敵軍隊の指令文書」– 「盗聴で得た暗号文」「イベント」「通信路」という言葉にとらわれ過ぎる必要はない 66 http://narayama.naist.jp/~kaji/lecture/

情報源の分類

情報源の分類情報源の分類アナログ情報源vs. デジタル情報源通報がアナログ的かデジタル的か通報がアナログ的か，デジタル的か記憶のある情報源vs 記憶のない情報源記憶のある情報源vs. 記憶のない情報源発生する通報に相関があるか，独立しているか定常情報源vs. 非定常情報源統計的な振舞いが時間に対して不変かそうでないか統計的な振舞いが，時間に対して不変か，そうでないか http://narayama.naist.jp/~kaji/lecture/

典型的な情報源

定常で記憶のないデジタル情報源

典型的な情報源

定常で記憶のない，デジタル情報源通報の集合は離散集合により与えられる発生する通報は以前の通報とは独立して決定される発生する通報は，以前の通報とは独立して決定される時刻をシフトしても，通報の発生確率は変化しないサイコロの目やコイン投げの結果を想定すれば良いサイコロの目やコイン投げの結果を想定すれば良い現実世界では記憶のある情報源もかなり多い現実世界では，記憶のある情報源もかなり多い人間が使う自然言語画像音声等のデタ画像，音声等のデータ ...基本的に，本講義では（最初に少ししか）扱わない

(3)

情報源のエントロピ

情報源のエントロピー

S: 以下の通報発生確率を持つ（記憶の無い定常）情報源 S: 以下の通報発生確率を持つ（記憶の無い定常）情報源 a₁ p a₂ p a_M p ... ... 通報確率 M 元情報源 p₁ p₂ pM 確率 情報源 S の一次エントロピー(first-order entropy): M



  M i i i p p S H 1 2 1( ) log (ビット, bit）の項は非負例１：この項は非負 ⇒エントロピーは常に０以上コイン投げのエントロピー：表，裏とも確率1/2...M = 2, p₁=p₂=0.5 1 ) 2 / 1 log( 5 . 0 log 5 . 0 5 . 0 log 5 . 0 ) ( 1 S     H ビット 9 ) g( g g ) ( 1

エントロピの計算例

エントロピーの計算例

例２：サイコロの目コイン投げより結果予想は難しいはず例２：サイコロの目...コイン投げより，結果予想は難しいはず 1 1/6 通報確率 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 1/6 確率 1/6 1/6 1/6 1/6 1/6 585 . 2 6 1 log 6 1 6 1 log 6 1 6 1 log 6 1 ) ( 1 S     H ビット 6 6 6 6 6 6 例３：イカサマ賭博のサイコロ 1 0.9 通報確率 2 0.02 3 0.02 4 0.02 5 0.02 6 0.02 701 . 0 02 . 0 log 02 . 0 ... 02 . 0 log 02 . 0 9 . 0 log 9 . 0 ) ( 1 S     H ビット 10 一個の指標で，予測の難しさの大小関係を定義可能 http://narayama.naist.jp/~kaji/lecture/

記憶のある情報源

記憶のある情報源は多種多様記憶のある情報源は多種多様比較的シンプルなモデルとして，マルコフ情報源がある 0 1 0/0.9 1/0.1 状態間を遷移しながら通報発生直観的には，「双六」のイメージ 0 1 0/0.4 1/0.6 スタート，ゴールはない十分時間が経過した後（定常状態）通報確率での振舞いを議論することが多い上の例の場合十分な時間が経過すると通報/ 確率上の例の場合，十分な時間が経過すると... 80%の確率で状態 “0”，20%の確率で状態 “1”を取っているはず（実際は，漸化式を立てて計算を行う）（実際は，漸化式を立てて計算を行う） http://narayama.naist.jp/~kaji/lecture/

マルコフ情報源のエントロピ

マルコフ情報源のエントロピー

0/0 9 1/0 1 80%の確率で状態 “0” 20%の確率で状態 “1” 0 1 0/0.9 1/0.1 0%の確率で状態 0/0.4 1/0.6 0 が発生する確率 0 8 0 9 0 2 0 4 0 80 0 が発生する確率... 0.8  0.9 + 0.2  0.4 = 0.80 1 が発生する確率... 0.8  0.1 + 0.2  0.6 = 0.20 ⇒ エントロピーは– 0 8log 0 8 – 0 2log 0 2 = 0 722 bit ⇒ エントロピは– 0.8log 0.8 – 0.2log 0.2 = 0.722 bit

通報を「ブロック化」すると，興味深い振舞いが見られる（情報源からの通報を複数個まとめて，一個の通報とみなす）

(4)

ブロック化の例記憶のない場合

ブロック化の例：記憶のない場合

コイン投げ２回分の通報を１ブロックにまとめる場合コイン投げ２回分の通報を，１ブロックにまとめる場合... 通報は{表表, 表裏，裏表，裏裏} の４通り表表通報表表表裏裏表裏裏 1/4 通報確率表裏 1/4 裏表 1/4 裏裏 1/4 H (S2) l 4 2 ビト結果予想は個の場合の２倍難しい H₁(S2)=log 4 = 2 ビット...結果予想は一個の場合の２倍難しい H₁(S2)は，S の通報２個分のエントロピー通報個分に換算すると 2 _{ビト} ⇒ S の通報１個分に換算すると，H₁(S2_{)/2 =}_1ビット記憶のない情報源では，ブロック化してもエントロピーは変化なし n 個まとめて予想する難しさ = n×（1 個だけ予想する難しさ） 13

マルコフ情報源とブロック化

0/0 9 1/0 1 80%の確率で状態 “0” 20%の確率で状態 “1” 0 1 0/0.9 1/0.1 0%の確率で状態 0/0.4 1/0.6 00 が発生する確率 0 8 0 9 0 9 0 2 0 4 0 9 0 72 00 が発生する確率... 0.8  0.9  0.9 + 0.2  0.4  0.9 = 0.72 01 が発生する確率... 0.8  0.9  0.1 + 0.2  0.4  0.1 = 0.08 10 が発生する確率 0 8 0 1  0 4 + 0 2  0 6  0 4 = 0 08 10 が発生する確率... 0.8  0.1  0.4 + 0.2  0.6  0.4 = 0.08 11 が発生する確率... 0.8  0.1  0.6 + 0.2  0.6  0.6 = 0.12 ⇒ エントロピーは1.2914bit...一文字あたりでは0.6457bit ブロック化しないときは0.722bit だった ⇒ブロク化によりエントロピが小さくなた 14 ⇒ブロック化により，エントロピーが小さくなった http://narayama.naist.jp/~kaji/lecture/

記憶のある情報源のエントロピ

一般に記憶のある情報源では

記憶のある情報源のエントロピー

般に，記憶のある情報源では... H₁(Sn) / n（通報一個あたりのエントロピー）は，単調減少する H (Sn) / n はある一定の値 H(S) に収束していく H₁(Sn) / n は，ある定の値 H(S) に収束していく H₁(Sn) / n _H 1(Sn) / n < H1(S) 1( ) H(S) 1( ) 1( ) n 個まとめて予想する難しさ < n ×（1 個だけ予想する難しさ） n H(S) （個だけ予想する難しさ）ある程度，通報の出現パターンが「読める」自然語だと，“qu” は高頻出，“qz” は，まず出現しない無記憶の場合より，振舞いが予想しやすい ⇒ エントロピー小 http://narayama.naist.jp/~kaji/lecture/

第

部折り返し地点

第一部：折り返し地点

ここまでは，「情報源の予測の難しさ」の定量化ここからは「情報量」の定義ここからは「情報量」の定義

(5)

通報の持つ情報量

阪神タイガースの試合があったが結果をまだ知らない阪神タイガスの試合があったが，結果をまだ知らない阪神が勝つ確率，負ける確率，引き分ける確率は，全部1/3 巨人ファンの友人Ａからメイル：「阪神は負けなかった」巨人ファンの友人Ａからメイル：「阪神は負けなかった」友人Ａのメイルに含まれる情報の「量」は？メイルを受け取る前：結果に関する不確かさが大きい P(勝) 1/3 P(引) 1/3 P(負) 1/3 P(勝) = 1/3. P(引) = 1/3, P(負) = 1/3 メイルを受け取った後：結果に関する不確かさが小さくなった P(勝) 1/2 P(引) 1/2 P(負) 0 P(勝) = 1/2. P(引) = 1/2, P(負) = 0 「不確かさの減少量情報量」と定義したい 17 「不確かさの減少量＝情報量」と定義したい

野球の試合の例では

メイルを受け取る前：P(勝) = 1/3 P(引) = 1/3 P(負) = 1/3 メイルを受け取る前：P(勝) = 1/3. P(引) = 1/3, P(負) = 1/3 エントロピーは 585 1 3 l 1 l 1 1 l 1 1 l 1 _log₃ ₁_.₅₈₅ 3 log 3 3 log 3 3 log 3      メイルを受け取った後：P(勝) = 1/2. P(引) = 1/2, P(負) = 0イを受け取後 (勝) (引) , (負) 条件付きエントロピーは 1 2 log 0 1 log 1 1 log 1 _ _ _ _  0 log2 1 2 log 2 2 log 2   「阪神は負けなかった」というメイルに含まれる情報量： 1.585 – 1 = 0.585 ビット 18 http://narayama.naist.jp/~kaji/lecture/

情報量とエントロピ

情報量とエントロピー

離れたところにある情報源 S の出力（通報）を知りたい 離れたところにある情報源 S の出力（通報）を知りたい 通報の確率分布はわかるが，何が実際出力されたか知りたい S の出力に関しなんらかの「ヒント」を入手したとする S の出力に関し，なんらかの「ヒント」を入手したとする ヒントにより，通報の確率分布が，別の情報源 S’ の確率分布 と一致することがわかったとすると致することがわかったとするこのときヒント（通報）がもたらした情報量（information) は このとき，ヒント（通報）がもたらした情報量（information) は H(S) – H(S’) ビット http://narayama.naist.jp/~kaji/lecture/

気まぐれな友人の場合（

1）

気まぐれな友人の場合（

case 1）

右図の行動を取る友人Ｂが _勝ち 0.5 _{「勝たよ」} 右図の行動を取る友人Ｂが「言いたくない」と言った時の情報量は？勝ち引分「勝ったよ」「言いたくない」 0.5 0.5 0 5 1.0 情報量は？負け 0.5_0.5 「負けたよ」 P(言いたくない) = 2/3 P(勝ち，言いたくない) = 1/6 P(勝ち | 言いたくない) = 1/4 P(引分，言いたくない) = 1/3 P(引分 | 言いたくない) = 1/2 P(負け，言いたくない) = 1/6 P(負け | 言いたくない) = 1/4 「言いたくない」と言っているときのエントロピは「言いたくない」と言っているときのエントロピーは 5 . 1 4 1 log 4 1 2 1 log 2 1 4 1 log 4 1 _ _ _  情報量は1.585 – 1.5 = 0.085ビット（友人Ａのメイル：0.585ビット）

(6)

気まぐれな友人の場合（

2）

気まぐれな友人の場合（

case 2）

友人Ｂが「勝ったよ」と言った _勝ち 0.5 _{「勝たよ」} 友人Ｂが「勝ったよ」と言ったときの情報量は？勝ち引分「勝ったよ」「言いたくない」 0.5 0.5 0 5 1.0 P(勝ったよ) = 1/6 負け 0.5_0.5 「負けたよ」 P(勝ち | 勝たよ) 1 P(勝ったよ) = 1/6 P(勝ち，勝ったよ) = 1/6 P(勝ち | 勝ったよ) = 1 P(引分 | 勝ったよ) = 0 P(負け | 勝たよ) 0 エントロピーは０になる（結果を正確に知ることができる） P(負け | 勝ったよ) = 0 （結果を正確に知ることができる）情報量は1.585 – 0 = 1.585ビット（友人Ａのメイル：0.585ビット）友人Ａと友人Ｂ，どちらが「頼りになる」友人か？個々の通報の情報量だけを見ていたのではわからない 21 ... 個々の通報の情報量だけを見ていたのではわからない

情報量の「平均」

友人Ｂの行動：友人Ｂの行動： 1/6 の確率で「勝ったよ」...情報量 1.585ビット 2/3 の確率で「言いたくない」情報量 0 085ビット 2/3 の確率で「言いたくない」...情報量 0.085ビット 1/6 の確率で「負けたよ」...情報量 1.585ビット平均すると1 585 1/6 + 0 085  2/3 +1 585  1/6 =0 585ビット平均すると1.585  1/6 + 0.085  2/3 +1.585  1/6 = 0.585ビット友人Ａの行動： 2/3の確率で「負けなかった」情報量 0 585ビット友人Ａの行動：勝ち 2/3の確率で「負けなかった」...情報量 0.585ビット 1/3の確率で「負けたよ」...情報量 1.585ビット平均すると0 585 2/3 + 1 585  1/3 =0 918ビット勝ち引分「負けなかった」平均すると0.585  2/3 + 1.585  1/3 = 0.918ビット平均すると友人Ａのほうが 22 負け「負けたよ」平均すると，友人Ａのほうが_{0.333ビット多くの情報をくれる} http://narayama.naist.jp/~kaji/lecture/

相互情報量

友人Ａ友人Ｂは異なる特性を持った通信路と考えられる友人Ａ，友人Ｂは，異なる特性を持った通信路と考えられる「負けなかった」「言いたくない」 通信路の入力確率変数を X，出力確率変数を Y とする X と Y の相互情報量 I(X; Y)：各値が持（関する）情報量加重均 X Y Yの各値が持つ（X に関する）情報量の加重平均前ページでは「試合結果と友人の振舞いの相互情報量」を計算 http://narayama.naist.jp/~kaji/lecture/

相互情報量の意味

相互情報量：相互情報量：その通信路が，どれだけの情報を伝達しているかの指標システムとして通信路を実現することを考えると個々のシステムとして通信路を実現することを考えると，個々の通報の情報量より，相互情報量にこそ着目すべき同じ通信路でも，入力分布が変わると，相互情報量も変わる同じ友人Ａでも同じ友人Ａでも... 勝ち，引分，負けが1/3のチーム...相互情報量は0.918ビット勝ち負けが1/2のチム相互情報量は1 ビット勝ち，負けが1/2のチーム...相互情報量は1 ビット相互情報量の取り得る最大値 ⇒通信路容量という相互情報量の取り得る最大値 ⇒通信路容量という

(7)

相互情報量の計算例（１）

天気予報：天気についての情報を与えるやや不正確な通信路天気予報：天気についての情報を与える，やや不正確な通信路例：100日間の実際の天気 (X) と天気予報 (Y) の統計： 晴雨 Y P(X) ×100 予報 X 45₁₅ 60 12 28 40 晴雨 P(Y)×100 57 43 X Y 現実予報 60 40 P(Y)×100 実際の天気が晴だったのは57日，P_X(晴)=0.57 現実予報が晴といったのは60日，P_Y（雨）=0.60 天気 X, 予報 Y とも晴だったのは45日，P_X,Y(晴，晴）=0.45 25

相互情報量の計算例（２）

晴雨 Y P(X) ×100 X 45₁₅ 60 12 28 40 晴雨 P(Y)×100 57 43 天気予報が当たる確率＝P （晴晴）＋ P （雨雨）=0 73 60 40 P(Y)×100 天気予報が当たる確率 P_X,Y（晴，晴）＋P_X,Y（雨，雨） 0.73 この予報と友人Ａのメイルどちらが「高性能」？この予報と友人Ａのメイル，どちらが「高性能」？天気のエントロピー： 986 0 43 0 l 43 0 57 0 l 57 0 ) (X H ビット 26 986 . 0 43 . 0 log 43 . 0 57 . 0 log 57 . 0 ) (X    H ビット http://narayama.naist.jp/~kaji/lecture/

相互情報量の計算例（３）

天気予報Yが晴のとき： 天気予報Yが晴のとき： 本当に晴れる確率は0.45/0.60 = 0.75，雨の確率は0.25 「晴」という予報を聞いた後の条件付エントロピーは「晴」という予報を聞いた後の条件付エントロピは H(X | 晴) = – 0.75log0.75 – 0.25log0.25 = 0.811 ビット 「晴」という天気予報の持つ情報量は0 986 0 811 = 0 175 「晴」という天気予報の持つ情報量は0.986 – 0.811 = 0.175 天気予報Yが雨のとき： 本当に雨の確率は0 28/0 40 0 70 晴の確率は0 30 本当に雨の確率は0.28/0.40 = 0.70，晴の確率は0.30 「雨」という予報を聞いた後の条件付エントロピーは H(X | 雨) 0 30l 0 30 0 70l 0 70 0 881 ビット H(X | 雨) = – 0.30log0.30 – 0.70log0.70 = 0.881 ビット 「雨」という天気予報の持つ情報量は0.986 – 0.881 = 0.105 加重平均をとると0 60 0 175 + 0 40 0 105 0 147 ビト加重平均をとると0.60·0.175 + 0.40·0.105 = 0.147 ビット http://narayama.naist.jp/~kaji/lecture/

相互情報量と当たる確率

Y A社晴 45 雨 12 晴 Y P(X) ×100 57 A社：まぁまぁ当たる予報 X 45₁₅ 60 12 28 40 晴雨 P(Y)×100 57 43 73% 0 147ビット 60 0 P(Y) 100 晴雨 Y P(X) ×100 B社：絶対はずれる予報 0.147ビット X 晴 0 43 雨 57 0 晴雨 P(X) ×100 57 43 絶対はずれる予報 0% 情報「量は社予報ほうが大き 43 43 0 57 雨 P(Y)×100 43 0.986ビット情報の「量」は，Ｂ社予報のほうが大きい

(8)

第

部のまとめ

第一部のまとめ

エントロピーの概念を導入エントロピの概念を導入予測の難しさを定量化したもの情報量，相互情報量を定義エントロピーの減少量として定式化エントロピーの減少量として定式化システムの評価には，相互情報量の概念が有用 29

休憩

30 http://narayama.naist.jp/~kaji/lecture/

第二部情報の表現方法を考える

第二部：情報の表現方法を考える

情報は実体を持たない抽象的なもの情報は，実体を持たない抽象的なもの情報の容器である「通報」に，具体的表現を与える必要がある通報の表現方法かなり大きな自由度がある通報の表現方法...かなり大きな自由度がある ⇒ 「良い」表現方法と「良くない」表現方法がある「良い」表現方法とは？情報の蓄積を考えるとできるだけコンパクトであること情報の蓄積を考えると...できるだけコンパクトであること情報の伝達を考えると...できるだけ誤りに強いこと相反する二つの方向性の間で，バランスを取ることが大切技術としてはそれぞれ独立したものとして扱うことが得策技術としては，それぞれ独立したものとして扱うことが得策 http://narayama.naist.jp/~kaji/lecture/

第二部前半情報のコンパクトな表現について

第二部前半：情報のコンパクトな表現について

３種類の通報 A B C を 0 と 1 だけを用いて符号化する ３種類の通報 A, B, C を，0 と 1 だけを用いて符号化する A 0 符号化すると B と C が区別できなくなる 符号語通報（ただし，区切り記号は使わない） A B C 0 1 1 符号化すると，B と C が区別できなくなる （一意に復号できない） ⇒ すべてを1 ビットで表現することは不可能 C 1 ⇒ すべてを1 ビットで表現することは不可能 A 00 10 一意性は保証されるが，一工夫足りない... B C 10 11 A B 0 10 符号語の長さが揃っていないが... 情報をコンパクトには表現できる C 11

(9)

様々な符号化法

A 0 いまのところベストの符号化法 A B C 0 10 11 いまのところベストの符号化法 C 11 A 00 11 上の例と似ているが，一意性が保証されない B → 11 B C 11 1 B → 11 CC → 11 意性は保証されるが取り扱いが面倒 A B 00 10 一意性は保証されるが，取り扱いが面倒 10000000 → BAAA 1000000 → CAAA C 1 1000000 → CAAA 最後の一文字を見るまで，復号を行えない 33 最初の方式は，一意的で，即時に復号処理ができる

様々な符号化法（続）

A 0 いまのところベストの符号化法 C₁ _A B C 0 10 11 いまのところベストの符号化法 C₁ C 11 A B 11 10 本質的に，上と同じ？ C₂ B C 10 0 通報の出現確率に偏りがある場合を考える通報の出現確率に偏りがある場合を考える P(A) = 0 5 C1 ：一通報を表現する符号長の平均はビト P(A) = 0.5 P(B) = 0.4 P(C) = 0.1 0.5 ×1 + 0.4×2 + 0.1×2 = 1.5ビット C₂：一通報を表現する符号長の平均は 0 5 ×2 + 0 4×2 + 0 1×1 = 1 9ビット 34 P(C) 0.1 _{0.5 ×2 + 0.4×2 + 0.1×1 = 1.9ビット} C₁のほうが C₂よりもコンパクトな表現 http://narayama.naist.jp/~kaji/lecture/

符号に求められる性質

良い符号の三条件：良い符号の三条件：一意に復号可能であること瞬時に復号可能であること瞬時に復号可能であること平均符号長ができるだけ短いこと理論的に最適な解法が知られている ⇒ハフマン符号化 http://narayama.naist.jp/~kaji/lecture/

ハフマン符号

1 各通報に対して節点を準備しその発生確率を付与する 1.各通報に対して節点を準備し，その発生確率を付与する節点はそれぞれ，大きさ１の木であると考える 2.木の中で発生確率最小のものを２つ選出し，以下を行う 1 ２つの木の根節点を子とするような新しい根節点を作る 1.２つの木の根節点を子とするような，新しい根節点を作る 2.新しい根節点と古い根節点を結ぶ枝に，0, 1 をラベル付け 3 新しい根節点に２つの木の発生確率の和を与える 3.新しい根節点に，２つの木の発生確率の和を与えるすべての節点がつながるまで 2 の操作を繰り返す 3.すべての節点がつながるまで，2 の操作を繰り返す

(10)

ハフマン符号化法

A B C D 記号 A 0.60 B 0.25 C 0.10 D 0.05 記号確率 0 15 0.60 0.25 0.10 0.05 0.15 0.60 0.25 0.10 0.05 A B C D A B C D 0.40 1.00 0.60 0.25 0.10 0.05 0.60 0.25 0.10 0.05 37 0.60 A 0.10 C 0.05 D 0.25 B 0.60 A 0.10 C 0.05 D 0.25 B

練習問題

確率符号語確率符号語 A B 確率 0.2 0.1 符号語 A B 確率 0.3 0.2 符号語 C D 0.3 0.3 C D 0.2 0.1 E 0.1 E F 0.1 0.1 38 等長符号の場合と比べ，平均符号長が小さくなっている http://narayama.naist.jp/~kaji/lecture/

ハフマン符号とブロック化

ハフマン符号：ハフマン符号：得られる符号は，一意かつ瞬時に復号可能通報一個を符号語一個に符号化する方式としては通報個を符号語個に符号化する方式としては，最も効率が良い（最もコンパクト，平均符号長が小さい）複数の通報を一まとめにして（ブロック化して）符号化すれば，さらに効率が良くなることが知られているさらに効率が良くなることが知られている http://narayama.naist.jp/~kaji/lecture/

ブロックハフマン符号

２つの通報をまとめて（ブロック化して）符号化する２つの通報をまとめて（ブロック化して）符号化する A 0 6 0 記号確率符号語 AA 0 36 0 記号確率符号語 A B C 0.6 0.3 0.1 0 10 11 AA AB AC 0.36 0.18 0.06 0 100 1100 BA BB BC 0.18 0.09 0 03 101 1110 11110 平均符号長1.4 ビット BC CA CB 0.03 0.06 0 03 11110 1101 111110 CB CC 0.03 0.01 111110 111111 平均符号長2.67 ビット平均符号長 .67 ビット ⇒一記号あたり1.335 ビット

(11)

ブロック化と性能の限界

一般にブロック長を大きくすると通報一記号あたりの般に，ブロック長を大きくすると，通報記号あたりの平均符号長は減少するどこまで減少するか？対象となっている情報源のエントロピーに漸近する対象となっている情報源のエントロピーに漸近する平均符号長平均符号長（一記号あたり）ブエントロピー 41 ブロック長

情報源符号化定理

平均符号長（一記号あたり）ハフマン符号よりも良い方法を工夫すれば，エントロピーの壁を乗り越えられる？エントロピー乗り越えられる？ブロック長エントロピー任意の符号について，平均符号長は必ず L H₁(S) となる データ圧縮における「越えられない壁」デタ圧縮における「越えられない壁」平均符号長がL < H₁(S) + 1となる符号を構成できる ハフマン符号は理論限界を達成する符号化方式 42 ハフマン符号は，理論限界を達成する符号化方式 http://narayama.naist.jp/~kaji/lecture/

ユニバサル符号化非可逆符号化

ユニバーサル符号化，非可逆符号化

ハフマン符号化情報源記号の確率分布が事前に必要ハフマン符号化...情報源記号の確率分布が，事前に必要確率分布が（正確には）わからないケースも多い ⇒ユニバーサル符号化法 ⇒ユニバサル符号化法どのような情報源に対しても，そこそこ良い性能を発揮 LZ77法 (lha gzip zoo zip etc )

LZ77法 (lha, gzip, zoo, zip etc.) LZ78法 (compress, stuffit etc.)

LZW法 (GIF TIFF 等の画像フォマット) LZW法 (GIF, TIFF 等の画像フォーマット) 音声や画像等の情報音声や画像等の情報... 細部まで正確に再現できなくても，実害なし再現性を部犠牲にして高い圧縮率を⇒非可逆符号化再現性を一部犠牲にして，高い圧縮率を⇒非可逆符号化 http://narayama.naist.jp/~kaji/lecture/

第二部折り返し地点

第二部：折り返し地点

ここまでは，「情報をコンパクトに表現する」おはなしここからは「誤た情報を訂正する」おはなしここからは「誤った情報を訂正する」おはなし

(12)

通信路符号化

偶発的に発生する誤りから情報を保護したい偶発的に発生する誤りから，情報を保護したい通信路において発生するノイズから情報を守る CD ROM が傷ついても中のデータは読めるようにする CD-ROM が傷ついても，中のデタは読めるようにする基本的な考え方：基本的な考え方：誤りを検出し，訂正するための「余分な情報」を追加する 45

パリティ検査符号

パリティ記号の付加：パリティ記号の付加：０と１で表現されたひとまとまりのデータの中に，１が偶数個あれば０を１が偶数個あれば０を１が奇数個あれば１をデータの最後にくっつける操作データの最後にくっつける操作パリティ記号の付加されたデータは，偶数個の１を含む（偶パリティ符号） 01001 010010 偶数個の１を含む（偶パリティ符号）１の個数が奇数個 ⇒ 誤りの影響を受けている 01001 01011 010010 010111 ⇒ 誤りの影響を受けているサバ用メリ等利用される 101001 誤りを含む 46 サーバ用メモリ等で利用されている http://narayama.naist.jp/~kaji/lecture/

誤りの検出から訂正へ

偶パリティ符号そのものには誤り訂正能力がない偶パリティ符号そのものには，誤り訂正能力がない偶パリティ符号を組み合わせれば，誤り訂正可能に例：４ビットの情報を保護したい４ビットを長方形状に並べる４ビットを長方形状に並べる水平方向，垂直方向にパリティ記号（５ビット）を付加 0 1 1 保護したい４ビトパリティ記号５ビト (9 4) 符号 0111 011110101 1 1 0 1 0 1 ４ビット５ビット (9, 4) 符号長さ９ビット内４ビットが本来の情報 1 0 1 符号化率4/9 http://narayama.naist.jp/~kaji/lecture/

誤り訂正の原理

前出の(9 4) 符号 ⇒ どの行・列とも１は偶数個のはず前出の(9,4) 符号 ⇒ どの行列とも，１は偶数個のはず１ビットの誤りが発生すると… 誤りを含む行列だけ１が奇数個になる誤りを含む行，列だけ，１が奇数個になる受信者は，誤りの発生位置を特定することが可能誤りは異常のある行・列の交点に存在するはず誤りは，異常のある行・列の交点に存在するはず 0 1 1 0 1 1 0 1 1 1 1 0 0 1 0 1 1 0 1 0 1 正常（誤り無し） 1 0 1 異常（誤りあり）正常（誤り無し）異常（誤りあり）

(13)

般的な線形符号へ

一般的な線形符号へ

前出の(9 4) 符号 ⇒ 行単位列単位でパリティ記号を計算前出の(9,4) 符号 ⇒ 行単位，列単位でパリティ記号を計算二次元的な行，列にこだわる必要はない斜めにたどる途中で曲げるスポット的に拾うetc 斜めにたどる，途中で曲げる，スポット的に拾うetc… データビットの任意の組合せからパリティ記号を計算可能組み合わせ方により符号の性能が変化する組み合わせ方により，符号の性能が変化する線形符号：データビットの部分集合からパリティ記号を定義する符号いかにして良い組み合わせ方を探すか 49 ⇒ 符号設計者の腕の見せ所

ハミング符号

代表的な線形符号代表的な線形符号符号語中に発生する１ビットの誤りを訂正可能非常に効率が良い（完全符号）非常に効率が良い（完全符号） 0 1 0111 0111100 0 1 1 1 1 ₀0 0111 0111100 (7,4)符号効率4/7 0 1 1 ₀₁₁₁ ₀₁₁₁₁₀₁₀₁ 効率 /7 1 1 0 0111 011110101 (9,4)符号効率4/9 50 1 0 1 効率4/9 （どちらも，より大規模の符号も構成可能） http://narayama.naist.jp/~kaji/lecture/

生成行列

線形符号線形符号データビットの部分集合から，パリティ記号を定義パリティ記号はいくつかのデータビットの和となるパリティ記号は，いくつかのデタビットの和となる p₃ x₁ x₂ p1 = x2 +x3+ x4 p₁ p3 p₂ x3 x4 _p 3 = x1+ x2 +x3 p2 = x1 +x3+ x4 （+は排他的論理和） ( ) ( ) 1000011 0100101 p₃ x₁x₂x₃x₄p₁p₂ ( )=(x₁x₂x₃x₄) 0100101 0010111 0001110 生成行列符号化操作＝データビットと生成行列の掛け算 http://narayama.naist.jp/~kaji/lecture/

検査行列

p = x + x +x x + x +x +p = 0 p = x +x + x p₁= x₂+ x₃ +x₄ p2= x1 + x3 +x4 p = 0 x +x + x p₁ = 0 x₂+ x₃ +x₄ p2 = 0 x1 + x3 +x4 + + + p₃= x₁ +x₂+ x₃ x₁ +x₂+ x₃ +p₃= 0 検査行列 0111100 x₁ x₂ ₀ 符号語を検査行列にかけると 0111100 1011010 1110001 2 x₃ p₁ x₄ 0 0 0 = 符号語を検査行列にかけるとゼロベクトルになるゼロベクトルにならなければ 1110001 p₃ p₂ 0 ゼロベクトルにならなければ，誤りが含まれる誤り検出＝受信語と検査行列の掛け算およびゼロテスト

(14)

線形符号の特徴

符号化誤りの検出訂正とも行列演算により実行可能符号化，誤りの検出，訂正とも，行列演算により実行可能行列演算 ⇒ 単純な組合せ回路だけで実現可能 ⇒ 高速に動作させるのに有利 ⇒ 高速に動作させるのに有利規模の大きな線形符号規模の大きな線形符号巨大な行列に対する演算が必要となる組合せ回路の面積増大 ⇒ 遅延消費電力設計困難組合せ回路の面積増大 ⇒ 遅延，消費電力，設計困難スケーラビリティが悪いもっと扱いやすい線形符号は？ 53

巡回符号

符号化復号をシフトレジスタで実現できる線形符号符号化，復号を，シフトレジスタで実現できる線形符号一般の線形符号に比べ般の線形符号に比べ，実装面で有利実装面で有利シフトレジスタ利用による配線の簡単化符号化処理と復号処理で回路の一部共有化が可能符号化処理と復号処理で，回路の一部共有化が可能代表的な巡回符号：代表的な巡回符号： BCH符号 R d S l 符号 Reed-Solomon符号：多元符号（バイト単位での取り扱い等も容易） CD DVD等でも採用 54 CD, DVD等でも採用 http://narayama.naist.jp/~kaji/lecture/

畳込み符号

符号化装置を有限状態機械として実現する方式

畳込み符号

符号化装置を，有限状態機械として実現する方式最尤復号が比較的効率よく行える（ビタビアルゴリズム）最尤復号が，比較的効率よく行える（ビタビアルゴリズム）統計的に，最も信頼度の高い復号法軟判定復号の実現も容易復号精度を上げる技術復号精度を上げる技術受信値の信頼度を，０と１の二値でなく，より多段階で表現多くの通信方式にて，畳込み符号が実際に用いられている http://narayama.naist.jp/~kaji/lecture/

誤り訂正符号の応用

二次元バーコード二次元バコドコード面の汚損による誤りが起こりうる Reed Solomon 符号の利用により耐性向上 Reed-Solomon 符号の利用により，耐性向上地上波デジタル放送地上波デジタル放送畳込み符号とReed-Solomon 符号の二重符号化を利用数独パズル周辺の制約条件から欠落情報を復元周辺の制約条件から，欠落情報を復元情報理論応用ではないが，共通点が多い

(15)

本日のまとめ

第一部：情報を測る第部：情報を測る情報の量，情報伝達系の性能を数値として測る確率論をベースに人間の直観にあった定式化を行う確率論をベスに，人間の直観にあった定式化を行う第二部：情報を伝える情報をできるだけコンパクトに表現する情報をできるだけコンパクトに表現する情報をできるだけ確実に伝える「情報理論」の簡単な概論デジタル情報システムの重要な基盤デジタル情報システムの重要な基盤コンピュータ関係以外への貢献も Cl d E Sh 57 Claude E. Shannon 1916-2001

出欠確認課題

出欠確認・課題

情報・通信以外の分野で情報理論の技術や考え方が情報通信以外の分野で，情報理論の技術や考え方が利用できる分野，技術を考えよ 58

Microsoft PowerPoint - 情報科学概論-10.ppt [互換モード]

情報科学概論 ２回目

情報科学概論 ２回目

出欠確認 課題

出欠確認・課題

第

部 「情報量」をどうとらえるか

第一部：「情報量」をどうとらえるか

情報の獲得

情報の獲得

情報源と通報

情報源と通報

情報伝達の例

情報伝達の例

情報源の分類

情報源の分類

典型的な情報源

典型的な情報源

情報源のエントロピ

情報源のエントロピー



エントロピ の計算例

エントロピーの計算例

記憶のある情報源

記憶のある情報源

マルコフ情報源のエントロピ

マルコフ情報源のエントロピー

ブロック化の例 記憶のない場合

ブロック化の例：記憶のない場合

マルコフ情報源とブロック化

マルコフ情報源とブロック化

記憶のある情報源のエントロピ

記憶のある情報源のエントロピー

第

部 折り返し地点

第一部：折り返し地点

通報の持つ情報量

通報の持つ情報量

野球の試合の例では

野球の試合の例では

情報量とエントロピ

情報量とエントロピー

気まぐれな友人の場合（

1）

気まぐれな友人の場合（

case 1）

気まぐれな友人の場合（

2）

気まぐれな友人の場合（

case 2）

情報量の「平均」

情報量の「平均」

相互情報量

相互情報量

相互情報量の意味

相互情報量の意味

相互情報量の計算例（１）

相互情報量の計算例（１）

相互情報量の計算例（２）

相互情報量の計算例（２）

相互情報量の計算例（３）

相互情報量の計算例（３）

相互情報量と当たる確率

相互情報量と当たる確率

第

部のまとめ

第一部のまとめ

休憩

休憩

第二部 情報の表現方法を考える

第二部：情報の表現方法を考える

第二部前半 情報のコンパクトな表現について

第二部前半：情報のコンパクトな表現について

様々な符号化法

様々な符号化法

様々な符号化法（続）

様々な符号化法（続）

符号に求められる性質

符号に求められる性質

ハフマン符号

情報科学概論２回目

情報科学概論２回目

出欠確認課題

部「情報量」をどうとらえるか

エントロピの計算例

ブロック化の例記憶のない場合

部折り返し地点

第二部情報の表現方法を考える

第二部前半情報のコンパクトな表現について

ユニバサル符号化非可逆符号化

第二部折り返し地点

出欠確認課題