Microsoft PowerPoint - 2.ppt [互換モード]

(1)

前回の練習問題

無記憶・非定常な情報源を一つ例示せよ無記憶非定常な情報源をつ例示せよ 時刻 t に t 枚のコインを投げるとき，表が出る枚数 以下のマルコフ情報源について以下のマルコフ情報源について，状態の定常確率分布を求めよ通報 _{A B の定常確率を求めよ} 通報 _{A, B の定常確率を求めよ} 0 B/0 6 (w0, w1, w2) = (0.1, 0.7, 0.2) 1 2 A/0.4 A/0.5 B/0.6 B/0.2 P(A) = 0.7 P(B) = 0.3 A/0.8 B/0.5 ( ) 1

(2)

前回の補足マルコフ情報源が既約であること

前回の補足：マルコフ情報源が既約であること

既約（irreducible）マルコフ情報源既約（irreducible）マルコフ情報源任意の状態から任意の状態に遷移可能なマルコフ情報源厳密には_... 時刻 t の状態を変数 X で表現するとき任意の時刻 i j (i < j) 時刻 t の状態を変数 X_t で表現するとき，任意の時刻 i, j (i < j) および任意の状態 s_i, s_j に対し，_P(X_j _{= s}_j _{| X}_i _{= s}_i_{) > 0}であること無限個の状態を持つマルコフ連鎖では，既約であっても， P(X | X ) 0 となるケスもある（収束 ≠ 致） P(X_j = s_j | X_i = s_i) → 0 となるケースもある（収束 ≠ 一致） 1.0 0.9 0.9 0.9 0.9 2 0.1 0.1 0.1 0.1 0.1

(3)

本日の講義について

「情報量」を定義する「情報量」を定義する 1. 情報源に対し，エントロピーの概念を導入エントロピー＝通報を予想する難しさの定量的指標エントロピ＝通報を予想する難しさの定量的指標エントロピーが大きい ⇔ 予測することが難しい 2. 一個の通報の持つ情報量を定義情報量＝その通報がもたらすエントロピの減少量情報量＝その通報がもたらすエントロピーの減少量通信路の性能指標となる相互情報量を定義 3. 通信路の性能指標となる相互情報量を定義その通信路を通過する通報の情報量の加重平均 3

(4)

記憶のない情報源のエントロピ

記憶のない情報源のエントロピー

以下の通報発生確率を持つ記憶のない定常情報源S を考える 以下の通報発生確率を持つ，記憶のない定常情報源S を考える a₁ p a₂ p a_M p ... ... 通報 確率 p₁ p₂ p_M 確率 情報源 S の一次エントロピー ₍_{first-order entropy}_): M



   M i i i p p S H 1 2 1( ) log (ビット, bit）の項は非負例１：この項は非負 ⇒エントロピーは常に０以上コイン投げのエントロピー：表，裏とも確率 _{1/2...M = 2, p}₁_=p₂_=0.5 1 ) 2 / 1 log( 5 . 0 log 5 . 0 5 . 0 log 5 . 0 ) ( 1 S       H ビット 4 ) g( g g ) ( 1

(5)

エントロピの計算例

エントロピーの計算例

例２：サイコロの目コイン投げより結果予想は難しいはず例２：サイコロの目_{...コイン投げより，結果予想は難しいはず} 1 1/6 通報確率 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 1/6 確率 _{1/6 1/6 1/6 1/6 1/6} 585 . 2 6 1 log 6 1 ... 6 1 log 6 1 6 1 log 6 1 ) ( 1 S      H ビット 6 6 6 6 6 6 例３：イカサマ賭博のサイコロ 1 0.9 通報確率 2 0.02 3 0.02 4 0.02 5 0.02 6 0.02 701 . 0 02 . 0 log 02 . 0 ... 02 . 0 log 02 . 0 9 . 0 log 9 . 0 ) ( 1 S      H ビット 5 一個の指標で，予測の難しさの大小関係を定義可能

(6)

予想の難しさとエントロピ

二元情報源の場合

予想の難しさとエントロピー：二元情報源の場合

通報が_{0 または1の記憶のない二元情報源 S を考える} 通報が_{0 または1の，記憶のない二元情報源 S を考える} 0, 1 の発生確率が p, 1 – p のとき， ) 1 log( ) 1 ( log ) ( 1 S p p p p H      ビットこの値をH(p) と表記する（二元エントロピー関数）_{(p) 表} 1.0 p=0.5のとき， H(p) は最大値 1 を取る H(p) p が 0, 1 に近づくとき， H(p) は 0 に近づく 予想のしやすさとエントロピーの 6 p 1.0 0.5 間には，相関関係がある

(7)

M元情報源の場合

天気三元情報源天気_{...三元情報源} 奈良の天気_{...晴40%, 曇50%, 雨10%とすると，H}₁_(S)=1.361 砂漠の天気晴90% 曇9% 雨1%とすると H (S)=0 516 砂漠の天気...晴90%, 曇9%, 雨1%とすると，H₁(S)=0.516 もし，晴，曇，雨の確率が全部 _{1/3 の場合，} 1 1 1 1 1 1 58 . 1 3 log 3 1 log 3 1 3 1 log 3 1 3 1 log 3 1 ) ( 1 S       H 元情報源では個の通報が等確率で発生するとき M元情報源では，M個の通報が等確率で発生するとき，エントロピーは最大値 _{log M ビットとなる} ピが最小値を取るはある通報エントロピーが最小値を取るのは，ある一つの通報について，その発生確率が1となる場合 7 ...この場合，通報は，あいまいさなく予測可能

(8)

拡大情報源について

ブロック化（block）： ブロック化（block）：情報源からの通報を複数個まとめて，一個の通報とみなすこと M元情報源Sの出力をn個まとめて一つのブロックを構成 ⇒ _{S の n次拡大}（_{n th order extended}）情報源 ⇒ _{S の n次拡大}（_{n-th order extended}）情報源 ...通報は Mn 種類： _Mn元情報源になる拡大情報源のエントロピーは？記憶のない情報源だとブロック化しても面白くない記憶のない情報源だと，ブロック化しても面白くない記憶のある情報源のブロック化，が興味深い結果を示す話の順番としてまずは記憶のないケスを議論 8 ... 話の順番として，まずは記憶のないケースを議論

(9)

拡大情報源のエントロピ計算

拡大情報源のエントロピー計算

コイン投げ２回分の通報を１ブロックにまとめる場合コイン投げ２回分の通報を，１ブロックにまとめる場合_... 通報は _{{表表, 表裏，裏表，裏裏} の４通り...2}2_元情報源表表通報表表表裏裏表裏裏 1/4 通報確率表裏 1/4 裏表 1/4 裏裏 1/4 H (S2) l 4 2 ビト結果予想は個の場合の２倍難しい H₁(S2)=log 4 = 2 ビット...結果予想は一個の場合の２倍難しい H₁(S2)は，S の通報２個分のエントロピー通報個分に換算すると 2 _{ビト} ⇒ S の通報１個分に換算すると，H₁(S2_{)/2 = 1ビット} S H ( n)/ の次（）トピと表記 n S H n nlim 1( )/ n S H₁( n)/ Sの n次（n-th order）エントロピー．H_n(S)と表記 Sの極限エントロピー．H(S)と表記 9 n ( )

(10)

記憶のない情報源の拡大とエントロピ

記憶のない情報源の拡大とエントロピー

S: 0 1 をそれぞれ確率 0 8 0 2 で発生する記憶のない情報源 S: 0, 1 をそれぞれ確率 0.8, 0.2 で発生する記憶のない情報源 0 0 8 S H (S) 0 8l 0 8 0 2l 0 2 0 72 0 1 0.8 0.2 H1(S)= –0.8log0.8 – 0.2log0.2 = 0.72 00 01 0.64 0.16 S2 H₁(S2)= –0.64log0.64 – 0.16log0.16 –0 16log0 16 – 0 04log0 04 = 1 44 10 11 0.16 0.04 0.16log0.16 0.04log0.04 1.44 H₂(S) = H₁(S2)/2 = 1.44/2 = 0.72 この情報源では，_{任意の n に対して H}₁_(Sn) = 0.72n となる ⇒ H (S) H(S) 0 72 極限エントロピ 次エントロピ 10 ⇒ H_n(S) = H(S) = 0.72...極限エントロピー＝一次エントロピー

(11)

記憶のない情報源の拡大とエントロピ

記憶のない情報源の拡大とエントロピー

定理：任意の無記憶な定常情報源 S に対し H (Sn) = nH (S) 定理：任意の無記憶な定常情報源 S に対し，H₁(S ) = nH₁(S)． 証明：（n = 2の場合を考える） ) ( log ) ( ) (S2 P x x P x x H     _{無記憶だから} ) ( ) ( log ) ( ) ( ) , ( log ) , ( ) ( 0 1 1 0 1 0 0 1 1 0 1 0 1 x P x P x P x P x x P x x P S H x x M x x M          無記憶だから P(x₀, x₁) = P(x₀)P(x₁) ) ( log ) ( ) ( ) ( log ) ( ) ( 0 1 1 1 0 0 1 0 1 0 0 1 x P x P x P x P x P x P x x x x x x    _ _ ) ( log ) ( ) ( log ) ( ) ( ) ( log ) ( ) ( ) ( log ) ( 1 1 0 0 1 0 0 1 1 0 1 1 0 0 x P x P x P x P x P x P x P x P x P x P x x x x             確率 P(x₀) の ) ( 2 ) ( ) ( ) ( g ) ( ) ( g ) ( 1 1 1 1 1 1 0 0 0 S H S H S H x x      _{確率 P(x}₀_{) の} 総和は 1 11 系：任意の無記憶な定常情報源 S に対し，H (S) = H₁(S).

(12)

記憶のある情報源マルコフ情報源の場合

記憶のある情報源：マルコフ情報源の場合

0/0 9 1/0 1 0 1 0/0.9 1/0.1 定常確率分布は w₀ = 0.8, w₁ = 0.2 各通報の定常確率： 0/0.4 1/0.6 0 0.8·0.9 + 0.2·0.4 = 0.80 1 0.8·0.1 + 0.2·0.6 = 0.20 H1(S) = 0.722 不一致 00 0.8·0.9·0.9 + 0.2·0.4·0.9 = 0.72 01 0.8·0.9·0.1 + 0.2·0.4·0.1 = 0.08 _H₁_(S2_{) = 1.2914} 10 0.8·0.1·0.4 + 0.2·0.6·0.4 = 0.08 11 0.8·0.1·0.6 + 0.2·0.6·0.6 = 0.12 H2(S) = H1(S 2_{)/2 = 0.6457} １文字を２個予測するより，２文字まとめてのほうが予測しやすい 12 前スライドの定理は，記憶のある情報源では成立しないまとめてのほうが予測しやすい

(13)

マルコフ情報源の極限エントロピ

マルコフ情報源の極限エントロピー

極限エントロピーの計算：極限エントロピの計算：情報源に記憶がなければ_{...一次エントロピーと一致} 情報源に記憶のある場合は一般には計算困難情報源に記憶のある場合は... 般には計算困難 ⇒ マルコフ情報源であれば，別の手がある 1. 定常確率分布を求めておく 2 各状態についてその状態を記憶のない情報源と考え 2. 各状態について，その状態を記憶のない情報源と考え，極限エントロピー（一次エントロピー）を計算する定常確率分布より各状態のエントロピの加重平均を取る 3. 定常確率分布より，各状態のエントロピーの加重平均を取る 13

(14)

極限エントロピの計算例

極限エントロピーの計算例

0/0 9 1/0 1 0 1 0/0.9 1/0.1 極限分布は w₀ = 0.8, w₁ = 0.2 状態 _{0：P(0)=0.9, P(1)=0.1の情報源 ⇒ H(S) =}H(0.9) = 0.469 0/0.4 1/0.6 ( ) , ( ) ( ) ( ) 状態 _{1：P(0)=0.4, P(1)=0.6の情報源 ⇒ H(S) =}H(0.4) = 0.971 状態_{0に居る確率80%，1に居る確率20%}なので，加重平均は 0.8·0.469 + 0.2·0.971 = 0.5694...これが極限エントロピー 0.8 0.469 + 0.2 0.971 0.5694...これが極限エントロピ ちなみに H₁(S) = 0 722 H₂(S) = 0 6457 単調減少？ 14 ちなみに，H₁(S) 0.722，H₂(S) 0.6457，... 単調減少？

(15)

拡大マルコフ情報源と極限エントロピ

拡大マルコフ情報源と極限エントロピー

一般にマルコフ情報源においてブロック長 n を大きくすると般に，マルコフ情報源においてブロック長 n を大きくすると... n 次エントロピーは単調に減少していく極限エントロピーに収束する極限エントロピに収束する H_n(S) n H(S) 記憶のある情報源：ある程度通報の出現パタンが「読める」ある程度，通報の出現パターンが「読める」自然語だと，_{“qu” は高頻出，“qz” は，まず出現しない} 無記憶の場合より振舞いが予想しやすい ⇒ エントロピ小 15 無記憶の場合より，振舞いが予想しやすい ⇒ エントロピー小

(16)

情報源の記憶とエントロピ

情報源の記憶とエントロピー

定常確率 _{0 8 で 0 を 0 2 で 1 を出力する情報源を考える} 定常確率 _{0.8 で 0 を，0.2 で 1 を出力する情報源を考える} 0/0.8 0/0.9 1/0.1 1/0.2 1/0.6 0/0.4 記憶無し記憶あり記憶無し記憶あり一次エントロピー 0.72 次ント 0.72 極限エントロピー 0.72 0.5694 記憶のある情報源では，「ブロック化したほうが都合良い」場合もプサ条件分岐予測など 16 ⇒ プロセッサの条件分岐予測など

(17)

通報の持つ情報量

阪神タイガースの試合があったが結果をまだ知らない阪神タイガスの試合があったが，結果をまだ知らない阪神が勝つ確率，負ける確率，引き分ける確率は，全部_1/3 巨人ファンの友人Ａからメイル：「阪神は負けなかった」巨人ファンの友人Ａからメイル：「阪神は負けなかった」友人Ａのメイルに含まれる情報の「量」は？メイルを受け取る前：結果に関する不確かさが大きい P(勝) 1/3 P(引) 1/3 P(負) 1/3 P(勝) = 1/3. P(引) = 1/3, P(負) = 1/3 メイルを受け取った後：結果に関する不確かさが小さくなった P(勝) 1/2 P(引) 1/2 P(負) 0 P(勝) = 1/2. P(引) = 1/2, P(負) = 0 「不確かさの減少量情報量」と定義したい 17 「不確かさの減少量＝情報量」と定義したい

(18)

野球の試合の例では

メイルを受け取る前：_{P(勝) = 1/3 P(引) = 1/3 P(負) = 1/3} メイルを受け取る前：_{P(勝) = 1/3, P(引) = 1/3, P(負) = 1/3} エントロピーは 585 1 3 l 1 l 1 1 l 1 1 l 1 585 . 1 3 log 3 log 3 3 log 3 3 log 3      メイルを受け取った後：イを受け取後 _{P(勝) = 1/2, P(引) = 1/2, P(負) = 0}_(勝) _{, (引)} _{, (負)} 条件付きエントロピーは 1 2 log 0 1 log 1 1 log 1 _ _ _ _  0 log2 1 2 log 2 2 log 2   「阪神は負けなかった」というメイルに含まれる情報量： 1.585 – 1 = 0.585 ビット 18

(19)

情報量とエントロピ

情報量とエントロピー

離れたところにある情報源 S の出力（通報）を知りたい 離れたところにある情報源 S の出力（通報）を知りたい 通報の確率分布はわかるが，実際に発生した通報は不明 S の出力に関しなんらかの「ヒント」を入手したとする S の出力に関し，なんらかの「ヒント」を入手したとする ヒントにより，通報の確率分布が，別の情報源 S’ の確率分布 と一致することがわかったとすると致することがわかったとするこのときヒント（通報）がもたらした情報量（_information_{) は} このとき，ヒント（通報）がもたらした情報量（_information_{) は} H(S) – H(S’) ビット 19

(20)

気まぐれな友人の場合（

_1）

気まぐれな友人の場合（

_{case 1）}

右図の行動を取る友人Ｂが _勝ち 0.5 _{「勝たよ」} 右図の行動を取る友人Ｂが「言いたくない」と言った時の情報量は？勝ち引分「勝ったよ」「言いたくない」 0.5 0.5 0 5 1.0 情報量は？負け 0.5_0.5 「負けたよ」 P(言いたくない) = 2/3 P(勝ち，言いたくない) = 1/6 P(勝ち | 言いたくない) = 1/4 P(引分，言いたくない) = 1/3 P(引分 | 言いたくない) = 1/2 P(負け，言いたくない) = 1/6 P(負け | 言いたくない) = 1/4 「言いたくない」と言っているときのエントロピは「言いたくない」と言っているときのエントロピーは 5 . 1 4 1 log 4 1 2 1 log 2 1 4 1 log 4 1 _ _ _  20 情報量は1.585 – 1.5 = 0.085ビット（友人Ａのメイル：0.585ビット）

(21)

気まぐれな友人の場合（

_2）

気まぐれな友人の場合（

_{case 2）}

友人Ｂが「勝ったよ」と言った _勝ち 0.5 _{「勝たよ」} 友人Ｂが「勝ったよ」と言ったときの情報量は？勝ち引分「勝ったよ」「言いたくない」 0.5 0.5 0 5 1.0 P(勝ったよ) = 1/6 負け 0.5_0.5 「負けたよ」 P(勝ち | 勝たよ) 1 P(勝ったよ) = 1/6 P(勝ち，勝ったよ) = 1/6 P(勝ち | 勝ったよ) = 1 P(引分 | 勝ったよ) = 0 P(負け | 勝たよ) 0 エントロピーは０になる（結果を正確に知ることができる） P(負け | 勝ったよ) = 0 （結果を正確に知ることができる）情報量は_{1.585 – 0 = 1.585ビット}（友人Ａのメイル：_{0.585ビット}）（p.17 の）友人Ａと，この友人Ｂ，どちらが「頼りになる」友人か？個々の通報の情報量だけを見ていたのではわからない 21 ... 個々の通報の情報量だけを見ていたのではわからない

(22)

情報量の「平均」

友人Ｂの行動：友人Ｂの行動： 1/6 の確率で「勝ったよ」...情報量 1.585ビット 2/3 の確率で「言いたくない」情報量 0 085ビット 2/3 の確率で「言いたくない」...情報量 0.085ビット 1/6 の確率で「負けたよ」...情報量 1.585ビット平均すると _{1 585}  1/6 + 0 085  2/3 +1 585  1/6 = _{0 585ビット} 平均すると 1.585  1/6 + 0.085  2/3 +1.585  1/6 = 0.585ビット友人Ａの行動： _{2/3の確率で「負けなかった」情報量 0 585ビット} 友人Ａの行動：勝ち 2/3の確率で「負けなかった」...情報量 0.585ビット 1/3の確率で「負けたよ」...情報量 1.585ビット平均すると _{0 585}  2/3 + 1 585  1/3 = _{0 918ビット} 勝ち引分「負けなかった」平均すると 0.585  2/3 + 1.585  1/3 = 0.918ビット平均すると友人Ａのほうが 22 負け「負けたよ」平均すると，友人Ａのほうが_{0.333ビット多くの情報をくれる}

(23)

相互情報量

友人Ａ友人Ｂは異なる特性を持った通信路と考えられる友人Ａ，友人Ｂは，異なる特性を持った通信路と考えられる「負けなかった」「言いたくない」 通信路の入力確率変数を X，出力確率変数を Y とする X と Y の相互情報量 I(X; Y)：各値が持（関する）情報量加重均 X Y Yの各値が持つ（X に関する）情報量の加重平均 23 前ページでは「試合結果と友人の振舞いの相互情報量」を計算

(24)

相互情報量の意味

相互情報量：相互情報量：その通信路が，どれだけの情報を伝達しているかの指標システムとして通信路を実現することを考えると個々のシステムとして通信路を実現することを考えると，個々の通報の情報量より，相互情報量にこそ着目すべき同じ通信路でも，入力分布が変わると，相互情報量も変わる同じ友人Ａでも同じ友人Ａでも_... 勝ち，引分，負けが _{1/3のチーム...相互情報量は0.918ビット} 勝ち負けが_{1/2のチム相互情報量は} _{1 ビット} 勝ち，負けが_{1/2のチーム...相互情報量は} _{1 ビット} 相互情報量の取り得る最大値 ⇒ 通信路容量という（第三部）相互情報量の取り得る最大値 ⇒ 通信路容量という（第三部） 24

(25)

相互情報量の計算例（１）

天気予報：天気についての情報を与えるやや不正確な通信路天気予報：天気についての情報を与える，やや不正確な通信路例：_{100日間の実際の天気 (X) と天気予報 (Y) の統計：} 晴雨 Y P(X) ×100 現実X 予報Y X 45 15 60 12 28 40 晴雨 P(Y)×100 57 43 60 40 P(Y)×100 実際の天気が晴だったのは₅₇日，_P_X_(晴)=0.57 予報が晴といったのは₆₀日，_P_Y（雨）_=0.60 天気 X, 予報 Y とも晴だったのは45日，_P_X,Y_{(晴，晴）=0.45} 25

(26)

相互情報量の計算例（２）

晴雨 Y P(X) ×100 X 45 15 60 12 28 40 晴雨 P(Y)×100 57 43 天気予報が当たる確率＝_{P （晴晴）＋ P （雨雨）=0 73} 60 40 P(Y)×100 天気予報が当たる確率 _P_X,Y（晴，晴）＋ _P_X,Y（雨，雨） _0.73 この予報と友人Ａのメイルどちらが「高性能」？この予報と友人Ａのメイル，どちらが「高性能」？天気のエントロピー： 986 0 43 0 l 43 0 57 0 l 57 0 ) (X H ビット 26 986 . 0 43 . 0 log 43 . 0 57 . 0 log 57 . 0 ) (X     H ビット

(27)

相互情報量の計算例（３）

天気予報Yが晴のとき： 天気予報Yが晴のとき： 本当に晴れる確率は _{0.45/0.60 = 0.75，雨の確率は0.25} 「晴」という予報を聞いた後の条件付エントロピーは「晴」という予報を聞いた後の条件付エントロピは H(X | 晴) = – 0.75log0.75 – 0.25log0.25 = 0.811 ビット 「晴」という天気予報の持つ情報量は _{0 986 0 811 = 0 175} 「晴」という天気予報の持つ情報量は _{0.986 – 0.811 = 0.175} 天気予報Yが雨のとき： 本当に雨の確率は _{0 28/0 40 0 70 晴の確率は0 30} 本当に雨の確率は _{0.28/0.40 = 0.70，晴の確率は0.30} 「雨」という予報を聞いた後の条件付エントロピーは H(X | 雨) 0 30l 0 30 0 70l 0 70 0 881 ビット H(X | 雨) = – 0.30log0.30 – 0.70log0.70 = 0.881 ビット 「雨」という天気予報の持つ情報量は 0.986 – 0.881 = 0.105 加重平均をとると _{0 60 0 175 + 0 40 0 105} _{0 147 ビト} 27 加重平均をとると _{0.60·0.175 + 0.40·0.105 = 0.147 ビット}

(28)

相互情報量と当たる確率

Y A社晴 45 雨 12 晴 Y P(X) ×100 57 A社：まぁまぁ当たる予報 X 45 15 60 12 28 40 晴雨 P(Y)×100 57 43 _73% 0 147ビット 60 0 P(Y) 100 晴雨 Y P(X) ×100 B社：絶対はずれる予報 0.147ビット X 晴 0 43 雨 57 0 晴雨 P(X) ×100 57 43 絶対はずれる予報 0% 情報「量は社予報ほうが大き 43 43 0 57 雨 P(Y)×100 43 0.986ビット 28 情報の「量」は，Ｂ社予報のほうが大きい

(29)

本日のまとめ

エントロピーの概念を導入エントロピの概念を導入予測の難しさを定量化したもの １次 n次極限エントロピー １次，n次，極限エントロピ 無記憶情報源では，上の三者は同一 記憶のある情報源では n → 大のときエントロピー→小 記憶のある情報源では，n → 大のときエントロピー→小 情報量相互情報量を定義情報量，相互情報量を定義エントロピーの減少量として定式化システムの評価には相互情報量の概念が有用システムの評価には，相互情報量の概念が有用 29

(30)

練習問題

１２ページの例において３次４次のエントロピーを求めよ１２ペジの例において，３次，４次のエントロピを求めよ． 可能であれば，n 次エントロピーを計算するプログラムを書け． 以下を示せ I(X; Y) = H(X) – H(X | Y) I(X; Y) H(X) H(X | Y) ただし 



 y y Y X H y P Y X H( | ) ( ) ( | ) （条件付きエントロピの加重平均） I(X; Y) = I(Y; X) I(X; Y) = H(X) + H(Y) H(X Y) （条件付きエントロピーの加重平均） I(X; Y) = H(X) + H(Y) – H(X, Y) ただし H(X, Y) は X と Y の結合エントロピー （X と Y をまとめて一個の確率変数と考える） 30 （X と Y をまとめて一個の確率変数と考える）

Microsoft PowerPoint - 2.ppt [互換モード]

前回の練習問題

前回の練習問題

前回の補足 マルコフ情報源が既約であること

前回の補足：マルコフ情報源が既約であること

本日の講義について

本日の講義について

記憶のない情報源のエントロピ

記憶のない情報源のエントロピー



エントロピ の計算例

エントロピーの計算例

予想の難しさとエントロピ

二元情報源の場合

予想の難しさとエントロピー：二元情報源の場合

M元情報源の場合

M元情報源の場合

拡大情報源について

拡大情報源について

拡大情報源のエントロピ 計算

拡大情報源のエントロピー計算

記憶のない情報源の拡大とエントロピ

記憶のない情報源の拡大とエントロピー

記憶のない情報源の拡大とエントロピ

記憶のない情報源の拡大とエントロピー

記憶のある情報源 マルコフ情報源の場合

記憶のある情報源：マルコフ情報源の場合

マルコフ情報源の極限エントロピ

マルコフ情報源の極限エントロピー

極限エントロピ の計算例

極限エントロピーの計算例

拡大マルコフ情報源と極限エントロピ

拡大マルコフ情報源と極限エントロピー

情報源の記憶とエントロピ

情報源の記憶とエントロピー

通報の持つ情報量

通報の持つ情報量

野球の試合の例では

野球の試合の例では

情報量とエントロピ

情報量とエントロピー

気まぐれな友人の場合（

1）

気まぐれな友人の場合（

case 1）

気まぐれな友人の場合（

2）

気まぐれな友人の場合（

case 2）

情報量の「平均」

情報量の「平均」

相互情報量

相互情報量

相互情報量の意味

相互情報量の意味

相互情報量の計算例（１）

相互情報量の計算例（１）

相互情報量の計算例（２）

相互情報量の計算例（２）

相互情報量の計算例（３）

相互情報量の計算例（３）

相互情報量と当たる確率

相互情報量と当たる確率

本日のまとめ

本日のまとめ

練習問題

練習問題



前回の補足マルコフ情報源が既約であること

エントロピの計算例

拡大情報源のエントロピ計算

記憶のある情報源マルコフ情報源の場合

極限エントロピの計算例

_1）

_{case 1）}

_2）

_{case 2）}