概要 - 付録 C ﬁndclose, ﬁndopen, enclose 命令 - 離散構造の効率的な符号化に関する研究

付録 C ﬁndclose, ﬁndopen, enclose 命令

C.2 概要

S ( ( ( ( ( ) ))))

i x

previous pioneer of S[i]

k p j y ql

far far

図 C.2: 背理法の仮定におけるS[j]とS[l]の状況

する. j = f indclose(i)とする. S[k] = ‘(’をS[i]の直前のpioneerな括弧とし, l =f indclose(k)とする. このとき, 次が言える.

補題 C.1.1 S[j]とS[l]は同じブロックに含まれる.

証明. S[i]の直前のfarな括弧がS[k]である場合, 明らかに上の主張が成立する.

そうでない場合を考えよう. S[j]とS[l]は異なるブロックに含まれると仮定する.

S[k]の直後に現れるfarな括弧をS[p] = ‘(’とし, f indclose(p) =qとする. このとき, S[q]はS[l]と同じブロックに含まれる. なぜならば, そうでないとするとS[p]

がpioneerでないことに矛盾するからである. 図C.2に位置関係を示す. S[p]の直

後のfarな括弧についても同様の議論ができる. これを繰り返すことにより, S[i]

の直前のfarな括弧S[x] = ‘(’に対応する括弧S[y] = ‘)’もS[l]と同じブロックに含まれる. これはS[i]がpioneerでないことに矛盾する. 以上により, S[j]とS[l]は同じブロックに含まれる. Q.E.D. したがって, もし, 直前のpioneerな括弧の位置kが計算できたならば, pioneer な括弧のテーブルからlを得ることができる. その結果, jを含むブロックを得る.

このようにしてjが存在し得る範囲をせばめることができる.

以上がf indclose(i)を計算するための主なアイデアである. (1)と(3)について

はf indclose(i)の範囲を1ブロック分にせばめただけである. しかし, そのブロッ

クをさらに小さなブロックに分割し同様のアイデアを適用することにより,さらに範囲をせばめることができる. f indclose(i)の範囲が十分に小さくなった後, ユニバーサルテーブルを用いることにより, f indclose(i)の値を計算する.

C.2 概要

本節では, f indclose(i)を計算するアルゴリズムの概要を述べる.

いくつかの準備からはじめよう.

116 付録C ﬁndclose, ﬁndopen, enclose命令入れ子構造をもった‘(’と‘)’からなる符号Sが与えられたとする. Sの長さを 2nとする. はじめに,符号Sを次のように3段階に分割する. まず,長さlg²nのブロックにSを分割する. 長さlg²nのブロックを大ブロックと呼ぶことにする. 次に,各大ブロックを長さ4(lg lgn)²のブロックに分割する. このブロックを中ブロックと呼ぶことにする. さらに,各中ブロックを長さ2 lg lgnのブロックに分割する.

このブロックを小ブロックと呼ぶことにする.

S[i] = ‘(’であるようなS上の位置iが与えられたとき, j =f indclose(i)を次のように計算する. はじめに, iを含む中ブロック内でjを探索する. もし, iとjが同じ中ブロックに含まれているならば, このときにjの値を得る. そうでないならば, iと異なる中ブロックにjは含まれることが分かる. 次に, iと同じ大ブロック内でjを探索する. もし, jが見つかればアルゴリズムは終了する. そうでないならば, iと異なる大ブロックにjが含まれていることが分かる. 最後に, jを含む大ブロックを計算し, その中でjを探索する.

説明が前後するが,はじめに,iとjが異なる大ブロックに含まれている場合について説明する. 次に, iとjが同じ大ブロックに含まれているが, 異なる中ブロックに含まれている場合の探索方法を説明する. 最後に同じ中ブロックに含まれている場合について説明する.

C.3 j = f indclose(i) を含む大ブロックの計算方法

S[i] = ‘(’であるようなS上の位置iが与えられたとし,S[i]はfarであるとする.

j =f indclose(i)とする. このとき, o(n) bit の補助テーブルを用いることにより, j =f indclose(i)をO(1)時間で計算する方法を説明する.

はじめに,jを含む大ブロックを計算する方法を説明する.

jを含む大ブロックを計算するために次の5つのテーブルを用いる.

テーブル1: 大ブロックについてのpioneer.

大ブロックについてpioneerであるような各S[i] = ‘(’に対して, S[i]と対応する

‘)’の位置を保存する.

テーブル2: pioneerな‘(’に関する長さ4(lg lgn)²のビットマップ.

pioneerな‘(’を含む全ての中ブロックに対して, 中ブロックのk番目の文字が

pioneerな‘(’であるならば, ‘1’, そうでないならば ‘0’であるようなビットマップ

を保存する. ビットマップの長さは中ブロックの長さと等しい.

テーブル3: 中ブロックについてのユニバーサルテーブル.

このテーブルは, 長さ4(lg lgn)²の2進符号についてのユニバーサルテーブルで

C.3. j =f indclose(i)を含む大ブロックの計算方法 117

ある. 長さ4(lg lgn)²の2進符号が取り得る全ての符号の各位置に対して, 直前に

出現する‘1’の位置を保存する. 直前に出現する‘1’がない場合は0を保存する.

テーブル4: 中ブロックについての直前のpioneerな‘(’.

M を中ブロックとし, M を含む大ブロックをBとする. Bの中でM の直前に

現れるpioneerな‘(’の位置を保存する. もし, Bの中にそのような‘(’がないなら

ば0を保存する.

テーブル5: 大ブロックについての直前のpioneerな‘(’.

各大ブロックに対して直前に現れるpioneerな‘(’の位置を保存する.

上記の補助テーブルを利用してjを含む大ブロックを計算する. 大ブロックについてfarな括弧S[i] = ‘(’が与えられたとする. 補題C.1.1より, S[i]の直前の

pioneerな‘(’に対応する‘)’とjとは同じ大ブロックに含まれている. したがって,

S[i]の直前のpioneerな‘(’が計算できたならば, テーブル1を使ってj を含むブ

ロックを計算できる. では, S[i]の直前のpioneerな‘(’を求めることを考えよう. i を含む中ブロックをMiとする. 次の3つのステップによりjを含む大ブロックを計算することができる.

ステップ1: pioneerであるかどうかのチェック.

はじめに, S[i]がpioneerであるかどうかをテーブル1より調べる. もし, S[i]が

pioneerであるならば, テーブル1よりjの値を得る. そうでないならばステップ2

へ進む.

ステップ2: pioneerな‘(’をM_iが含む場合.

iを含む中ブロックにpioneerな‘(’が含まれるかどうかをテーブル2より調べる.

もしM_iがテーブル2のエントリに含まれていないならばM_iはpioneerな‘(’を含まない. その場合はステップ3へ進む. そうでないならば, iの直前のpioneerな‘(’

をM_iの中から探し出すことを試みる. テーブル2より得られるM_iのpioneerビットマップと位置iをテーブル3へ渡すことにより, iの直前のpioneerな‘(’の位置を得る. もし, テーブル3から0を得たときは, iの直前のpioneerな‘(’が異なる中ブロックに含まれることを意味する. そのような場合はステップ3へ進む.

ステップ3:

ステップ2までで,iの直前のpioneerな‘(’はM_iの中にないことが分かった. M_i を含む大ブロックをB_iとする. テーブル4より, iの直前のpioneerな‘(’がB_iの中にあるかどうかを調べる. もし見つからなかった場合, iの直前のpioneerな‘(’

はB_iの中に含まれていないことになる. そのような場合, テーブル5より, B_iの直前のpioneerな‘(’を得る. これが, iの直前のpioneerな‘(’である.

118 付録C ﬁndclose, ﬁndopen, enclose命令それでは, テーブル1–5のサイズをそれぞれ見積もる. 各テーブルのサイズが

o(n) bit で抑えられることを示す. はじめにテーブル1について考える. 大ブロッ

クの個数は_lgⁿ2nなので,大ブロックに関するpioneerな‘(’の個数は高々2·_lg²ⁿ²_n−3 個である[17, 18]. したがって, テーブル1のエントリは高々O⁽_lgⁿ2n

)

個である. 各エントリ当たりO(lgn) bitの記憶領域が必要なので, 全体の記憶領域はO(_lgⁿ_n) bit である. 次に,テーブル2のサイズを見積もる. 大ブロックに関するpioneerな‘(’の個数は高々2·_lg²ⁿ²_n−3個なので,テーブル2のサイズはO(_lgⁿ2n)·4(lg lgn)² =O(_lgⁿ_n) bit である. 次にテーブル3のサイズを見積もる. 長さ4(lg lgn)²の各符号がとり得る全ての符号は2^{4(lg lg}ⁿ⁾²通りである. ここで, 2^{4(lg lg}ⁿ⁾² =Aとおき,両辺のlg をとると次のようになる.

lgA = lg⁽2^{4(lg lg}ⁿ⁾²⁾

= 4(lg lgn)²

= 4(lg lgn)(lg lgn)

= lg (lgn)^{4(lg lg}ⁿ⁾

したがって, 2^{4(lg lg}ⁿ⁾² = (lgn)^{4(lg lg}ⁿ⁾である. 2進符号の各位置について情報を覚えるので, テーブル3の全エントリはO((lgn)^{4(lg lg}ⁿ⁾(lg lgn)²)個である. 各エントリにつきO(lg lg lgn) bit の記憶領域が必要となるので, テーブル3のサイズは O((lgn)^{4(lg lg}ⁿ⁾(lg lgn)²lg lg lgn) bit である. 次にテーブル4を見積もる. テーブル 4のエントリは全ての中ブロックである. ゆえにO(_{(lg lg}ⁿ_n)2)個である. 各エントリ当たりO(lg lgn) bit 必要である. したがって, テーブル4のサイズはO(_{lg lg}ⁿ_n) bit である. 最後にテーブル5を見積もる. テーブル5のエントリ全ての大ブロックである. ゆえにO(_(lgⁿ_n)2)個である. 各エントリ当たりO(lgn) bit 必要である. したがって, テーブル4のサイズはO(_lgⁿ_n) bit である.

C.4 指定された大ブロック中から j = f indclose(i) _を計

ドキュメント内離散構造の効率的な符号化に関する研究 (ページ 115-118)

概要

付 録 C ﬁndclose, ﬁndopen, enclose 命令

C.2 概要

C.2 概要

C.3 j = f indclose(i) を含む大ブロックの計算方法

C.4 指定された大ブロック中から j = f indclose(i) を計

付録 C ﬁndclose, ﬁndopen, enclose 命令

C.4 指定された大ブロック中から j = f indclose(i) _を計