• 検索結果がありません。

「黄金虫」の暗号について

N/A
N/A
Protected

Academic year: 2021

シェア "「黄金虫」の暗号について"

Copied!
14
0
0

読み込み中.... (全文を見る)

全文

(1)

「黄金虫」の暗号について

著者 橋本 直樹

雑誌名 英語英文学研究

巻 19

ページ 56‑68

発行年 2013‑10

出版者 東京家政大学人文学部英語コミュニケーション学科

URL http://id.nii.ac.jp/1653/00009705/

(2)

「黄金虫」の暗号について

橋 本 直 樹

§1.はじめに

Edger Allan Poeの小説「黄金虫」は、小説の中で暗号を使った初期の 作品として有名で、同様にArthur Conan Doyleの「踊る人形」の暗号も よく知られている。小説の中の暗号は謎解きのスリルを論理的に味わうこ とができるため多くのファンがいる。本稿は、暗号論そのものを扱うので はなく、「黄金虫」に使われている暗号解読の方法に英語のアルファベッ トの分布の知識を用いていることに興味がありその議論を行う。

ここで、「黄金虫」の暗号の謎解きの冒頭部分を再確認する(記号は修正)。

53++!305))6*;4826)4+.)4+);806*;48!8`60))85

;1+(;:+*8!83(88)5*!;46(;88*96*?;8)*+(;485);5*!

2:*+(;4956*2(5*-4)8`8*;4069285);)6!8)4++;1 (+9;48081;8:8+1;48!85;4)485!528806*81(+9

;48;(88;4(+?34;48)4+;161;:188;+?;

小説ではこの文章にKiddyの署名があることにより英語で書かれた暗号で あると推論する。そして解読のため暗号文のなかの文字の出現数を数える。

8 [33回] ; [26回] 4 [19回] +[16回] ) [16回]

* [13回] 5 [12回] 6 [11回] ![8回] 0 [6回]

9 [5回] 2 [5回] : [4回] 3 [4回] ? [3回]

(3)

[2回] - [1回] . [1回]

「黄金虫」内の記述では、通常の英語の文字の出現頻度を eaoidhnrstuycfglmwbkpqxz

としている。この出現頻度と暗号文中の文字の出現頻度を対比させると、

8 が一番多いので、これが「e」の文字と仮定する。以下、単語の類推等 を経て暗号文を全解明するのである:

A good glass in the bishop’s hostel in the evil’s seat twenty-one degrees and thirteen minutes northeast and by north main branch seventh limb east side shoot from the left eye of the death’s-head a bee line from the tree through the shot fifty feet out.

上述の文字の出現頻度は、現在の通常の知見と異なる。そのため本稿で は、その出現頻度はどのようにして採用されたかを議論する。その文字の 出現頻度が当時の文章を調べて得られる可能性も含めて考える。2節で分 析プログラム及び文字列を比較する方法を述べ、3節では得られた出現頻 度を示す。そして4節で結果を議論する。

§2.分析プログラムおよび文字列比較について

文章中の文字数を数えるプログラムは極めて簡単に作成できる。文章の 最初から1文字ずつ切り取り、そのカウントを26のアルファベットごとに 加算していけばよい。同時に、ソート(並べかえ)をして出現文字数の多 い順に並べかえたものを出力する。このプログラムはC言語で書いた。本 稿で扱う文章の規模であれば、パソコンで十分に対応できる。C言語のコ ンパイラには、Microsoft Visual Studio 2010 のコマンドライン版を使う。

(4)

すなわちコマンドライン(コマンドプロンプト)で走る実行ファイルを作 成する。Windowsプログラムではなく、コマンドラインで実行するプログ ラムを用いるには、理由がある。本稿では多数の文章それぞれの文字出現 列を得たい。これを効率よく得るには、いわゆるバッチ処理(一括処理)

を行うのがよい。バッチファイルをエディタで作成し、そのバッチファイ ルを一度実行すれば、処理はほとんど自動化される。

得られた文字列どうしを比較する方法は、いくつか存在する。同じ長さ の文字列どうしを比較するには、ハミング距離という概念がある。次節以 降で比較する文字列は、24文字と26文字の列の比較を行うので、ハミング 距離は使えず、代わりにその一般化された概念である「レーベンシュタイ ン距離」(Levenshtein 1966) を用いる。この距離は、ある文字列に対し文 字の挿入、削除、置換を施して別の文字列に変形するのに要する最小の手 続き数のことである。レーベンシュタイン距離は、VBA(Visual Basic Application) を用いて、Excelの中でマクロとして計算した。

§3.分析内容と出現頻度

Edger Allan Poeが黄金虫の中の暗号解きに用いた単語の出現数列は、

諸説があるものの、論文としての主張は若干である。多くの論者は推測で 議論をしているので、はじめにこの点を述べる。

Poeの暗号方法が Abraham Rees’s Cyclopedia(1819)の中の“Cipher”

についての William Blair(1818) の記述箇所であることを最初に指摘した のは W.K. Wimsatt(1945) と思われる。 PoeはBlairの複数の暗号方法の 中で、最も簡単な方法を用いている。暗号を解くために用いる文字の出現 頻度は、Blairの次の箇所で示されている。(Blair 1819;ページ番号がな いので原文で示す)

(5)

; again by comparing the frequency of the letters, you will generally find e occur the oftenest; next o, then a, and i; but u; and s and t.

Among the vowels, e and o are often doubled; the rest but y is much less frequent, and consequently easily distinguished.

To find out one consonant from another, you must also observe the fre- quency of d,h,n,r,s,t; and next to those, c,f,g,l,m,w; in a third rank may be placed b,k,p and lastly q,x,z.

Blair は、文字の出現頻度を議論するにあたり文字を母音と子音にわけ

て、それぞれの出現頻度を示している。特に最初は、母音だけで e,o,a,i がその順位となることを主張している。そして次につづくのが子音のグル ープd,h,n,r,s,t となっている。しかし、Wismatt は、Poeがこの出現頻度 を正確に用いていないことも指摘している。Wismatt(1945: 772)が述べて いる主なものは次のことである。

1.PoeはBlairの母音文字の出現頻度をコピーしているが

o とa を逆にしている。

2. 最初の4つの母音の直後はs t としたが、Poeはそれを削除し

s t は、子音の最初のグループにいれた。その子音のグループは アルファベット順に並べ替えられ、その結果d,h,n,r,s,t となった。

そして、s t の直後にu, y が挿入された。

子音のグループは(d,h,n,r,s,t)、(c,f,g,l,m,w)、(b,k,p)、(q,x,z)に分けられ ているが、各グループ内の出現頻度についてのBlairやPoeの主張はない。

各グループ内の順位は当時不明であった。最終的にPoeは暗号の謎解きに、

Poe列:eaoidhnrstuycfglmwbkpqxz

の文字の出現頻度を用いた。小説では、単語 “the” が文章に多く使われる

(6)

ことを用いているが、Poeによる文字出現頻度では、“t” の順位が後ろすぎ る。Poeの当初の考えによれば

派生Poe列: eaoistdhnruycfglmwbkpqxz

としてもよかったのかもしれないが、小説中の謎解きには、ほとんど影響 がないので、“t” の順位の重要性は無視されたと考えられる。

この点は、J. Woodrow Hassell, Jr.(1953:186) でも指摘されている。

Hassell はHelen F. Gaines( 1944) による文字の出現頻度が「etoanirs hdlcfumpywgbvkxjqz」(以下Gaines列という)であることを引用して Poe のその利用が不正確なことを指摘している。

以上のことより、Poeが小説中、暗号解読に用いた文字出現頻度の列の 採用理由が理解できる。しかし、Blair やPoeは、当時の実際の文章の文 字の出現頻度を求めた可能性は不明である。本研究の一番最初の動機は、

この点であった。はじめ考えたのは、Poe自信が短い文章を調べたのか、

或いは他の人が実際の文章を調べたものを引用したのかということであっ た。Blairの引用が分かった後もその文字の出現頻度の出典は不明である。

また、Poe自信もその文字の出現列を変形しているように、かなりの知識 は持っていたと思われる。このため、当時の文章の文字出現頻度を調べた。

Poe自信による文章が最適なので、彼の書いた文章を、文章ごとに§2で 述べた方法により出現頻度を計算した。このとき、詩(Poetry)と散文 (Prose)を別個に扱った。また、それらから得られた結果の文字列を①Poe の小説内の文字列(Poe列)、②Gaines の文字列(Gaines列)とのレーベンシ ュタイン距離を計算した。②のGainesは、一般の文章についての結果で、

近年のコンピュータを用いて得られる一般的な文字列頻度に極めて近いの で「黄金虫」の暗号とは直接関係ないが参考のため計算した。計算結果は 次節の議論に用いる。

文章が多いため、以下で結果を見やすくするために、各文章に番号付け をした。1〜49は詩で50〜137までは散文である。

(7)
(8)
(9)

これらの文章に対して、§2で述べた文字出現頻度の計算をバッチ処理 で行った。文章ごとにそれぞれの文字の出現数を計算し、それを比率の大 きい順に並べ替えた結果を出力する。次は、詩に対する結果である。

(10)

同様の計算を散文に対して行った。散文は詩に比べて文章が長いので少 し時間を要するが、十数分で処理ができる。

(11)
(12)

§4.結果と議論

文字の出現頻度およびその多い方からの並び順は前節で示したが、同様 の文章について、レーベンシュタイン距離も計算した。この距離はPoe列 およびGaines列に対する各文章からの出現頻度の文字列から計算した。

すべての文章について計算したが、以下で主なものを示す。ただし、こ こでLpはPoe列からのレーベンシュタイン距離、LgはGaines列からのレ ーベンシュタイン距離のことである。

表1 レーベンシュタイン距離の例

ここで、文書番号「106」は、「黄金虫」の文章である。詩と散文の文章 の各距離の平均を求めると次のようになる。

表2 詩、散文のレーベンシュタイン距離

(13)

以上の結果をまとめると次のことが観察される。

eaoiの4文字が同じものはない。

eaoの3文字が同じものは 文書番号38だけである。

③ 母音だけを取り出した時、列がeaoiのものは存在する。

文書番号14, 31, 38, 45 など。

Lgは散文に対しては小さい。

Lp,Lgいずれも詩の方が大きい。

⑥「黄金虫」のLp, LgはPoe文章の平均に近い。

⑦ 詩には、etと続かないものが18個あり、teとなるものが 2個ある。散文と大きく異なる。

結論は、Poeは自身の書いた詩、散文の文字の出現頻度を調べていない。

しかし彼はその出現頻度について相当の高い知識を持ち、Blairを引用し て自らの小説に用いた。

黄金虫が執筆された当時の文字の出現頻度に関する研究は手作業で行な わなくてはならず、その研究はほとんどなかったようである。Blairは、

暗号化に用いるために非常に広範囲の知識を持っていたことを示している。

Poeがこのような状況下で、論理的にある程度裏打ちされる「黄金虫」を 書いたことは驚くべきことである。

参考文献

Blair, William, article on "Cipher." In volume eight of Abraham Rees' The Cyclopaedia; or Universal Dictionary of Arts, Sciences, and Literature, London: 1819.

http://www.bealetreasurestory.com/sitebuildercontent/sitebuilderfiles/r ees_cyclopaedia.pdf

(14)

Gaines, Helen F., “Elementary Cryptanalysis”, (Boston 1944)

Hassell, J.Woodrow,Jr., “The Problem of Realism in The Gold Bug”

(American Literature Vol25,No2.(1953) p186

Levenshtein VI (1966). "Binary codes capable of correcting deletions, insertions, and reversals"_.Soviet Physics Doklady10: 707-10.

Rees' Cyclopedia, http://archive.org/stream/cyclopaediaoruni08rees

Wimsatt, W.K. , “What Poe Knew About Cryptography”, MLA 58(September 1945)p754-797

参照

関連したドキュメント

Inside this class, we identify a new subclass of Liouvillian integrable systems, under suitable conditions such Liouvillian integrable systems can have at most one limit cycle, and

In this paper we show how to obtain a result closely analogous to the McAlister theorem for a certain class of inverse semigroups with zero, based on the idea of a Brandt

We present sufficient conditions for the existence of solutions to Neu- mann and periodic boundary-value problems for some class of quasilinear ordinary differential equations.. We

Then it follows immediately from a suitable version of “Hensel’s Lemma” [cf., e.g., the argument of [4], Lemma 2.1] that S may be obtained, as the notation suggests, as the m A

To derive a weak formulation of (1.1)–(1.8), we first assume that the functions v, p, θ and c are a classical solution of our problem. 33]) and substitute the Neumann boundary

The proof uses a set up of Seiberg Witten theory that replaces generic metrics by the construction of a localised Euler class of an infinite dimensional bundle with a Fredholm

[Mag3] , Painlev´ e-type differential equations for the recurrence coefficients of semi- classical orthogonal polynomials, J. Zaslavsky , Asymptotic expansions of ratios of

A bounded linear operator T ∈ L(X ) on a Banach space X is said to satisfy Browder’s theorem if two important spectra, originating from Fredholm theory, the Browder spectrum and