• 検索結果がありません。

オートマトンの考え方を用いた データ圧縮方式

ドキュメント内 ネットワークシステムにおける基本方式 (ページ 39-56)

4 .   1 序 言

(1)研究の経緯

当時(1978年ごろ), 1 B Mが自社の計算機しか接続できないネット ワークアーキテクチャSN A  I文献(1)Jを開発していたことに対抗すべく,

国内5社(電電公社,日本電気,目立,富士通,沖電気)では,異機種計算機 ネットワークが実現できるアーキテクチャー (DC N A)の検討を行い仕様の 概要がほぼ決ってきた「文献 (2)J。ちょうどそのころ, 1 B MがSNAの アプリケーションプロトコルとしてデータ圧縮方式を発表してきた。我々はこ れに対抗すべくこれよりも優れたデータ圧縮方式を早急に立案し,特許として 出願する必要があった。

B Mのデータ圧縮方式とは, EBCDICコード (8ビ ットコード〉表の空 いている所を有効に利用し,特定の13文字(圧縮文字)については4ビット で表現する方式を提案していた。

(2)データ圧縮方式の目的

本方式の目的はよく利用する文字群を複数として圧縮文字の個数の増加を 図ることにより,圧縮効率を向上させることである。

(3 )本方式の理論的背景

‑30 

やり方としては.送受信する相互間で圧縮文字群に対応して状態を持たせ,

この状態を同期しながら切り換えることにより,データ圧縮する文字群を複数 にし,圧縮文字の個数の増加を図ることである(図4. 1 (イ)参照)。この ように,方式がすぐ立案できたのも,学生時代にオートマトンに関する研究

「文献 (3)(4), (5), (6)Jを行っていたからではなし、かと思う。

4 .   2  本方式の基本構成と基本動作「文献 (7) J 

本方式は変換テーブルを用いてデータの圧縮および復元を行うデータ圧縮 方式であり,連続して出現する確率の大きい文字を任意数毎にまとめた複数の 圧縮文字群にそれぞれ対応して前記変換テーブルを設けることを特徴とする。

その基本構成としては,送信側にその変換テーブルと,転送データの各文字が 前記圧縮文字群の何れの群に属するか否かの判定手段と,前回の転送データの 文字が属している圧縮文字群を記憶する記憶手段と,その記憶手段の内容と前 記判定手段の判定結果とを比較する比較手段とを備える。また,その基本動作 では,同ーの圧縮文字群に属する連続した転送データの最初の文字を圧縮コー ドとせずに送信し,その最初の文字の次の文字から前記変換テーブルにより圧 縮コードとして送信する。一方,受信側の基本構成としては前記変換テーブル と,受信データが圧縮文字群の何れの群に属するか否かの判定手段とを備え,

その基本動作ではこの判定手段の判定結果に基づいて前記変換テーブルを用い てデータの復元を行う。

4 .   3  本方式の詳細な説明

d

本方式はデータ送受信方式における送受信効率を向上するためにデータを 圧縮して送信するデータ圧縮方式に関するものである。

データを圧縮することにより送信効率を向上するためのデータ圧縮方式と しては既に種々提案されており. 1 B Mの一例について説明する。

図4. 1 (ロ)に示すように,入力データを送信装置11において送信変 換テーブル12を参照して圧縮可能なデータであるか否かを判定し,例えば1 文字8ビ、ットの場合.データ圧縮の対象となる文字(以下圧縮文字と呼ぶ)に ついては,その文字に対応した4ピットのコード(以下圧縮コードと呼ぶ)に 圧縮し,圧縮文字以外の文字は送信変換テーブル12に定められている8ビ、ツ トのコードに変換して送信する。但し,圧縮文字が奇数個連続する場合は,そ の最後の文字を送信変換テーブル12に定められている(上位4ピットが.F  下位4ピツトが O.か ら c " の )8ピットのコードに変換して送信する。

受信装置13は,受信変換テーブル14を参照して受信データの再生を行 うものであり,上位4ピットおよび下位4ビットがともに圧縮コードであった ならば,その8ビ ットは2つの圧縮文字が圧縮されたものと判断し,上位4ピ ットと下位4ピットとをそれぞれに対応した圧縮文字に変換する。また,上位 4ビ、ットおよび下位4ピットの両方あるいは片方が圧縮コードでない場合は,

その8ビ、ットは2つの圧縮文字が圧縮されたものでないと判断してその8ピッ トを受信変換テーブル14を用いて逆変換し復元する。

図4. 2は従来の変換テーブルの一例を示したものであり,圧縮文字はF 行のO列からC列までのも.A.  D.  E.  G.  1.  L.  N. O.  R.  S.  T. 

Uであって,これと対応する圧縮コードは4ビット 16進数の O.から C.

である。圧縮文字以外の文字のコードは変換テーブルの左側に表示されている

nd

q a    

1 6進数を上位4ピット,上側に表示されている16進数を下位4ピットとし て計 8ビットで表される。例えばD行 8列の文字 Bをこの変換テーブルによっ て変換すると8ピットの" D 8" となる。

図4. 3は図4. 2の変換テーブルを用いてデータ圧縮を行った場合の説 明図であり,データを rREQ/MODULE/Jとすると. R.  Eは圧縮文 字であるので,それに対応する 4ピットの圧縮コード 9". 3"に変換し,

Q .   / .  

Mは圧縮文字でないので,それに対応する2つの16進数で表した8 ピットのコード"CD" . " EB" . " DE"に変換し.O.  D.  U.  Lは圧 縮文字であるのでそれに対応する4ピットの圧縮コード 8". 2". 

C" • " 6" に変換する。次の Eも圧縮文字であるが,前述したように圧縮文 字が奇数個連続した場合の最後の文字であるので8ピットの"F 3"に変換す る。即ち矢印で示すように,各文字が変換され,圧縮コード化された文字が多 いほど,送信データが短くなり,送信効率が向上する。

受信装置では,転送されたデータを 8ピットずつチェックし,上位 4ピッ トと下位 4ビ、ットの両方が圧縮文字か否かの判定を行って逆変換を行うもので あり,前述の送信データの場合,最初の8ピットの 9". 3" はどちらも 圧縮コードであるので 9"をRに 3"をEにそれぞれ逆変換し:復元する。

次の 8ピットの" C D"は. Dが圧縮コードでないので図 4. 2の変換テープ ルC行D列に対応する文字Qに逆変換する。以下についても同様の処理を行い,

逆変換して文字を復元する。

しかし,このような従来の方式では圧縮文字の個数が制限されているので 十分な圧縮効率を得ることはできなかった。

本方式は,このような欠点を改善したものであり,連続して出現しやすい

u

q o  

文字の群を複数個として圧縮文字の個数の増加を図り,かつ圧縮の対象となる 文字群の切り替えを識別し得るようにして,圧縮効率を向上することを目的と するものである。以下実施例について詳細に説明する。

図4. 4は本方式の実施例の送信装置のフeロック線図であり, 4 1 1は送 信装置, 4 1 2は制御回路, 413,416,422,426,428は信号 線, 4 1 4はバッファ, 4 1 5はアドレスレジスタ, 4 1 7は変換テープルメ モリ, 4 1 8から42,1 425, 427はバッファレジスタ, 423は回線 バッファ, 424は圧縮文字群状態レジスタである。

図4. 5は本方式の実施例の受信装置のフ'ロック線図であり, 4 5 1は受 信装置, 452は制御回路, 453,459は信号鰻, 454は回掠パッファ,

455はバッファレジスタ, 456,458はアドレスレジスタ, 457は圧 縮文字群状態レジスタ, 460 は変換テーブルメモリ, 4 6 1はバッファであ る。

図4. 6は本方式の実施例の変換テーブルメモリの一例を示すものであり,

圧縮文字は英語大文字:空白文字, A, D, E, G, ! , L, N, 0, R, S, 

T, Uからなる圧縮文字群1,数字等:空白文字,数字0,・・・ 9, *,  /からなる圧縮文字群2,英語小文字:空白文字 a,d, e, g, i, 1,  m, 0, r, s, t, Uからなる圧縮文字群3の3つの群に分かれている。

このように圧縮文字群が英語大文字,数字等,英語小文字からなる3つの 群に分かれているので,送信装置41 1が現在どの圧縮文字群を対象としてデ

ータ圧縮を行っているかを判定する必要があり,また受信装置451も転送さ れてきた圧縮コードがどの圧縮文字群に属しているかを判断する必要がある。

そこで異なる圧縮群に属する最初の文字は圧縮コード化することなく送信して

aq

q a    

圧縮文字群の識別を可能としている。

バッファ414にセットされた転送データは制御回路412より信号線4 1 3を介して転送信号がバッファ414に加えられることによりバッファ41  4からアドレスレジスタ415に転送データが8ビット即ち1文字分セットさ れる。変換テーブルメモリ 417は制御回路412から信号線416を介した 変換指示信号を受けると,アドレスバッファ415にセットされている転送デ ータを8ピットの変換コードに変換し,バッファレジスタ418に変換コード をセットする。また,それとともに転送データが圧縮文字であるか否かの情報 をバッファレジスタ419にセットし,圧縮文字であればその圧縮文字がどの 圧縮文字群に属しているかの情報をバッファレジスタ420に セ ッ ト し そ の 転送データに対応した4ピットの圧縮コード、をバッファレジスタ421にセッ トする。また,圧縮文字群状態レジスタ424には現在どの圧縮文字群を対象 として送信装置41 1がデータ圧縮を行っているかという圧縮文字群情報が記 樟されている。

制御回路412ではバッファレジスタ419の内容を読み込み,アドレス レジスタ415にセットされた転送データが圧縮文字であるか否かを識別し,

圧縮文字でない場合は信号線422を介して転送信号をバッファレジスタ41  8に送りバッファレジスタ418にセットされた8ピットの変換コードを回線 バッファレジスタ423に転送する。また圧縮文字の場合は,バッファレジス タ420の内容と圧縮文字群状態レジスタ424の内容とを比較し,この圧縮 文字が現在データ圧縮の対象となっている圧縮文字群に属しているか否かを判 断する。

この比較結果が不一致の場合は,圧縮文字群状態レジスタ424の内容を

‑35‑

バッファレジスタ420の内容で書き替え,制御回路412は信号線422を 介して転送信号をバッファレジスタ418に送り,バッファレジスタ418に セットされている変換コードを回線バッファ423に転送する。この比較結果 が一致の場合は.信号線422を介してシフト信号をノ〈ッファレジスタ418 に送り,バッファレジスタ418の内容をバッファレジスタ425に移すとと もに信号線426を介してシフト信号をバッファレジスタ421に送り,バッ ファレジスタ42 1にセットされている4ピットの圧縮コードをバッファレジ スタ427に移す。次に制御回路412は信号線413を介してバッファ41 

4に次の転送データを 8ビ、ット即ち一文字分セットし,この転送データについ て変換テーブルメモリ 417を用いて前述した処理と同様の処理を行う。

次に 1文字目が圧縮文字の場合の2文字目の処理について以下に示す。

制御回路412でバッファレジスタ419にセットされている内容を読み込み 解読した結果が圧縮文字でない場合は,制御回路412より信号線428を介 してバッファレジスタ425にセットされている8ピットの変換コードを回緯 バッファ423に転送し,次に信号線422を介して転送信号をノ〈ッファレジ スタ418に送りバッファレジスタ418にセットされている8ピットの変換 コード を回線バッファ423に転送する。

転送データが圧縮文字である場合には,バッファレジスタ420にセット されている圧縮文字群の種別と圧縮文字群状態レジスタ424にセットされて いる現在データ圧縮の対象としている圧縮文字群の種別と比較する。

この比較結果が一致の場合は,制御回路412より信号線426を介して 転送信号をバッファレジスタ42,1 427に送り,バッファレジスタ42,1

427にセットされている各4ピットの圧縮コードを同時に回線バッファ 42 

‑36‑

ドキュメント内 ネットワークシステムにおける基本方式 (ページ 39-56)