• 検索結果がありません。

漢字入出力の一手法 利用統計を見る

N/A
N/A
Protected

Academic year: 2021

シェア "漢字入出力の一手法 利用統計を見る"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

漢字入出力の一手法

(昭和54年8月31日受理)

有泉均

廣嶋くに代

A Input-output Method of Japanese Character

HitoshiARIIZUMI KuniyoHIROSHIMA Abstract  Computer processing on Japanese characters have many problems for their striking variety contrast to the alphabet. This report describes one method about their input−output system without the exclusive devices.  The input is accomplished by conversational use of the storage CRT with key board, in which the selection, correction and synthesis of character is easily done.  The expansion of size and allocation is possible in the output display of character string.

1.はじめに

 一般に科学技術計算などでは,情報の電算機への入 出力形態として英数字で行われている場合が多い。科 学技術計算に対して,広く利用されている分野である 事務処理の能力を向上するために,漢字・ひらがな・ カナ文字等を含む日本語入出力システムが近年注目を 集めている1)2)。  しかし,特に漢字を電算機で取り扱うには幾多の困 難な問題がある。たとえぽ,漢字の入力は英数字やカ ナの入力のように容易にできないし,出力も漢字の複 雑なパターンを鮮明に打つことや字種を多く取り扱う ことなどがむずかしい。そのため機械は専用システム となり,大形で高価となる。そこで,通常の一般研究 用に設置されている機器を利用して日本語入出力シス テムの可能性について検討し,その開発を考えた。こ こでは,文字の入力を会話的に行うことにより,文字 の選択,訂正や新字種の導入が容易に行えるようにな った。 2・システムの設計方針 1) 科学技術計算の研究利用を目的としたシステム構  成の範囲内で専用機器を用いないでも実現できるこ  と。

2) COBOL, FORTRANなどの一般高級言語での

 利用が可能で,そのサポートが容易なこと。 3)漢字などの入力方法に特別な訓練を必要とせず,  容易であること。 4) 当用漢字2000字を含め,日常使用される字種が用  意されていること。 5) 地名,人名漢字などの特殊性に対して簡単に対処  できること。 6) 漢字の出力の品質が実用上十分であること。 3・システム構成  ここで使用する日本語入出力システムのハードウェ ア構成は図一1のようになっている。  このシステムは,中央処理装置(384Kバイトの主 記憶)や磁気ディスク装置,磁気テープ装置などを含 めたもので,それにラインプリンタ,カードリーダな ど比較的情報転送速度の低速な入出力装置を制御する 機能を持つユニットレコード処理装置(URP)が接 続されている。これに端末との通信のために出力メッ セージを伝送コードに変換する機能などを持っている 通信制御装置(UCLA)が内蔵され,通信回線を経 て,ストレージ型のグラフィック・ディスプレイ(キ ーボードおよびハードコピー付)と主としてカナ出力 用のターミナル・プリンタが接続されている構成とな っている。  ここで,図一1に示すように通信制御装置とグラフ

(2)

ACOSシリーズ77 NEACシステム300  384KB カード読取装置  600枚/分 文字 出力用  1200ビット/秒   全二重 操作卓

1200ビット/秒 半二重 ターミナル・プリンタ (カナ文字出力専用)    ラインプリンタ装置     800/1000行/分

図一1 システム構成図

イック・ディスプレイ間の通信回線は,調歩,全二重 通信方式で,伝送速度は1200ビット/Sまた,通信 制御装置とターミナルプリソタ間の通信回線は,調 歩,半二重通信方式で,伝送速度は1200ビット/Sで ある。ターミナルプリンタの印字速度は40字/Sであ る。 4・文字データの形式  ここで使用される文字データは漢字・ひらがな・カ タカナ・英数字および記号より構成される。これらの 字形は,32×32のドット・マトリックス内の整数座標 点列で構成され,画面の下段,左端が(0,0)に対応 している。  文字を構成する各ストロ 一一ク(線素)の始点は〔一〕 符号で表され,たとえぽ図一2の字形〔+〕であれぽ   〔十〕 →  −316/2916/−1629/1603/0 の整数値で表現されている。  数字列の終わり(各字形データの終わり)は数値 (0)で表され,終端記号として用いている。  これらの字形のそれぞれに音読みに相当するローマ 字が割当てられている。 5.文字データの格納  各文字に対応する座標形式の整数値列とこれらの整 数値列を索引するためのローマ字列からなる文字デー IY(32) IY(0)   IX(0)      IX(32)  図一2文字データと座標との対応 タは,一次記憶として磁気テープ,ディスク装置へ格 納されており,実行に先立って,プログラム内の配列 へPt ・一ドして使用する。

 ACOS FORTRANではOSの記憶領域管理方式

により,一つの配列を指定した大きさのいくつかの セグメソトに分割させることができる3)。すなわち,

SEGMENT文によって,複数個のセグメソトに分割

された共通ブロックは,その共通ブロック名と同一の セグメント名をもついくつかのセグメソトに割り当て られる。このセグメント分割された共通ブロックを使 用することによって,最大4M(メガ)バイトまで の大きな配列が使用可能になる。これによって,文字 データの呼び出し,格納処理が簡単に行える。

(3)

6.文字列データの作成  文字列データの入力方法として,ここでは会話的に グラフィック・ディスプレイとキーボードを使って, 必要なデータを紙テープに出力させたものを使う。グ ラフィック・ディスプレイのメッセージに従って説明 する(以下入力はキーボードにより▼ ▼間の文字を 入力する)。  〔1〕 登録文字出力ルーチン

  //INPUT ROMAJI OR (RETURN)?

   1.呼び出し文字をローマ字で入力する。登録      されている該当文字すべてが番号と共に表      示される。入力様式は以下のようにする。     a)漢字は音読みでそのまま入力(入力文字       数は5文字以内)     b)ひらがな,カタカナは先頭に▼J・▼を       付ける。 c) d) e) f) 英字は先頭に▼E・▼を付ける。 記号は和文記号は▼JCODE▼,英文記 号は▼ECODE▼に分けてある。 数字は出したい数字を入力。 スペース記号は▼B▼を入力。    〔例〕     〔町〕 を呼び出す場合▼CHOO▼と入        力する。     〔ま〕を呼び出す場合▼J・MA▼と入力        する。     〔M〕を呼び出す場合▼E−M▼と入力        する。     〔,〕 を呼び出す場合▼ECODE▼と入        力する。     〔8〕 を呼び出す場合▼8▼と入力す        る。     〔スペース〕は▼B▼と入力する。

2・(RETURN)はRETURN KEYを押す。

   今まで入力されていた文字列が管面に表示    される。

//AGAIN INPUT ROMAJI?

   該当する文字がないので再度入力する。

//INPUT NUMBER OR CANRJ?

1. 出力したい文字番号を2桁で入力する。入    力した文字番号に相当する文字が管面に表    示される。

2.▼CANRJ▼の入力

   ローマ字入力した文字が不要の場合のコマ    ンド。 (RETURN), CANNB, NEWKJ, DELKJ?

 1・(RETURN)はRETURN KEYを押す

   ことを示し,管面に表示されている文字が    記憶される。  2・▼CANNB▼は,入力した文字番号をキャ    ソセルする。この場合は再度文字番号入力    のメッセージが出る。

3.▼NEWKJ▼は漢字を新規に作成する場

   合のコマンドである。  4.▼DFLKJ▼は管面に表示されている文字    を配列から削除するコマンドである(フリ    ガナと座標番地が消去される)。

//INPUT ROMAJI OR(REYURN)?

 のメッセージが出たときRETURN KEYを

 押すと,今まで入力されていた文字が管面に表  示されるが,続いて下記のメッセージが表示さ  れる。 //PT OUTPUT ?(Y OR N)  紙テープ出力の有無を入力する。▼Y▼を入力  すると管面に表示されている文字列がA5のフ  ォーマットで紙テープに出力され保存できる。  ▼N▼は紙テープへの出力はしない。 //(RETURN), END OR MTWRT?  文字列の出力のあと,さらに続行するかどうか  の問合わせである。 1. 2. 3.

(RETURN)はRETURAN KEYを押

すことを意味し,〔1〕の登録文字出力ル ーチンへ戻る。 ▼END▼はシステムの終了を意味する。

▼MTWRT▼は新規文字を作成したり,

文字の削除をした場合,磁気テープの更新 をするコマンドである。このコマンドを入 力すると下記のようなメッセージが表示さ れる。  **MT WRITE?(Y OR N) 磁気テープ更新の場合▼Y▼を入力する。 磁気テープ更新後システム終了となる。 ▼N▼を入力すると  //(RETURN), END OR MTWRT?     のメヅセージが出力されてコマンドの入力     待ちとなる。 〔皿〕 新規文字作成ルーチン  既に登録されている文字の一部を拡大または縮小 し,それを組み合わせて新しい文字を作り出す。 図一3には「魚」と「里」を組み合わせて「鯉」を

(4)

里 し工NE−−S〈STORε〉,912E,(RεTURN<SKIP>),門」εNO<阿OJ1 εND> /ノPLEASE :NPU〔 S工ZE×  ?  9.5 //PLEASE INPUT S12E∨  ?  1.0 !!PLEASE INPUT ×一門o)(13プ?915 //PLEASE INPU〔 ∨一河OU(工3)?O //工F LAST :NPUT ROMAJΣ OR NEXT. 工F CANCEL CANST ? Rl 31 15 0        45   NEU   lくANJ: 31

図一3新しい文字

 の作成例 作成する例を示す。

 LINE・・S<STORE>, SIZE,(RETURN

     <SKIP>), MJEND(MOJI END)   表示されている線の処置をコマンドで入力す   る。

  1.▼S▼はSTOREの省略で,文字の大き

    さ位置移動パラメータを標準処理のまま新     規文字に使用する。    ・   2.▼SIZE▼は線の長さ,位置を移動したい     場合のコマンドである。このコマンドを入     力すると下記のようなメッセージが表示さ     れる。     //PLEASE INPUT SIZEX?     //PLEASE INPUT SIZEY?      X,Y方向の拡大,縮小指定。左下を原      点として拡大,縮小される(実数データ)。     //PLEASE INPUT X・MOV(13)?      X方向の移動指定で整数3桁で入力する       (右移動+,左移動一)。     //PLEASE INPUT Y−MOV(13)?      Y方向の移動指定で整数3桁で入力する       (上移動+,下移動一)。    なお,▼SIZE▼を指定しないときはSIZEX    == 1.0,SIZEY=1.O, X・MOV=0, Y・MOV    ==Oカミとられる。   3.(RETURN)はスキップを意味し,次の文     字の呼び出し,または,新規作成した文字     の登録ステップに移る。  //IF LAST INPUT ROMAJI OR NEXT,        IF CANCEL CANST? 1. 2. 3. 新規作成文字を登録する場合は,音読みの ローマ字(5文字以内)で入力する。既存 のデータとマージされ,〔1〕登録文字出 力ルーチンに戻る。 ▽NEXT▼は継続して文字を作成する。 ▼CANST▼は新規作成中の文字をキャン セルして再度作成する。 7・文字列データの表示  文字列デー一タ作成ルーチンで紙テープに出力した文 字列を,グラフィック・ディスプレイを通してハード コピーに出力させるために,文字列データ表示ルーチ ンがある。これは必要なパラメータを与えることによ り任意の形に表示でき,ラインプリンタへの出力も同 時に行うことができる。  文字をグラフィック・ディスプレイの管面に表示す るルーチンとして二種類ある。1つは横型の表示で,

可視ポイントがX軸1024,Y軸780の大きさとな

る。他方は,縦型の表示で可視ポイントX軸780, Y軸1024の大きさとなる。  使用する方法として次のルーチンを呼び出す。    CALL TALKA(TYPE, SIZE, HIGHT,        HORIZ, N, DATAX)  ここで,

   TYPEは整数型で入力データの型に2種類あ

   り,      TYPE ・1とすると番地指定*デi・・一・タで数

     字5桁が1文字を表す。TYPE=2とす

     ると英数字, カナ文字記号のEBCDEC

     CODEデータとなり,1バイトが1文字

(5)

を表す。 TYPE=・1 780 1↑ 横型

0 _

    ’HORIZ ・.・自8・.1“・   8 ロ   コ ロ    nle−ロs ロロロロロロ  ,ロnlenee  ロ         コ l ll 『 .・.・・“…  ロコロロロロコぼ         , 』..・・1.・・・   …. ・1:lll:・’’’’’” 堰f’”“  ●■     ●■     ●■●  コ・“・・1■…  l  eeeeココ ・■・ P・… . コ   コロ   コ ・・…l l  I・・   … 1024   縦型 780

1↑↑↑’・一一…

0  −

    HORIZ

●  ●●      ロtコltetet ’      ロ ゜.  .°   1   ・・      “.・   ●        ■   ●●  “        ■●     ●  ●●        ● ●●  ■開   “●‘   のロ .‘朋@鴨

  1

  .1  … ■ ●●●●●●●■●■  コココロココココロ ロロロ    ■    … ■     ●●   ●  ”・・  i, ・・… Fe …i”‥・

!▲ぱ:::1:

      ● lo24 図一4表示の種類  1: .L:iI ■■●     ●

峯㌶享蓼竃璽湊欝ξ:謙蔓暑a綴禦場篇

DATAx l

図一5 ラインプリン  タおよびハードコ  ピー出力例

TYPE=2

数字5桁=1文字

式制御の方式により,FORTRANとCOBOLでは

異なる)で磁気ディスクに登録する。その内容は任意 にオンラインロードモジュールを呼び出すことによ り,ターミナル・プリンタへ出力させることができ る。

DATAX 1川川1川1川

       1パイト=1文字  SIZEは実数型で文字の大きさを指定する     (可視ポイント32×32が1.0に相当)。  HIGHTは整数型で文字の書き始めの位置     (高さ)指定  HORIZは整数型で文字の書き始めの位置     (横)指定

 Nは整数型で1回の呼び出しで出力する

   文字数(1∼255)

 DATAXは文字型で1回の呼び出しで出

   力する文字データ(1∼255) 注意 出力位置が右端に達すると自動改行が    行われ,出力の余白がなくなると自動    的にハードコピーが行われ,横型では    (0,780),縦型では(0,0)より続    行される。 * 別記データ作成システムを参照 8.夕一ミナル・プリンタへの出力  カナ文字専用に出力させる場合には,出力させたい データを順編成可変長アンブロックレコード形式(書

9.おわりに

 専用機器を使わないで研究用として通常使用されて いる汎用機器で運用することを目的として,漢字・ひ らがな・カタカナなどの日本語入出力システムを開発 した。文字の入力手法の一方法として,ここでは会話 的使用を行うことによって入力誤りなどを減らすこと ができ,また文字の選択,訂正や新字種の導入などに 対しても,このようにソフトウェアを強化することに よって解決される。これらのシステムはライブラリー プログラムとして登録しておくことにより,COBOL,

FORTRANを用いて記述できるので一般的使用も可

能である4)。また,端末として他のシステムとの結合 を考慮することにより,オフライン,オンラインの両 形式を用いて,さらに大きなシステムに拡張すること もできると考えられる。  今後,字種や字体は規格化され5),漢字プリンタな どの専用機器が普及していくと思われるが,同時にこ のようなソフトウェアとしての日本語処理の重要性が 高まっていくであろう。本報告も1つの方向を示して いる。

(6)

謝辞  日本語入出力システムの開発にあたり,文字データ の基礎資料を提供して頂いた,本学伊藤誠助教授,ま た,熱心な助言とご指導を頂いた本学高橋健計算機室 長および吉澤正教授に謝意を表します。 文 献 1) 高橋延匡:日本語情報処理への期待,情報処   理,Vo1・20, No.1(1979.1) 2) 石田,丹下,長谷部,石川,小野:汎用機器で   構成した漢字入出力システム,センターニュ   ース,Vo1.11, No.3(1979.3) 3) 日本電気:ACOS 4 FORTRAN言語説明書,   (昭和51年11月) 4) 和文入出力システム手引書(1979.8) 5) 目本工業技術センター:漢字情報処理システ   ム資料集,(1979.1)

参照

関連したドキュメント

Matsui 2006, Text D)が Ch/U 7214

奥付の記載が西暦の場合にも、一貫性を考えて、 []付きで元号を付した。また、奥付等の数

奥付の記載が西暦の場合にも、一貫性を考えて、 []付きで元号を付した。また、奥付等の数

備考 1.「処方」欄には、薬名、分量、用法及び用量を記載すること。

パキロビッドパックを処方入力の上、 F8特殊指示 →「(治)」 の列に 「1:する」 を入力して F9更新 を押下してください。.. 備考欄に「治」と登録されます。

口文字」は患者さんと介護者以外に道具など不要。家で も外 出先でもどんなときでも会話をするようにコミュニケー ションを

Dual I/O リードコマンドは、SI/SIO0、SO/SIO1 のピン機能が入出力に切り替わり、アドレス入力 とデータ出力の両方を x2

 貿易統計は、我が国の輸出入貨物に関する貿易取引を正確に表すデータとして、品目別・地域(国)別に数量・金額等を集計して作成しています。こ