• 検索結果がありません。

手書き文字読取り実験装置 利用統計を見る

N/A
N/A
Protected

Academic year: 2021

シェア "手書き文字読取り実験装置 利用統計を見る"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

手書き文字読取りの実験装置

森 英 雄

(昭和42年9月13日受理)

The Experimental Machine for the Study of

Handwritten Character Reading

HideoMORI

Sy皿opsis  This machine, which has been producted for the study of pattern recognition, reads astroke of handwritten character and punches out the tangent vector of the stroke by the rotating disk on which two silicon solar cells are located in line.  It has the advantages of offline system−working without computcr control− and information compression about 10 sampling poillts enough to express a character. 1. ま え が き  電子計算機の大形化高速化が進んできた結果,デー タの入出力手段の貧弱さが目立ってきた。その一つに 計算機の処理速度にキーパンチャがデータをパンチす る速度が追いつかないという現象がある。その解決策 の一つとして手で書いた文字を直接読取る光学的文字 読取装置(OCR)の研究がここ数年盛んになってき た。わが国においては,少々目的を異にするが,一, 二年前から郵便の宛先を数字コード化してそれを自動 的に仕分けする装置がメーカで開発されつつある。O CRの中では最も早く実用化されるのではないかと思 う。一方,米国においてはタイプライタの普及からか 印刷文字を読取るOCRが五,六年前から実用化され ているが,最近の話題はIBM360の周辺機器として 発表された手書きの数字および若干の文字を読取るO CRである。大形の計算機に結合しなければならない こと,高価なこと等の難点があり,今のところは特殊 な用途にとどまるのではないかと思われる。  また,文字読取りの研究は音声識別の研究と並んで, パターン認識の格好なテーマになっている。文字は音 声に比べて時間に追いかけられないこと(音声は発生 したそばから識別しなければならないが文字は行為の 痕跡を識別すれば良い),たとえば数字のように1字 1字独立したパター一ンを扱うことによってsegmenta一 tionの難問を回避できること等の理由で取りつきや すい。しかしそれも程度の問題で,人間と同等な読取 能力を持つ装置の実現は,パターン認識が解決されな いかぎり難かしい。パターン認識は電子計算機が発明 された頃はすぐにも実現できると考えられていたが, 電子計算機が飛躍的発展をとげ,使用経験が深まった 今日では,むしろ悲観的な見解が支配的である。  筆者は文字読取りの研究は長期にわたる理論と,実 験の輪転であると考えたので,まず,文字読取装置の 試作から始めることにした。 2. 原 理  近年神経生理学の進展は目覚ましく生物の視覚情報 処理系のしくみが大分解明されてきた。それによると 網膜とそれにつづく視神経の段階で図形の局所的特徴 すなわち,edgeやcornerや端点等を検出している という。おそらく大脳で図形の大局的構造を決定し, 言語情報等を利用して識別しているのであろうが,筆 者は大脳の仕事を電子計算機で代行させ,視神経の機 能は文字読取装置に持たせられないかと考えた。視細 胞のモデルとして図一1(a)のような回路を考える。Dは 論理回路でストロークの方向と分岐数をパルスの時系 列で出力する。このようなユニットを平面にびっしり 並べれば,視神経のモデルができ上がるわけだが,そ れでは素子の数が莫大になるので,ユニットを動かし

(2)

光 電 素 子 (a) ストn一ク P▲の走査範囲 (a)       (P。) 図一1

1

(b) 視細胞のモデル て図形を走査することにする。また周辺の光電素子が 6個に分割されていると,ストロークの方向によって 出力に相違が出てくるので,図一1(b)のように周辺の光 電素子は1個にしてそれを回転させ,その出力波形か らストロークの方向と数(分岐数)を検出するという アイデアを考えた。  図一2(a)に示す図形に対する光電素子P、の出力波形 は,図一2(b)のようになる。これを適当なスライスレベ ルで切って増幅し,図一2(C)のようなパルスを得る。中 心の光電素子Poがストローク上にあるならば,1周 期当りのパルスの数はストロー一クの分岐数を表わし, パルスの位相はその方向を示す。方向は360°を16等 分して量子化して表わす。ストロークが点Aを通るな らば,点Aの近傍では黒レベルが放射状に続いている はずである。そこで周辺の光電素子を細長くして半径 方向の積分をとり,出力の値が一定値以上のときスト ロークとする。こうすると隣接する点Aを通らないス トロークを間違って読むことがなくなる。  つぎに走査方式を示す。図一3の実線のように水平方 向に走査して,続いて破線のように走査する。読取装 置は中心の光電素子がストロークに突き当ったときい つでもデータを送信するわけではなくて,走査方向に P1 の 出 力 波 形 ろ ブ イ ス 後 の 波 形 時間 (b)

T →

・舟・ y ↑ 時間 (c) 図一2 光電素子P1の出力波形 「一一「 「■一「 「一一「 ∫一一一P 「一一 ‘   ‘ l   l 1   1 l   I ⑪    1 r    I 1   | l   l 1   ‘ 1    1 |   1 ’    ‘ l    I I    l 1 ‘    ‘ 1   , 1   1 I   l 1 ⑪   ‘ ’   1 l   t 1   ‘ |   1 I   l |   1 1   ‘ 、1’ x ▲ψI    I 人Ψ1   | ▲ 、1’ A Y ‘    1 I    l ‘    1 1 1    1 1    ‘ I   l 1   ‘ ‘   1 ‘    ‘ l    I |   ‘ 1 8   ‘ ‘   1 1   1 l   l 1 1   ‘ ‘   1 「   1 1    ‘ 1 l    I e   ‘ I   Il    ‘ l l 1   ‘ P   ‘ 1 ‘    ‘ l   l 1   ‘ 1 1   ‘ ‘   1 ,    1 ‘    ‘ 1 1   ‘ I   I 1   1 ‘   ‘ 1   ‘ |   1 ‘   ‘ ‘   ‘ __」 し__」 L__」 L_一」 L__」

→x

図一3 走 査 線 直角なストロークがあったときのみデータを送信す る。なぜならば走査方向とストロークの方向が一致す るときは,一度び中央の光素子がストロークにのると, データを無数に送信するだろうし,中心がはずれれば 全くデータを送信しないだろう。したがって走査方向 に平行なストロークのデータは不確かである。かくし て図形は垂直方向に延びるストロークと水平方向に延

(3)

走査線  ,4’      5 3 ¢” v、 ,2 1 、 \スト。_ク/ 竜 接接線ベクトル

)re・um!t

   12   3   4  5 図一4 接線ベクトルの重ね合わせ   y    −一一.x   ↑

①ステップモータ ⑤読取りヘッド

②ステップモータ ⑥同期信号板

③コンデンサモータ⑦ブラシ

④レンズ  

⑧AD変換器

図一5 文字読取装置のブロックダイヤグラム びるストロークの成分に分けられて,おのおののデー タが送信される。  さてこのようにして得られたデータは,ストローク 上の各点における接線ベクトルを表わしている。この 接線ベクトルの時系列は走査線が幾本かのストローク を横切るたびに得られたものである。そこでこの時系 列を編集し直して,おのおののストロークごとの系列 にしてやる必要がある。接線ベクトルはストロークの 端点でない限り,必らず対になっているから図一4のよ うに重ね合わせていけば良い。周辺の光電素子の走査 半径と走査線の間隔はほぼ等しくしておく。この編集 は電子計算機で行なう。

3・装置の製作

 文字読取実験装置のブロックダイアグラムを図一5に 示す。  操作盤のスタートキーを押すとパターンの走査が開

●880900008    ●●

      :一一一一一●8        ●●●______   register     position ●         LF..−.      シv  L−_ー_ー−−−−−v−−−

    d… lente「y scan。can end

L

        return   enter X scan    図一6 紙テープせん孔形式 始される。パターンは葉書大の白紙にサインペンまた はマジックペンで手書きしたものを用いる。  駆動制御部はパターン位置を示すXカウンタおよび Yカウンタと,走査線の間隔を決めるインタバルカウ ンタと,ステップモータ駆動のための一二相励磁カウ ンタおよびこれらのカウンタを制御するコントロール 回路よりなる。インタバルカウンタのオーバフロー条 件を変えることによって,走査間隔を自由に設定でき る。  ステープモータからパターン台への動力伝達には工 作が容易でかつ慣性モートメントが小さいことから糸 と滑車を使用した。

 レンズは焦点距離50mmF1・4のカメラ標準レン

ズを逆向きに取り付けて,2倍の実像が得られるよう にした。読取りヘッドには紙テー一・一一プ読取素子用に開発 された4.5mm×22mmのシリコン太陽電池を張り付 けた。この太陽電池は長さ方向に10分割されて,おの おのからリード線が出ている。これにスリットをつけ て使う。読取りヘッドと同期信号板は同一シャフトに 取り付けられている。  同期信号板には16個の穴があいており,この穴を光 電素子で数えることによってP、の出力波形の位相角 すなわち接線ベクトルの方向がわかる。読取りヘッド は約2000rpmで回転する。  読取りヘッドからの出力はブラシによって取り出さ れAD変換器でデジタル信号に変換されてからレジス タおよび判定回路に送られる。

 レジスタは16bitで各bitは量子化された角度に

対応している。  判定回路は中央の光電素子が黒レベルを検出したと きレジスタを調べて走査方向と直交する接線ベクトル があったときパンチ指令を出す。  紙テ’一プのせん孔形式を図一6に示す。1本1本の走

査線が折返すたびごとに2桁のreturn key(4と

SPACE codeと決めてある)をせん孔する。ただし

X方向走査の最初とY方向走査の最初およびY方向

走査の最後にはreturn keyが省略されてそのかわ り2桁の情報enter X scan(1 SPACE), enter y

(4)

scan(2 SPACE), scan end(8 SPACE)がせん孔 される。走査線がストロークにつき当ったとき走査方 向と直交する接線ベクトル*があるならば,1桁の

data key(3)とレジスタの16bitのON OFFを

4桁にわけてせん孔する**。つぎに2桁の位置を示す 情報(XカウンタまたはYカウンタの内容)をせん孔 する。最後にはSPACE codeをせん孔する。 4. む  す  び  昭和41年度に文字読取り実験装置1号機を製作した。 論理回路部は大体設計通りに動作したが,パターンの 駆動部は動力源にサーボモータを使ったのが原因で不 安定であった。昭和42年度はステップモータを用いて 駆動部の安定化をはかる予定である。  写真は41年度製作1号機をうつしたものである。論 理回路部はダイオード1300本,トランジスタ900個, 抵抗2400個,コンデンサ750個ほどで作られている。  この読取方式の利点は 1. 文字の本質的な特徴を抽出しているので,出力情  報が非常に圧縮されていること。たとえば数字では  1字当り10∼20個所の点で接線ベクトルをサンプリ  ングすれば十分である。 2. オフラインでも手書き文字のデータがとれる。従  来のフライングスポットスキャナを用いて文字を追 * 走査線と90°±45°の範囲内または180°±45°の   範囲内で交わるストロークがあれば良い。 ** 各bitに対応する方向に黒レベルがあるかどう   かをせん孔する。このデータから電子計算機で接   線ベクトルを算出する。  跡する方法では,オンラインで電子計算機が装置を  制御しなければならないが,この方式ではオフライ  ンでデータがとれる。  この方式の欠点は 1.小さな字が読めないこと 2.読取速度が遅いこと  等である。 5. 謝 辞  装置製作にあたって多大な御指導と激励をたまわっ た工学部富塚剛教授に心から御礼申し上げます。また 実際に設計製作を担当して下さった工学部助手志村栄 一氏と工学部技官二木弘氏ならびに昭和41年度卒研学 生有賀毅君,遠藤高義君,鈴木英幸君,竹内徹君,富 岡稔雄君,岩本尭君,大庭雅敦君,梅原五郎君に衷心 から感謝致します。

参 考 文献

1) 信学誌,46,11,オートマトン特集号 (Nov.   1963) 2)J.Y. Lettvin, H. R. Maturana, W. S. Mccu.   lloch, W. H. Pitts:What the Frog,s Eye   Tells the Frog’s Brain, Proc IRE,47,11,   p.1940−1951(Nov.1959) 3)M.H. Butterfield, J, Dowsing:circular   Scans Read Handwritting, Control. Eng.,   9,8(Aug.1962) 4) 森英雄,二木弘,志村栄一,富塚剛1回転光電素   子群により線書き図形の局所的特長抽出を行いベ   クトル系列を得る方式

(5)

帥 ∋

9

肝 丁 圃( ㌣ 佃‖ : ぐ 心 CT’ 佃K

(6)

.灘嚢難灘蕪懇灘 .   1 藻  ’崇ろ、 z   鱗   灘   V     箋

懸繊・

叢 ’難 L   〕 写真一4 同期信号板 写真一5 ブ ラ シ 写真一6パターン駆動機構

参照

関連したドキュメント

1  ミャンマー(ビルマ)  570  2  スリランカ  233  3  トルコ(クルド)  94  4  パキスタン  91 . 5 

工場設備の計測装置(燃料ガス発熱量計)と表示装置(新たに設置した燃料ガス 発熱量計)における燃料ガス発熱量を比較した結果を図 4-2-1-5 に示す。図

1号機 2号機 3号機 4号機 5号機

口文字」は患者さんと介護者以外に道具など不要。家で も外 出先でもどんなときでも会話をするようにコミュニケー ションを

4/6~12 4/13~19 4/20~26 4/27~5/3 5/4~10 5/11~17 5/18~24 5/25~31 平日 昼 平日 夜. 土日 昼

12月 1月 2月 3月 4月 5月 6月 2Q 3Q 4Q 1Q 2Q 3Q 4Q 新設ピッ.

線量計計測範囲:1×10 -1 〜1×10 4 Gy/h

目印3 目印4 目印5 目印6 目印7. 先端の重り12