• 検索結果がありません。

198 199 199

N/A
N/A
Protected

Academic year: 2021

シェア "198 199 199"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

198

Ⅱ 論 考 編

199

変体仮名の認識

199

I I   ‑ 2   研 究 成 果 の 活 用 と 関 連 研 究

I I   ‑ 2   ‑ 1  変 体 仮 名 の 認 識

Hung Tuan Nguyen,  Nam Tuan Ly,  Kha Cong Nguyen,  Cuong Tuan Nguyen,  中 川 正 樹

1、はじめに

木 簡 の 文 字 の 認 識 と 並 行 し て 、 変 体 仮 名 の 認 識 に 取 り 組 ん だ。す な わ ち 、 電 子 情 報 通 信 学 会 パ タ ー ン 認 識 ・ メ デ ィ ア 理 解 研 究 会 (PRMU) が 主 催 し た 「 第21回 ア ル ゴ リ ズ ム コ ン テスト」 (I)に お い て 、 変 体 仮 名 を 認 識 す る 課 題 に 取 り 組 み 、 難 易 度 の 高 い レ ベ ル2と レ ベ ル3"'で 優 秀 な 認 識 性 能 を 示 し 、 コ ンテス トに応 募 さ れ た ア ル ゴ リ ズムの う ち、 最 も優秀 と 判 定 さ れ たアル ゴ リ ズム を 考 案 し た 者 1件 に 贈 呈 さ れ る 「PRMUアルゴリ ズム コ ンテス ト 最 優 秀賞」 を 受 貨 し た (2017年 12月16日 ) 。 ま た 、 情 報 処 理 学 会 人 文 科 学 と コ ン ピ ュ ー 夕 研 究 会 か ら 、 CH賞 を 受 賞 し た (2018年 1月27日 ) こ れ に 先 立 ち 、 11月 に 開 催 さ れ た4th International Workshop on H.istorical  Document Imaging and Processing  (HIP  2 0 1 7)での発表(3)に 対 し て も 、 最 優 秀 論 文 賞 を 受 賞 し た。

(1)ア ル ゴ リ ズ ム コ ン テ ス ト の 概 要 : パ タ ーン認 識 ・ メ デ ィ ア 理 解 分 野 の 若 手 研 究 者 ・ 学 生 の 育 成 お よ び 研 究 会 活 動 の 活 性 化 を 目 的 と し て 、 毎 年 開 催 さ れ て い ま す。提示される課題には、代表的・

基 礎 的 な 研 究 課 題 が 取 り 上 げ ら れ 、 応 募 さ れ た ア ル ゴ リ ズ ム は 、 そ の 性 能 ・ 独 創 性 ・ 処 理 時 間 の 観 点で評価されます。(詳細: https://sites.google. com/view/alcon 2 0 17 prmu) 

(2)21回 ア ル ゴ リ ズ ム コ ン テ ス ト の 課 題 と レ ベ ル : 図40 42の よ う に 、 古 典 籍 画 像 の 指 定 領 域 に 含まれる<ずし字を認識して、コードを出力します。

l

. 課 題 の 難 易 度 ・ 

外 接 す る 長 方 形 に 含 ま れ る 文 字 数 に 応 じ て 課 題 の 難 易 度 を 設 定 し て い ま す。レベル 1は1文字、

レベル2は縦方向の 3文字、レベル3は縦横方向の 3文字以上の文字を含んでいます。 2. 認識対象の文字

認識対象の文字は変体かな50種程度です。漢字は含みません。

(3) Hung Tuan Nguyen, Nam Tuan Ly, Cong Kha Nguyen, Cuong Tuan Nguyen, Masaki Nakagawa: 

Attempts to  recognize anomalously deformed Kana in Japanese historical documents,  Proc.  of the 20 

1  7 

Workshop on Historical Document and Processing,  pp. 31‑36,  Kyoto,  Japan  (11. 2017). 

(2)

200

Ⅱ 論 考 編

200

図40課題の3レベル.レベル1は1 文字,レベル2は縦方向の3文字,

レベル3は縦横方向の3文字以上

か [ K a ] う [ u ]

異なる字種にも関わらず似た字形

図41人文学オープンデータ共同利用センターが 公開している日本古典籍字形データセット

に [ n i ]

同一文字の異なる字形 囮42人間でも読みにくい文字の組

2、 方 式

レ ベ ル2の た め に は 、 こ れ ま で に 提 案 さ れ て い る い く つ か のニ ュ ー ラ ル ネ ッ ト ワ ー ク を 検討し、 Convolutional Neural  Network  (CNN: 畳込みニューラルネットワーク)、 Bidirectional Long Short‑term Neural Network (BLSTM:双 方 向 長 ・ 短 期 記 憶 ニ ュ ー ラ ル ネッ トワーク)、そし て、 ConnectionistTemporal Classification  (CTC:コネクシ ョ ニ ス ト 時 系 列 識 別 法)を3層 に 組 み 合 わせ、 DeepConvolutional Recurrent Network  (DCRN:深 層 畳 込み 再 帰 ネ ッ トワーク)を構成する

(図43)。第一層 で は 、 事 前 に 学 習 さ せ た CNNに よ っ て 縦 書 き の く ず し 字 か ら 特 徴 の 列 を 抽 出 し 、 第二番 目 の 再 帰 層 で は BLSTMに よ っ て 候 補 文 字 と 確 率 の 組 の 列 に 変 換 し 、 3番

目 の 層 の CTCで 文 字 列 に 変 換 す る 。

レ ベ ル 3では、 X‑Yカ ッ ト 法 と ボ ロ ノ イ ダ イ ア グ ラ ム を 使 っ.て 文 字 行 を 切 り 出 し 、 行 を

(3)

200

Ⅱ 論 考 編

201

変体仮名の認識

201

た し

ナ '

織別層

'  

図43'

一 列 に つ な い で か ら

Ill

DCRNの構成

横 方 向 へ の 射 影 に よ っ て 空 白 を 見 つ け て 切 り 、 次に、

1

再 帰 (BLSTM) 

特徴列

レベル

2

の方式を適用する。

X‑Y

カット法は、縦方向、 あるいは、

他 の 方 向 へ の 射 影 に お い て 空 白 を 見

つけて切るという作業を、

切 れ な く な る ま で 繰 り 返 す 手 法 で あ る

ボ ロ ノ イ ダ イ ア グ ラ ム は 、 複 数 の 黒 画 領 域 に 等 距 離 の 白 画 素 内 の 点 を つ な い で で き る 分 割 図 で あ る

。斜 め や 複 雑

に 空 間 が あ る 場 合 で も 切 り 出 せ る と い

うメ

リットがあり、

X‑Y

カ ッ ト 法 で 分 離 で き な い も

のに、

ボ ロ ノ イ ダ イ ア グ ラ ム を 利 用 す る

3

、 各 レ ベ ル に お け る 結 果

・レベル

2

ー認識率:

87.6% (23チーム中 1位)

ー認識時間:

1

文字あたり

2.16

(23チーム中10位)

(I) Kha Cong Nguyen, Cuong Tuan Nguyen and Masaki Nakagawa: A segmentation Method of Single‑ and Multiple‑Touching Characters in Offline Handwritten Japanese Text Recognition, IEICE Trans. on  Inf. & Syst., Vol. ElOO‑D, No. 12, pp.2962‑2972, Dec 2017. 

(4)

202

Ⅱ 論 考 編

202

・レベル 3

ー認識率 :39.1% (23チーム中2位)

ー認識時間: 1文字あたり 0.43秒 (23チ ー ム 中 5位)

4、 審 査 員 の 講 評

1点から 5点 の 採 点 で、3人 の 評価者 か ら 平 均 し て 、 新 規 性 4点 、 信 頼 性 5点、 明瞭さ 4. 33点 を 得 ま し た。明 確 な 文 字 の 切 出 し を 必 要 と し な い こ と 、 種 々 の 構 成 を 検 討 し て い る

こ と 、 レ ベ ル 3の た め の 複 数 行 の 検 出 と 統 合 、 総 合 的 な 構 成 が 評 価 さ れ て い ま す 。

5、 今 後 の 展 開

古 典 を 電 子 的 に 保 存 ・公 開 し 、 手 軽 に 分析で き る よ う に す る こ と は、歴史研究 に は 不 可 欠 で あ り 、 古 典 籍 で 使 用 さ れ る < ず し 字 を 正 確 に 認 識 す る 技 術 開 発 を 進 め る こ と で 、 歴 史 研 究 の 発 展 に 寄 与 で き る と 考 え ら れ る 。

今回、 レ ベ ル 3の 認 識 率 が 低 かったのは、 1文 字 で も 誤 認 識 す る と 、 全 体 と し て 誤 認 識 に な る た め で あ る。文字 列 の な か に 混 同 し や す い 文 字 が あ る と 、 こ う し た 結 果 に な る。こ れ を 改 善 す る た め に は 、 当 時 の 言 語 統 計 か ら 文 字 と 文 字 のつ な が り や す さ (文脈)を利用 す る 方 法 が 効 果 的 で あ り 、 そ れ に よ って レ ベ ル 3の 認 識 率 は レ ベ ル2に 近 く な る こ と が 予 想される。 ・デ ー タ を さ ら に 大 量 に 蓄 積 す る こ と で 、 漢 字 を 含 め て 、 認 識 率 は さ ら に 高 ま る

こ と が 期 待 さ れ る。

参照

関連したドキュメント

To determine the clinical characteristics of low androgen status in adult males with diabetes, we retrospectively analyzed the medical records of patients with type 2

4章では、気体透過メカニズムを明らかにするため金属溶液の濃度を変化させ、得られた透過膜

[r]

[r]

実際に、病床数別に病院数を計算すると、195 床から 199 床の病床を有する病院が多く、診療報酬上の

[r]

平成25年度税制改正に関する提言 待ったなしの改革で日本の元気回復を

令和2年度造血幹細胞移植拠点病院研修会 第1回 造血幹細胞移植Webセミナー 令和2年度 第9回