• 検索結果がありません。

帳票認識サービスによる業務効率化

N/A
N/A
Protected

Academic year: 2022

シェア "帳票認識サービスによる業務効率化"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

価値創出を加速するデジタルソリューション

F E A T U R E D A R T I C L E S

AI-OCRを活用した

帳票認識サービスによる業務効率化

山崎 敦央|

Yamazaki Atsuo

稲田 学|

Inada Manabu

鈴木 尚宏|

Suzuki Naohiro

井本 直樹|

Imoto Naoki

ITの発展に伴い,多くの産業分野ではデジタルソリューションによる業務効率化が推進されてい る。紙の取り扱い業務も同様であり,これまでは紙の帳票のシステム入力・確認に多くの労力を 費やしてきた。日立の帳票認識サービスは,AIにより,多様な定型・非定型帳票の読み取りおよ び読み取り結果の正しさの評価を実現するため,高精度の文字認識を行うAI-OCRエンジンを 搭載可能なサービスプラットフォームであり,業務効率の向上を実現する。

本稿では,金融機関の為替業務を代行する為替データ入力作業の省力化と,今後の取り組み として,ビジネス文書から潜在的な価値を抽出するダークデータ分析について述べる。

1. はじめに

AI(Artifi cial Intelligence)やIoT(Internet of Things)

などのデジタル技術の革新は,社会に大きな変革をもた らしている。日本のIT新戦略は,社会全体のデジタル化 に向けた各種取り組みを加速させることで,国民の利便 性向上と行政・民間業務の効率化につなげることをめざ している1)

一方,行政機関や民間企業などの事務処理を行う多く の現場では,情報の記録・伝達に請求書などの帳票を用 いている。これらの情報は,システム上で管理するため にデータ入力されるが,入力作業に人手を要している場 合,AI-OCR(AI-Optical Character Recognition)によ り業務を効率化することができる。

本稿では,従来のOCRとAIを適用したAI-OCRの概要

と,AI-OCRを活用した日立の帳票認識サービスの適用 により業務効率を向上した事例を紹介する。また,今後 の取り組みとして,一般のビジネス文書から潜在的な価 値を発掘するダークデータ(Dark Data)分析について 述べる。

2. OCRからAI-OCRへの発展

2.1

OCRとAI-OCRの概要

OCRは,画像データから文字(漢字,数字など)を認 識する技術である。一方でAI-OCRは,OCRにAIを適用 した技術であり,画像データの文字認識結果を出力する 点はOCRと同じであるが,処理方法にAIを適用したこと でOCRの課題を解決している。

具体的には,複雑な手書き文字[乱筆文字,区切り線

(2)

のないフリーフォーマットの手書き文字,罫(けい)線 被り文字など],請求書などの企業ごとに様式が異なる非 定型帳票,契約書などの任意様式の文書の文字認識が可 能である。また,AIに学習させることで継続的に認識精 度を高めることができる。さらに,RPA(Robotic Process  Automation)との親和性が高く,RPAと併せることで,

業務の自動化範囲を拡張したいというニーズへ対応で きる。

2.2

社会全体のデジタル化に伴うAI-OCRの位置づけ

AI-OCRの市場は徐々に拡大しているが,社会全体の デジタル化に伴いペーパーレス化が推進される中で,発 展の余地と今後の位置づけについて考察する。

AI-OCRの市場規模は7億円(2018年度見込値)から 32億円(2030年度予測値)への成長が予測されている2)。 その主な理由は以下の二つであると考えられる。

(1)既存業務の紙帳票は活用しつつ,紙帳票のデータ入 力作業のデジタル化により業務効率の向上を可能とする AI-OCRへの期待が高まっているため

この背景には,既存業務をデジタル化(ペーパーレス 化)する際の障壁として,ワークフロー全体や関連する 基幹システムなどの根本的な見直しが必要であること,

入力・保存情報の記録の真実性および可視性などの要件 を紙帳票と同等に満たす必要があることなどがあると考 える。

(2)紙で蓄積した過去の文書のデジタル化が進み,デー タの利活用や分析のニーズが高まっているため

これらの理由から,AI-OCRは将来にわたり,デジタ ル化の役割の一端を担っていくと考えられる。

2.3

OCRからAI-OCRへの発展に伴う適用可能な領域の拡張

OCRからAI-OCRへの発展に伴い,帳票の取り扱い業 務への適用可能な領域が拡張した。その概念を図1に示 す。AI-OCRは,ITの発展とも相まって技術面に加えて サービス面も向上した。繁忙期などの特定期間の業務や,

取り扱い量が少量であり,かつ多様式な帳票を扱う業務 にも,従来のOCRのように読み取り専用スキャナを準備 することなく, AI-OCRは一つの提供形態で,クラウド

OCR

OCR

帳票 の 取扱業務

■技術的に解決

定型帳票

活字

手書き文字

(文字間接触なし

時代の流れ

(OCR

から

AI-OCR

への発展)

旧 新

2

AI-OCR

の時代

OCR

の時代

3

4

章 本稿との 主な対応 少

適用可能な領域

■技術的に適用困難

複雑な手書き文字

非定型帳票

非構造データ

■費用対効果で導入見送り

少量多様式の帳票

特定期間の集中業務

適用困難な領域

OCR AI-OCR

OCR AI-OCR

■技術的に解決

定型帳票

活字

手書き文字

(文字間接触なし)

適用可能な領域

帳票削減

業務のデジタル化

ペーパーレス化

■技術的に解決

複雑な手書き文字

非定型帳票

■サービス的に解決

少量多様式の帳票

特定期間の集中業務

適用可能な領域

OCRAI-OCR

■技術的に適用困難

非構造データ

適用困難な領域

図1|OCRからAI-OCRへの発展に伴う,帳票の取り扱い業務への適用可能領域の拡張(概念図)

OCRからAI-OCRとなり,技術面・サービス面ともに向上したため,さまざまな業務の特性に対応できるようになった。なお,AI-OCRの時代にも,既存業務の制約な どからOCRによる定型帳票の読み取りに特化したニーズは引き続き存在すると考えられる。

注:略語説明

OCR(Optical Character Recognition),AI-OCR(Artifi cial Intelligence-OCR)

(3)

上のサービスとして提供できる。現状ではAI-OCRの適 用が困難な非構造データについては,4章で述べる。

3.  AI-OCRを活用した

帳票認識サービスによる業務効率化

3.1

日立のこれまでの取り組みと帳票認識サービスの概要

日立は,OCRの業務適用の創成期から現在のAI-OCR,

そして将来を念頭に置いて技術開発に取り組んでいる。

1968年,国産初の汎用OCRである日立製H-8252形 光学 文字読取機の発売3),4)から始まり,現在では深層学習

(ディープラーニング)などを活用した多様なビジネス帳 票をデータ化するクラウド型AI-OCRサービスを提供 し,継続的に技術開発に取り組んでいる。長年蓄積した ビジネス・技術ノウハウを活用することで,次の時代に 向けて新しいサービスを創出し,顧客の業務上の課題解 決をめざしている。

現在,日立は金融機関を中心としたペーパーレス化の 取り組みとして,帳票認識サービスを提供している。帳 票認識サービスは,AIを用いて高精度に文字認識を行う

AI-OCRエンジンを複数搭載するサービスプラット フォームを構成し,定型帳票や非定型帳票,また活字や 手書き文字,二次元コードなどに対応しており,幅広い 業種のデータ入力業務に適用できる。また,日立独自の アルゴリズムにより認識の確からしさを「確信度」とい うスコアとして算出することで,誤認識の可能性がある データを容易に仕分けることも可能である。これらの技 術を活用して,業務アプリケーションとのスムーズな連 携を可能にし,さまざまな帳票取り扱い業務の自動化を 実現する。帳票認識サービスの概要を図2に示す。

3.2

業務効率化に向けた技術的・サービス的アプローチ

帳票認識サービスによる業務効率化に向けたアプロー チは,二つの観点に大別できる。

(1)技術的アプローチ

帳票認識サービスは,OCRの適用が技術的に困難な領 域の課題を解決する。概要を図3に示す。

(a)さまざまな帳票の取り扱い業務への適用による業 務負荷の低減

データ入力作業者の負荷低減を実現するために,AI-

エンドユーザー

モバイル端末 VPN / IPsecVPN インターネット/

IPsecVPN

契約IDごと,帳票種ごとの 認識エンジンを管理 業務APL

API

帳票RPAアプリ 前処理 帳票RPAアプリ

画像処理

-傾斜補正

-地紋除去

-ノイズ除去

-二値化

など

認識処理 日立ディープラーニング帳票認識

管理画面

(テンプレート管理,

ルール管理,

アカウント管理など)

A社認識サービス B社認識エンジン

C社認識エンジン D社認識エンジン 二次元コード認識

非定型帳票認識エンジン

定型帳票認識エンジン 後処理 帳票認識サービス

認識エンジン振り分け 読み取り座標照合 型判定ス

コア

リン

確信度算出 ルールチェック確信度補正

テンプ レート モバイル

アプリ

日立の技術に加え, 他社の認識技術を採用し, 帳票に応じた最適な認識技術を提供

図2|AI-OCRを活用した帳票認識サービスの概要

定型帳票に適する「定型帳票認識エンジン」と,フォーマットが決まっていない帳票(領収書など)に適する「非定型帳票認識エンジン」を具備する。最適な認識 技術を適用し,高精度な認識結果と認識結果の確からしさ(確信度)を提供する。

注:略語説明など

APL(Array Processing Language),RPA(Robotic Process Automation),API(Application Programming Interface),VPN(Virtual Private Network)

(4)

価値創出を加速するデジタルソリューション

F E A T U R E D A R T I C L E S

OCRに求められることは,文字認識率の継続的な向上 が可能であることと,多様な帳票の読み取りに適用可 能なことである。特に,請求書などの金額の記載位置 が各社で異なるような非定型帳票については,読み取 り項目の事前の定義(位置指定)なしに適用できるこ ともAI-OCRには求められる。

AI-OCRは,個人の手書き文字の癖によらず高精度 な認識精度を可能とするために,深層学習と高度言語 処理を活用している。深層学習を用いて手書き文字の 形状や文字間隔などのバリエーションを学習させるこ とで,高精度な手書き文字認識AIを実現した。また,

高度言語処理により単語レベルで文字の出現確率を推 定し,文字認識AIの認識結果を評価することで,エ ラーの少ない認識の実現と,後述する確信度の算出を 可能とした。

帳票認識サービスは,日立の技術に加え,他社の認 識技術も併用し,「定型」,「非定型」帳票に適する,最 適なAI-OCRエンジンを選択することで文字認識精度 を向上させている。また,認識モデルをアップデート 可能な学習機構を有しており,継続的な認識率向上の 実現も可能である。さらに,非定型帳票についても,

業務において認識対象としたい項目を指定するだけ で,事前の位置指定なしに帳票から目的とする認識項 目を特定でき,帳票のフォーマットを問わず認識が可 能となり,多様な帳票の読み取りに適用可能である。

(b)認識結果の確からしさ「確信度」による業務負荷 の低減

100%の認識率を求めることは困難なため,認識結 果は人の確認が必要となる。認識結果を確認する手間 をどれだけ減らせるかという点には,RPAによる自動 化が可能な運用(機械に任せられる処理)と人による 確認が必要な運用の判別が重要となる。

帳票認識サービスは,AI-OCRの認識結果の確から しさを日立独自のアルゴリズムにより確信度というス コアとして提供する。さらに,AI-OCR認識結果と確 信度に対して,適用業務におけるチェックルール(桁 数チェックや形式チェックなど)を適用し補正するこ とで,AI-OCRの不読・誤読による誤ったデータ登録 リスクを低減させている。これにより,AI-OCRの誤 認識が発生したときに業務側で正確な対応が可能と なる。

例えば,認識結果が確信度「中」,「低」の場合は人 が確認し,確信度「高」の場合は人は確認せずに自動 登録するなど,誤登録リスクを回避しながら,帳票業 務の自動化率を向上する。さらに,認識結果と別系列 の業務データとの突合チェックを行い,突合チェック 結果も確信度の補正に活用することで,誤ったデータ 入力のビジネスリスクをさらに低減することができる。

顧客業務システム

帳票認識サービス

機械学習 文字認識モデル

確信度判定

Ⅱ型 I0

キーワード情報 抽出設定変更 定型帳票対応エンジン

確信度「高」

確信度算出 確信度判定

I

確信度算出 AI-OCRエンジン自動振り分け

API提供

帳票認識結果 各種 デバイス

ロボットが入力 人の確認不要

確信度「中」

確信度の高いものは人による確認が不要となり帳票事務の負荷を軽減 ロボットが入力

人が確認

確信度「低」

人が入力確認 業務データ 確信度

帳票読み取り

定義 辞書

帳票画像 多種大量の帳票様式

非定型帳票対応エンジン

ビジネスリスク調整 図3| 帳票認識サービスによる業務効率化

に向けた技術的アプローチ

帳票認識サービスは,さまざまな帳票事務業務の効 率化を実現するため,AI-OCRなどの技術により,高 い文字認識率,定型・非定型を含むさまざまな帳票 の読み取り,認識結果の確認作業の業務負荷を低 減する確信度を提供する。

(5)

(2)サービス的アプローチ

帳票認識サービスは,従来のOCRが適用可能な業務で あるものの,費用対効果の面で導入が困難な領域の課題 も解決する。概要を図4に示す。

(a)少量・多様式の帳票の取り扱い業務への適用が 可能

OCRを適用可能な帳票を取り扱う業務であるもの の,業務の性質上,取り扱う帳票の数量は少量であり,

かつ様式が複数ある業務について,従来のOCRのよう に専用の読み取りスキャナが必要な場合など,費用対 効果の面で導入が困難なケースがある。

帳票認識サービスはクラウド上のサービスとして提 供しており,読み取り専用スキャナは不要で企業にあ るデバイスを活用できる。継続的な認識精度の向上と 学習運用を実現し,従来のSI(System Integration)よ り低コストで導入・運用すること,また,業務ごとに 異なる帳票種とデバイスを意識せず,多様なビジネス にフィッティングすることをめざしている。

(b)特定の期間に集中する業務への適用が可能 さまざまな業務で発生する帳票は,特定の期間に集 中するケースが多く見られる。繁忙期には通常の時期 より,数倍から数十倍という業務もある。

帳票認識サービスは,サービスプラットフォームを クラウド上に構成しているため,特定の期間に集中す る業務などに対しても,スケーラブルなサービス対応 が可能となる。

3.3

事務集中センターにおけるデータ入力・確認業務への 適用事例

金融機関の三大業務の一つである為替業務では,振込,

送金,口座振替など,現金をやり取りすることなく口座 間の資金移動により代金支払や金銭授受を行う。支店・

本店は,顧客から振込伝票,口座振替依頼書などの帳票 を受け取り,事務集中センターは,帳票のデータ入力作 業,入力結果の確認作業を行う。同センターでは,多く の帳票を事務処理することから職員の業務負荷や要員確 保などの課題がある。そのため,為替業務を代行する業 務アウトソーシングサービスが利用されることもある が,データ入力作業および確認作業自体はなくならない。

帳票認識サービスは,事務集中センターにおけるデー タ入力・確認作業の事務処理の省力化を実現し,事務コ ストの削減や事務基盤の確保の検討を可能とする。課題 および帳票認識サービスの導入効果を図5に示す。

特定帳票

特定帳票

特定帳票

専用読み取り デバイス

専用読み取り デバイス

専用読み取り デバイス

個別精度

向上 SI

提供

A

A社 クラウドセンター

サービスとして提供 SI

提供

SI 提供 個別精度

向上

個別精度 向上

業務システム A

業務システム B

業務システム C

業務システム A

業務システム B

業務システム 企業にある C

デバイス さまざまな帳票

学習

学習

従来 の ソ リ ュ ー シ ョ ン 日立が め ざ す ソ リ ュ ー シ ョ ン

サービス利用

文字データ

帳票レイアウト情報

辞書情報 単体文字 単語文字

手書き

請求書

住所辞書 氏名辞書 銀行名辞書 口座振替 公金

銀行名 活字 地方名 病名

VPN/インターネット

$3 ,呼び出し

$3 ,提供 図4|帳票認識サービスによる業務効率化に向けたサービス的アプローチ

帳票認識サービスは,取り扱う帳票の数量が少量かつ複数の帳票様式を扱う業務,特定期間に事務処理が集中する業務などの個別ニーズへ適応するため,スケー ラブルに対応可能なクラウドサービスとして提供する。

注:略語説明 SI(System Integration)

(6)

価値創出を加速するデジタルソリューション

F E A T U R E D A R T I C L E S

帳票の取り扱い業務は,金融機関のほか官公庁では住 民からの各種申請書,陸運業では日々作成する帳票類の 事務処理など多くの業界に存在する。帳票認識サービス は多様な帳票を読み取り,読み取り結果の確からしさを 評価することで,さまざまな業界における帳票の取り扱 い業務を支援することをめざしている。

4. 今後の取り組み

AI-OCRで現状,取り扱いが困難な領域は,契約書や 製品カタログなどのような任意様式のビジネス文書(非 構造データ)を読み取り,分析することである。

AI-OCRが読み取り可能な非定型帳票における「非定 型」の程度は,例えば請求書のように,「請求金額」の項 目と値の記載位置が企業ごとに若干異なるが,記載位置 にある程度の規則性があることが前提となっている。こ の意味で,「準」非定型と呼ばれることがある。

一般のビジネス文書のように,リレーショナルデータ ベースのような構造性を持たず,項目間の位置関係が不

規則であり,同じ項目でも表記揺れがある文書を「非構 造データ」という。例えば,ドキュメント,画像,動画,

音声などは非構造データである。

関連するキーワードとして,ダークデータがある。ダー クデータは,企業活動で生み出されるビジネス文書には 潜在的な価値があるものの,一度生産した約80%のデー タは二次利用されていない,という意味でそのように呼 ばれている5),6)。ダークデータは,非構造データ,構造 データを含む,広い意味で使用されている言葉であると 考えられる。

ダークデータの解析事例として,複数社の有価証券報 告書(以下,「有報」と記す。)から売上を抽出したい場 合,同じ売上項目でも表記は企業ごとに「完成工事高」,

「売上高」と異なり,単純な項目名での抽出は困難であ る。表記揺れがあっても,有報の表や列などの階層情報 から,売上項目や時期の特徴量を作成することで抽出を 可能とする。

このように新たな技術を活用することで,現状では読 み取り,分析が困難な非構造データへの対応も検討して いる。

受取帳票の伝送 受取帳票の伝送

入力 入力

確認 確認

不一致項目の再確認 不一致項目の再確認

検印事項の確認 検印事項の確認

勘定登録 勘定登録

AIの活用

確信度の活用 課題

1事務コストを削減し,収益の向上や,より売上に寄与する業務に投資したい。

2労働人口が減る中で,継続して事務員を確保できるか不安である。

3上記12を事務リスクの現状維持もしくは,より低減した方法で解消したい。

本サービスの活用により以下のような業務の実現が可能となる。

効果

1入力作業の自動化により,人件費とシステムに関するサービス費用の比較検討ができる。

2事務運営する必要人員を減らすことで,事務基盤の安定化が見込める。

3業務ルールを適用した確信度の利用により,事務リスクの現状維持もしくは,より低減することの検討が可能である。

導入前 導入後

支店本店

支店本店 事務集中センター

事務集中センター 図5|帳票認識サービスの業務への適用事例(事務集中センターにおける業務効率化)

事務集中センターでは,帳票のデータ入力作業を複数人で手作業により実施し,入力元の帳票と目視で照合している。帳票認識サービスの確信度の高さ(高・中・

低)を活用し,データ入力作業の要否を仕分け可能となる。

(7)

5. おわりに

本稿では,AI-OCRを活用した帳票認識サービスによ る業務効率化について述べた。AI-OCRは,単純な文字 の読み取りにとどまらず,RPAとの連携により業務効率 のさらなる向上が見込まれる。今後もAI-OCRなどの技 術を活用し,ビジネス現場に変革を与えられるような業 務効率化を追求していく。

帳票認識サービスに興味を持たれた読者は,日立web サイト7)を参照いただければ幸甚である。

執筆者紹介

山崎 敦央

日立製作所 金融ビジネスユニット 金融システム営業統括本部 金融イノベーション推進センタ 所属

現在,金融業界向けビッグデータ,AIに関わる企画業務に従事

稲田 学

日立製作所 サービス&プラットフォームビジネスユニット アプリケーションクラウドサービス事業部

アプリケーションサービス第1本部 LSH事業推進センタ 所属 現在,帳票認識サービスの企画・開発に従事

鈴木 尚宏

日立製作所 サービス&プラットフォームビジネスユニット Lumada CoE AIビジネス推進部 所属

現在,AI関連のコンサルティング業務・ソリューション開発に従事

井本 直樹

日立製作所 金融ビジネスユニット 金融システム営業統括本部 金融イノベーション推進センタ 所属

現在,金融業界向けビッグデータ,AIに関わる企画業務に従事 参考文献など

1) 高度情報通信ネットワーク社会推進戦略本部(IT総合戦略本部), 世界最先端デジタル国家創造宣言・官民データ活用推進基本計 画 改定(2019.6),

https://www.kantei.go.jp/jp/singi/it2/decision.html

2)株式会社富士キメラ総研プレスリリース,『2019人工知能ビジネス総 調査(2019.3)』まとまる,

https://www.fcr.co.jp/pr/19039.htm 3)誕生と発展の歴史(コンピュータ博物館),

http://museum.ipsj.or.jp/computer/ocr/history.html

4)【日立】H-8252形 光学文字読取機(コンピュータ博物館)

http://museum.ipsj.or.jp/computer/ocr/0001.html 5) Gartner, Inc.,Dark Data,

https://www.gartner.com/en/information-technology/glossary/

dark-data

6) IBM Big Data & Analytics Hub,Cognition and the future of marketing

(2016.9),

https://www.ibmbigdatahub.com/blog/cognition-and-future- marketing

7)帳票認識サービス,

https://www.hitachi.co.jp/products/it/bigdata/service/ai-ocr/

index.html

参照

関連したドキュメント

LiveCampus学納金システム ユーザーマニュアル 2.1.8 - 3 Copyright© 2012 NTT DATA KYUSHU CORPORATION 第2章 学納金業務編 1.学生管理業務 2 [帳票出力]ボタンをクリックします。 1で入力した帳票出力条件で「振替口座情報CSV」を出力します。 <振替口座情報CSVデータ>

知的生産性を向上させる方法の 1 つは、限られ た時間内での作業効率を高めることである。これ まで、働く人々が

IT 効果向上サービスの概要 IT 効果向上サービスのプロセスを図 1 に示す. IT 効果向上サービスは Step1 から Step4 の 4

を用いたデータ管理システムの構築法の研究開発を行っ

本論文は、企業法務実務を 対象として、企業法務の効 率性を如何に実現す るかに ついて検討するこ とを目的としている。本論文の構成は大きく

【参照可能帳票】 No 項目名 必須 任意 属性 説明 ① 参照可能帳票 (預金・為替) 必須 --- 参照・ダウンロード可能な帳票を選択します。 ② 参照可能帳票

図 4 で示した帳票作成自動化を行うデザインパターンでのエクセル帳票クラス のメソッドの実装について,Java ライブラリである Apache

 国では、総務省が地方公営企業の経営を改善さ せるための抜本改革を各団体に迫り、「公営企業 の経営に当たっての留意事項について」( 総務省