SPA Cloud
試使用のススメ
ウイングアーク1st株式会社 テクニカルセールス部
はじめに
この度は弊社製品をご検討いただき誠にありがとうございます。
本資料では「SPA Cloud」の試使用版をご利用いただくにあたり、
必要となる初期設定からOCRによるデータ化までを行う流れを記 載しています。
なお、本資料に全ての手順は記載しておりません。各機能の詳細に
ついては、製品マニュアルをご参照ください。
使用するPDF帳票
取引先名
伝票番号 御見積日
この帳票から「取引先名」「伝票番号」「御見積日」をOCRで読み取り、SPA Cloudのフォルダー に取引先名ごとに仕分けて保管し、御見積日の日付範囲で検索ができるようにします。
ゴール:SPA Cloudにアーカイブした結果
[原本] フォルダーには見積書の全ページを
元のファイル名で保管する[仕分け後] フォルダーは [取引先名] で仕分けを行い、
対象ページを抽出して
[伝票番号]
のファイル名で保管するSPA Cloudに文書ファイルをアップロードして格納する
ことを「アーカイブする」と呼びます。SPA Cloudに文書をアーカイブする
2つの方式
SPA Cloudに文書をアーカイブする2つの方式
Distributor(ディストリビューター)方式
ソフトウェアのインストール不要で、Webブラウザだけで使える方式です。
OCR機能を中心に試したい場合は、この方式を選択してください。
Bridge(ブリッジ)サービス方式
PCにソフトウェア(Bridgeサービス)をインストールすることで自動アーカイブを実現す る方式です。
複合機のスキャナと連動させるなど機器との連携まで試したい場合は、この方式を選択して ください。
Distributor
Bridge
SPA Cloudに文書をアーカイブする2つの方式
SPA Cloud Windows PC
Distributor
ブラウザブラウザで閲覧
仕分けられたPDFを閲覧
Windows PC
ブラウザ
Bridgeサービス
フォルダー監視
OCR
OCR処理/PDFを自動アップロード/自動仕分け
OCR
ブラウザからPDFをアップロード
OCR処理/自動仕分け
Distributor方式
Bridgeサービス方式
Distributor
Bridge
試使用フロー
Distributor
Bridge
手軽にお試し/Distributor方式
本格お試し/Bridgeサービス方式
Bridgeサービスのインストール
SPA Cloudの準備
文書定義の作成
処理定義の作成
アーカイブ結果の確認
Bridge
のみDistributor
Bridge
共通Bridgeサービスのインストール
Distributor方式を選択した場合は、この手順は不要です。
Bridge
Bridgeサービスをダウンロード
ブラウザでSPA Cloudにアクセスし、[サーバー環境の設定] 画面を表示します。
②
[ユーザー名]-[サーバー環境の設定] を選択
Bridge
①あらかじめお知らせしているSPA Cloudのユーザー名(admin)と パスワードを入力してログイン
Bridgeサービスをダウンロード
[Loader設定] 画面を表示します。
①
[運用管理]-[文書定義の設定] を選択
③
[振り分け] を選択
②
[Loader設定] を選択
Bridge
Bridgeサービスをダウンロード
Bridgeサービスを追加します。
②
[Bridgeサービス名] に任意の名前を入力
※本資料では「SPABS」という名前を使います
①
[ ]
をクリック③
[OK] を選択
Bridge
Bridgeサービスをダウンロード
Bridgeサービスのインストーラをダウンロードします。
[ダウンロード]
を選択Bridge
1分以上かかります。(ネットワーク速度等によります)
EXE形式が利用できない場合はZIP形式をダウンロードして
解凍してください。Bridgeサービスをインストール
Bridgeサービスをインストールします。
下記マニュアルを参照しながらインストール作業を実施してください。
https://cs.wingarc.com/manual/spa/cloud/spac-setup/ja/1436019.html [spa-bridge-windows.exe] をダブルクリック
Bridge
Bridgeサービスの起動と停止
Windowsの管理ツールにある [サービス] で [SPA Bridge Service] を選択して起動と停止を 行います。以降の手順でサービス起動/停止の指示がある場合はこの操作をしてください。
①Windowsスタートから「サービス」を検索
②
[サービス] を選択
③
[SPA Bridge Service] を選択
④
[サービスの開始] [サービスの停止] を選択
Bridge
OCR機能を利用するための準備
WingArc Data Captureを利用するための文字認識モデルデータをインストールします。
Bridgeサービスを停止し、Windowsコマンドプロンプトから以下を実行します。
Bridge
手順は下記マニュアルを参照してください。
https://cs.wingarc.com/manual/spa/cloud/spac-setup/ja/1436058.html
<INSTALL_DIR>¥bridge¥utils¥model_data¥update¥update.cmd
※インストール先を変更していない場合は
C:¥SPA¥bridge¥utils¥model_data¥update¥update.cmd
1分以上かかります。
(ネットワーク速度等によります)
OCR機能を利用するための準備
Bridgeサービスを停止し、マニュアルのリンク先から
[Microsoft Visual C++ 2015 Redistributable Update 3] をインストールします。
Bridge
手順は下記マニュアルを参照してください。
https://cs.wingarc.com/manual/spa/cloud/spac-setup/ja/1436058.html
Bridgeサービスの状態を確認する
Bridgeサービスを起動します。[Loader設定] 画面に戻り、Bridgeサービスが起動しているこ とを確認します。
②
[ステータス] が「オンライン」になっていることを確認
①
[ ]をクリック
Bridge
SPA Cloudの準備
フォルダーの作成
ブラウザでSPA Cloudにアクセスし、[見積書] フォルダーを作成します。
②
[ / ] フォルダーを選択し右クリック
③
[作成] を選択
④フォルダー名を入力 フォルダー名:見積書
⑤
[OK] を選択
①あらかじめお知らせしているSPA Cloudのユーザー名(admin)と パスワードを入力してログイン
フォルダーの作成
[見積書] フォルダーが作成されました。
OCRの利用開始
OCRを使うための設定をします。[サーバー環境の設定] 画面を表示してください。
[ユーザー名]-[サーバー環境の設定] を選択
OCRの利用開始
OCR利用開始の手続きをします。
①
[ユーザー名]-[OCRの利用量] を選択
②画面の内容を確認し、[同意する] をチェック
して
[利用開始] をクリック
標準利用権の超過時に有料となるOCRを利用する場合は、
この手続きが必要です。試使用では上限を設けているため
OCRの費用は発生しません。
SPAサーバー設定
SPAサーバーの初期設定をします。[Loader設定] 画面から設定画面を表示してください。
①
[運用管理]-[文書定義の設定] を選択
③
[メニュー]-[設定]を選択
②
[Loader設定] を選択
SPAサーバー設定
②
[ ] をクリック
③
[サーバー名] に任意の名前を入力
※本資料では「SPASERVER」という名前を使います
④接続設定を設定
ドメイン名 :local ユーザー名 :admin
パスワード :(adminのパスワード)
⑤
[保存]を選択
①
[SPA] を選択
文書定義の作成
文書定義とは
文書定義とは、SPAで文書の種類に応じた処理を定義するためのSPA独自の概念です。
OCRの読み取りエリアとなる「フィールド」と呼ばれるオブジェクトが含まれます。
サーバー環境の設定画面を表示
ブラウザよりSPA Cloudにアクセスし、[サーバー環境の設定] 画面を表示します。
[ユーザー名]-[サーバー環境の設定] を選択
アーカイブを行うPDFの文書定義を作成
SPA Cloudにアーカイブするための文書の定義を登録します。
②
[ ]
をクリック①
[運用管理]-[文書定義の設定] を選択
③IDと定義名を入力
文書定義ID :Mitsumori 文書定義名 :見積書
④
[OK] を選択
元となるPDFファイルの登録
作成した文書定義に対し、元となる帳票デザインのPDFファイルを登録します。
③
[見積書] を選択
②
[文書定義] を選択
①
[Loader設定] を選択
④
[ ]
をクリック元となるPDFファイルの登録
① [ … ] をクリックして帳票デザインの 元となる「見積書.pdf」を選択
見積書.pdf は本資料と合わせて配布しています。
②
[アップロード]
をクリック
③「画像のアップロードに成功しました」の メッセージを確認して
[閉じる]
をクリック④アップロードされたPDFが表示される
[対象ページ] はアップロードしたPDFファイルの
どのページを取り込むかを指定できます。読み取りエリア(フィールド)の設定
登録したPDFの読み取りエリアを設定する画面を開きます。
[ ]
をクリック読み取りエリア(フィールド)の設定
OCRで読み取りたい場所をマウス操作で指定します。
②スライダーで表示倍率を拡大
➀
[テキスト]
を選択③マウスのドラッグ操作で3か所を範囲指定 取引先名、伝票番号、御見積日
読み取りエリア(フィールド)の設定
フィールドに名前を付けて保存し、画面を閉じます。
②
[ ]
をクリックして保存①作成した各フィールドを選択しフィールド名を入力 取引先名、伝票番号、御見積日
③
[ ] をクリックして画面を閉じる
[詳細設定] をクリックすると、OCRに関する詳細設定を
行うことができます。こちらでは、OCRのエンジンを変えたり、読み取る文字 のタイプを指定する等の設定ができます。
不要なフィールドは
[ ] で削除できます
読み取りエリア(フィールド)の設定
[御見積日] のデータ型を [日付] にして日付検索をできるようにします。
➀作成されたフィールドから
[御見積日] を選択
②データ型は
[日付]
を選択日付フォーマットに
[yyyy/MM/dd] を入力
文字色が少し薄い状態 は未入力なので注意
③
[ ]
をクリック して保存[ ] は全キャンセル
なので押さないように注意
処理定義の作成
処理定義とは
アーカイブの詳細な動作を処理定義と呼びます。
入力/識別/出力/後処理/スケジュールを設定することによりPDFのアーカイブします。
入力 識別 出力 後処理 スケジュール
SPA Cloudが監視する
フォルダーを設定しますどの文書定義で読み取る かを指定します
文書をアーカイブする フォルダーを指定します
成功/エラー時の処理を
設定します 処理定義を有効にします
処理定義
仕分けの原理
原本
取引先B ページ 取引先A
ページ
取引先C ページ
ページリンク 取引先A
ページ
原本
取引先A 取引先B
初めに原本をSPA Cloudにアーカイブし、その後仕分けを行います
取引先C ページ
ページリンク 取引先B
ページ
ページリンク 取引先C
ページ 取引先C
ページ
取引先C
処理定義の作成
「Distributor方式」と「Bridgeサービス方式」について、本資料での設定内容は同等ですが、
設定画面が少し異なります。
利用している方式を参照しながら進めてください。
Distributor
Bridge
手軽にお試し/Distributor方式
本格お試し/Bridgeサービス方式
処理定義の作成
(Distributor方式)
Bridgeサービス方式
を選択した場合は、次章へDistributor
処理定義を作成
処理定義を作成します。
➀[振り分け] を選択
③
[ ] をクリック
Distributor
見積書 のように打消し線になりますが問題ありません。
定義が有効化されると消えます。
④
[SPA]
を選択②
[Distributor] を選択
⑤[定義名] に任意の名前を入力
※本資料では「見積書」という名前を使います
処理定義を作成
入力 識別 出力 後処理 スケジュール
ここからは、画面の下半分で設定を進めます
Distributor
監視するフォルダーとファイル名を指定
SPA CloudにアーカイブするPDFファイルを監視するフォルダーと、取り込み対象とする ファイル名のパターンを指定します。
①
[入力] を選択
②
[抽出条件] に以下を設定
監視対象フォルダー :/見積書 監視対象ファイル名パターン :*.pdf
抽出条件 :すべてに一致
Distributor
③
[監視ユーザー]
に以下を設定ドメイン :local ユーザー :admin
アーカイブするPDFファイルの文書定義を指定
アーカイブするPDFファイルに適用する文書定義を指定します。
②
[文書定義IDを指定する] を選択し、
「文書定義の作成」で作成した
[見積書(Mitsumori)]
を指定①
[識別] を選択
Distributor
アーカイブするPDFファイルの文書定義を指定
①
[出力] を選択
②
[ ]
をクリック③
[見積書(Mitsumori)]を選択
④
[OK]
を選択Distributor
原本となるPDFのアーカイブ先を設定
監視フォルダーのPDFファイル(原本となるファイル)をSPA Cloudの [原本] フォルダーに アーカイブします。
③
[サーバー名] に「SPASERVER」を選択
①
[ ]
をクリックサーバー名には「SPAサーバー設定」の項で作成した名前 を選択してください。
Distributor
原本
②
[設定]
を選択原本となるPDFのアーカイブ先を設定 Distributor
①
[リンク] は「リンクしない」
③
[ファイル名] は指定しない
原本
②
[パス] は「/見積書/原本」を設定
[追加] を押して以下を設定
文字列 :見積書文字列 :原本
取引先毎にページリンクで仕分けする
原本のPDFファイルから取引先の情報を読み取り、該当ページのみを抽出したPDFを取引先 毎のフォルダーに仕分けます。
③
[サーバー名] に「SPASERVER」を選択
①
[ ]
をクリックDistributor
取引先A 取引先B 取引先C
②
[設定]
を選択取引先毎にページリンクで仕分けする Distributor
取引先A 取引先B 取引先C
①
[論理仕分けして出力] を選択
② [SPASERVER/”見積書”/”原本”] を選択
③
[キーブレイク設定] に以下を設定
判定方法:ブレイクページを先頭ページとして判定する アクション:単純分割
キーの値がソートされていないとき:キーごとにまとめる エラー時のアクション:全体をエラーにする
④
[フィールド] を[追加] して [伝票番号] を選択
取引先毎にページリンクで仕分けする Distributor
取引先A 取引先B 取引先C
①
[パス] は
「/見積書/仕分け後/(取引先名)」を設定
[追加] を押して以下を設定
文字列 :見積書 文字列 :仕分け後 フィールド :取引先名②
[ファイル名] は [指定する] をチェック
[フィールド] を選択後に [追加] を押して以下を設定
1. フィールド
:伝票番号アーカイブ後の動作を設定
PDFをアーカイブした後の処理を設定します。
①
[後処理] を選択
③
[ファイルをそのまま残す]を選択
Distributor
②
[ファイルを削除する]を選択
アーカイブ実行間隔の指定/処理定義の有効化
フォルダーを監視する間隔を設定します。
[処理定義を有効にする] をチェックして保存するとフォルダーの監視が始まります。
①
[スケジュール] を選択
②
[処理定義を有効にする] をチェック
実行間隔は1分(任意)
③
[ ]
をクリックして保存[ ] は全キャンセル
なので押さないように注意
処理定義を有効にすると
見積書 が 見積書 に変わります
Distributor
処理定義の作成
(Bridgeサービス方式)
Distributor方式
を選択した場合は、前章へBridge
処理定義を作成
処理定義を作成します。
➀[振り分け] を選択
②
[SPABS] を選択
③
[ ] をクリック
見積書 のように打消し線になりますが問題ありません。
定義が有効化されると消えます。
Bridge
④
[フォルダー]
を選択⑤
[OK]
を選択 ⑥[定義名]
に任意の名前を入力※本資料では「見積書」という名前を使います
処理定義を作成
入力 識別 出力 後処理 スケジュール
ここからは、画面の下半分で設定を進めます
Bridge
監視するフォルダーとファイル名を指定
SPA CloudにアーカイブするPDFファイルを監視するフォルダーと、取り込み対象とする ファイル名のパターンを指定します。
①
[入力] を選択
②
[抽出条件] に以下を設定
監視対象フォルダー :
C:¥SPATEST¥監視(任意)
監視対象ファイル名パターン :*.pdf 処理を開始するファイル名パターン :*.pdf
Bridge
アーカイブするPDFファイルの文書定義を指定
アーカイブするPDFファイルに適用する文書定義を指定します。
②
[文書定義IDを指定する] を選択し、
「文書定義の作成」で作成した
[見積書(Mitsumori)]
を指定①
[識別] を選択
Bridge
アーカイブするPDFファイルの文書定義を指定
①
[出力] を選択
②
[ ]
をクリック③
[見積書(Mitsumori)]を選択
④
[OK]
を選択Bridge
原本となるPDFのアーカイブ先を設定
監視フォルダーのPDFファイル(原本となるファイル)をSPAの [原本] フォルダー配下に アーカイブします。
③
[サーバー名] に「SPASERVER」を選択
①
[ ]
をクリックサーバー名には「SPAサーバー設定」の項で作成した名前 を選択してください。
原本
②
[設定]
を選択Bridge
原本となるPDFのアーカイブ先を設定
①
[リンク] は「リンクしない」
③
[ファイル名] は指定しない
原本
②
[パス] は「/見積書/原本」を設定
[追加] を押して以下を設定
文字列 :見積書文字列 :原本
Bridge
取引先毎にページリンクで仕分けする
原本のPDFファイルから取引先の情報を読み取り、該当ページのみを抽出したPDFを取引先 毎のフォルダーに仕分けます。
①
[ ]
をクリック取引先A 取引先B 取引先C
②
[設定]
を選択③
[サーバー名] に「SPASERVER」を選択
Bridge
取引先毎にページリンクで仕分けする
取引先A 取引先B 取引先C
①
[論理仕分けして出力] を選択
② [SPASERVER/”見積書”/”原本”] を選択
③
[キーブレイク設定] に以下を設定
判定方法:ブレイクページを先頭ページとして判定する アクション:単純分割
キーの値がソートされていないとき:キーごとにまとめる エラー時のアクション:全体をエラーにする
④
[フィールド] を[追加] して [伝票番号] を選択
Bridge
取引先毎にページリンクで仕分けする
①
[パス] は
「/見積書/仕分け後/(取引先名)」を設定
[追加] を押して以下を設定
文字列 :見積書 文字列 :仕分け後 フィールド :取引先名取引先A 取引先B 取引先C
②
[ファイル名] は [指定する] をチェック
[フィールド] を選択後に [追加] を押して以下を設定
1. フィールド
:伝票番号Bridge
アーカイブ後の動作を設定
PDFをアーカイブした後の処理を設定します。
①
[後処理] を選択
②正常終了時に
[ファイルを削除する]を選択
③エラー終了時に以下を設定
移動先フォルダー :C:¥SPATEST¥エラー(任意)
Bridge
アーカイブ実行間隔の指定/処理定義の有効化
フォルダーを監視する間隔を設定します。
[処理定義を有効にする] をチェックして保存するとフォルダーの監視が始まります。
①
[スケジュール] を選択
②
[処理定義を有効にする] をチェック
[一定間隔で実行] を選択
実行間隔は10秒(任意)③
[ ]
をクリックして保存[ ] は全キャンセル
なので押さないように注意
処理定義を有効にすると
見積書 が 見積書 に変わります
Bridge
アーカイブ結果の確認
PDFを監視フォルダーに配置する
選択した方式に合わせて「見積書.pdf」を監視フォルダーに配置します。
見積書.pdf は本資料と合わせて配布しています。
見積書.pdf
Distributor Bridge
手軽にお試し/Distributor方式 本格お試し/Bridgeサービス方式
SPA Cloudの画面に PDFを配置
Windowsのエクスプローラーに
PDFを配置
PDFを監視フォルダーに配置する
Distributor方式ではSPA Cloudの [見積書] フォルダーにPDFをアップロードします。
②PDFファイルを ドラッグ&ドロップ
Distributor
①見積書フォルダーを選択
③OKを選択
PDFを監視フォルダーに配置する
Bridgeサービス方式では、エクスプローラーで監視フォルダー(C:¥SPATEST¥監視)に PDFをコピーします。
①監視フォルダ―を選択
Bridge
②PDFファイルをコピー
原本のアーカイブ結果を確認
一定時間後に更新ボタンを押すとアーカイブと自動仕分けが実行されたことを確認できます。
①更新ボタン
②
[原本] フォルダーが作成される
③原本のPDFがアーカイブされる
④プレビューで内容を確認
プレビュー画面の確認
サムネイル 切り替え
ダウンロード・印刷
拡大縮小・幅や高さに合わせる
元の画面に戻る
OCRの読取結果を確認
[SVF検索フィールドの値の編集] 画面を開き、OCRの読取結果を確認します。
① 原本のPDFを選択
②
[ ]
をクリック「SVF検索フィールド」という名前にはSVFと いう別製品の名前が付いていますが、OCR結果 を保持するフィールドとしても使われています。
OCRの読取結果を確認
文書プレビュー
ON/OFF
ページ送りOCR結果
縦横表示切替
自動仕分けの確認
①
[仕分け後] フォルダーが作成される
③
[伝票番号] がファイル名になっている
②OCRで読み取った
[取引先名]
の フォルダーが作成される④対象となるページだけが抽出されている
日付検索の確認
SVF検索フィールドによる検索で、「御見積日」の日付で「2015/03/05」を含む日付範囲を 行い、日付の範囲検索ができることを確認します。
①
[仕分け後] フォルダーを選択
②
[ ] をクリック
③
[SVF検索フィールド] を選択
「SVF検索フィールド」という名前にはSVFと いう別製品の名前が付いていますが、OCR結果 を保持するフィールドとしても使われています。
日付検索の確認
①
[見積書] - [御見積日] を選択
②
[OK] を選択
③
[御見積日] に「2015/03/05」を含む範囲を指定
④
[選択しているフォルダー]
に「/見積書/仕分け後」が選択さ れていることを確認
⑤
[検索] をクリック
日付検索の確認
①検索にヒットした文書を1つ選択
③検索結果がハイライトされている
②プレビューで内容を確認
④元の画面に戻る
OCR読取結果をCSVファイルに出力
OCRの読取結果をCSVファイルに出力します。
① 原本のPDFを選択
②
[ ]
をクリックOCR読取結果をCSVファイルに出力
項目の順序や、追加で出力する項目など、
細かな設定ができます。
①
CSV作成を指示
② 受付完了
③
[CSVファイルのダウンロード]
を選択
④ 作成されたファイルを ダウンロード