AI-OCR

用語の概要

 OCR(光学文字認識)とは、Optical Character Recognitionの略で、画像データのテキスト文字を読み取り、文字データに変換する技術のことです。昨今、活用事例が増えているAI-OCRは、従来のOCR技術にAI(人工知能、Artificial Intelligence)を組み合わせることによって、手書き文字を含む認識率の向上や非定型フォーマットへの対応を可能にしています。

 紙文書を使用した業務は現状も多くの企業において残されています。電子帳簿保存法改正を念頭に紙文書のデジタル化が進むことに加え、昨今の働き方改革やDX推進に対応するためにOCR/AI-OCR製品の導入事例は増えています。

読み取り対象帳票に合わせた製品選定

 OCR製品は次の3パターンに大別されます。導入を検討している業務で取り扱っている帳票を確認し、それに沿ったパターンの製品を選択することが必要です。

表1. OCR製品の分類

概要 特徴
座標指定型 ・ユーザは、読取り対象帳票のフォーマット毎にOCR対象項目の位置(座標範囲)をテンプレートとして事前登録
・登録済みのテンプレートに従い、該当位置から画像データ上の文字を抽出・デジタル化
・大量の定型帳票を処理したい場合に高い読取り精度を実現
・一方、帳票フォーマットが無数に存在する業務においての利用は現実的ではない
ルール指定型 ・ユーザは、帳票の分類(領収書、請求書 等)毎に共通で使えるデータ抽出ルールを登録
・OCR製品は画像データ上の全ての文字を読み取った上で、ルールに従いキーワードとそのバリュー(値)を抽出し構造化
・座標指定型や特化型と比較すると、汎用性が高く様々なフォーマットへの利用が可能
・一方、事前のルール作成に係る作業コストは座標指定型と比較すると高め
特化型 ・ユーザは、業務に特化した学習済AIを利用し、画像データ内の抽出対象項目を特定し、属性付与と文字抽出・デジタル化 ・学習済AIを利用するため、ユーザにとっては事前設定作業が不要で利便性が高い
・一方、利用可能な業務やOCR対象項目は限定されてしまうため、導入業務の拡張やOCR対象項目を増やす場合、追加のAI開発を伴う

(出所:大和総研作成)

(出所:大和総研作成)

図1. OCR製品分類別のイメージ

目的・読取り対象帳票に合わせた製品選定

 OCR/AI-OCR製品は、文字認識の精度に加えて、導入後の業務フローを想像して次のような観点でも評価することがポイントです。

事前の設定作業がしやすいか

 上記『読み取り対象帳票に合わせた製品選定』で紹介した通り、OCR/AI-OCR製品を利用するには事前の設定作業を伴います。多くの製品は専用のユーザインターフェースを提供していますが、製品により使い勝手は違うため、製品トライアルを活用して確認してみるとよいでしょう。

ベリファイ(確認・修正)用の専用画面があるか

 AI-OCRの読取り精度は100%ではありません。これを前提として、読み取り結果の確認や修正ステップを業務に組み込む場合には、それらを効率的に行うためのユーザインターフェースを評価しなくてはならない大切なポイントとなります。

APIが用意されているか

 OCR/AI-OCR製品はAPIが用意されていることで業務システムとのシームレスな連携がしやすくなります。RPAがOCR/AI-OCR製品に画像データのアップロードと読取り結果のダウンロードを自動化する事例は多くあります。

導入事例

証券会社

 バックオフィスの事務センターにおける口座開設や閉鎖に関わるお客様から提出された大量の紙文書から手書き文字をAI-OCRを活用して読取りを行いデータ入力業務の業務効率化を行う。

社内経理事務

 経費処理業務におけるタクシー等の様々な領収書からAI-OCRを活用して金額や日付情報を読み取り、社員による申請入力情報との照合作業を自動化する。

BPO事務

 健康保険組合のワクチン接種補助申請業務において、被保険者が提出した診療費領収書画像からAI-OCRを活用して金額や日付情報等を読み取り、申請入力情報との照合作業を自動化する。