OCRの処理の仕組みを解説！導入効果やデメリットの紹介

2020.4.8

OCRとは、「光学的文字認識」（Optical Character Recognition）のことで、紙に印刷されている文字をテキストとして認識する技術です。スキャナやデジタルカメラなどを利用して、画像として認識するのではなく、電子化しデータとして認識することで、編集や訂正などが可能になる大変便利なツールです。

しかし、実際にはどのような技術を使用してデータ化されているのでしょうか。今回は、OCRがどのように処理されているのかという仕組みや、導入のメリットやデメリットについて解説します。

OCRの処理ってどういうことができる？

OCRは、1950年代に世界で初めてOCRシステムが販売されました。そして、日本にも1968年に郵便番号の読み取りにOCRが利用されています※。現在のOCRの処理では、印刷された文字をテキスト化して取り込むことができるので、訂正や編集が可能です。また、データとして管理できるので、後から検索をすることもできるようになります。

※参考文献：勝山裕「統計的性質に基づく文字の高精度認識に関する研究」
http://hdl.handle.net/10097/58706

文字認識をするOCR処理の仕組みを解説

OCRで処理を行う際、どのような手順で文字を認識していくのか、帳票からの読み取りを例に紹介します。

文字の読み取り位置を特定

帳票の画像データから文字を記載している枠の位置を特定します。
文字枠の消去

撮影した帳票のイメージから、文字枠を消して、文字だけを抽出します。
文字の切り出し

1文字1文字の字の範囲を特定します。
特徴の抽出

字の形から、それぞれの特徴を抽出していきます。
辞書と照合

抽出した特徴を辞書から近いものを取り出しします。
認識結果を決定

辞書と照合し、特徴の認識結果が一番近いもので決定します。

OCR導入の効果と運用ポイント

OCRの機能を活用することでさまざまな業務効率化を実現することができます。

業務効率化が期待できる2つの効果

1つ目は、画像からテキストを認識することができるようになり、目視で探していたものをビュアーソフトで検索できます。そのため探す時間や手間の簡略化を実現できます。

2つ目は、OCRで認識したテキストデータをコピー＆ペーストできるようになるのも大きな特徴です。書類などの画像データから必要な情報をテキストとして利用できるので便利です。ただ、OCRで認識した文字に誤りがある可能性もあるので確認が必要です。

OCR処理におけるデメリットとは？

一方でOCR処理は、どんな文章でも完璧に文字認識をできるわけではありません。似ている形の文字は認識間違いをすることがあります。また、もとの資料の文字がかすれていたり、日焼けした状態であったりすると、認識結果も悪くなります。したがって、最後は確認が必要になる場合があります。

文字認識率をあげるための方法

文字認識率を上げるためには、どのような画像データを用意すればいいのでしょうか。

カラーの書類はモノクロにする
200～300dpiの高い解像度でスキャンする
伝票など薄い紙の場合は、後ろに黒い用紙を重ねて読み取ることで裏映りを軽減させる
傾かないように画像データ化する

もし、文字の認識率が悪い場合はこのような処置を試してみることをおすすめします。

OCRで業務効率をアップして処理時間短縮！

OCRの処理を行うことで、紙のデータからテキストデータを抽出し、業務を効率化できます。

最近ではAI-OCRといって、OCRが更に進化したソフトが販売されています。AI-OCRは、AIに学習させることにより文字認識率のアップを実現しています。また、RPAと連携することで更に業務効率化を目指すことができます。RPAとは、人が作業していたことをソフトウェアロボットに代行・代替えすることです。

例えば、紙の帳票からデータを抽出して、入力、集計、加工、出力までの業務の自動化を実現できるでしょう。

OCRの処理を効率的に行うにはPFUの製品がおすすめ

OCRとRPAの組み合わせで業務効率を格段にアップすることが可能になります。手軽に、簡単操作で、高度なOCR技術を利用することができる「PFU Smart Capture Service」がおすすめです。

少子化に伴い、将来企業の労働力不足が課題となっています。「PFU Smart Capture Service」は、データエントリー業務を軽減することが可能です。企業の生産性を向上させるためにも、自動化できる業務は早めの対策を行うことをおすすめします。