注目のAIソリューション(第3回)

AIによるOCR。自動でテキスト化、高精度

2019.12.25

クリップについて

 紙に書かれた文字を機械が読み取ってくれるOCR(光学的文字認識)。専用の装置やパソコンソフトなどでその存在は以前から知られる。実際に利用した経験のある方も多いだろう。ここで「ああ、OCRの話か」と諦めないでほしい。OCRは最近の人工知能(AI)の進化による成果を取り入れ、格段に性能が向上しているからだ。

 従来のOCRは、「活字で印字された書類であったり、丁寧に楷書で書かれた文書だったりすれば、まあまあ読み取ってくれるもの」というイメージだと思う。手書きだと、かなり壊滅的な認識結果に終わり、笑ってしまうこともあった。恐らく、実務では使いにくいという評価が下されているのではないか。

 ところが、AIの進化はOCRを実用的なツールに引き上げた。AIの中でもディープラーニングと呼ぶ技術は、これまで画像認識の分野で多くの成果を残してきた。多くの画像データを学習することで、人間や自動車、動物などの識別はもちろん、道路や建物などの画像から危険箇所を発見したり、医療画像から疾病の可能性を見つけたりし始めている。OCRでは、紙に書かれた「とある形」が、何の文字であるかを認識することに、AIの能力が生かされている。これまでOCRでは読み取れなかった文字が、AIを組み合わせて判読可能になった。実務でもOCRの活用が現実のものになってきている。

学習機能が付いたAI OCR、クラウドでデータを継続的に学習

 AI OCRの実用性が向上している理由は、ディープラーニングの技術発達だけではない。ディープラーニングでは多くのデータを使って学習した認識モデルによって、画像や文字を認識する。OCRでの利用を考えるとき、自社で書類を用意して学習させたモデルをつくるとなると、“進化”はそれ相応だろう。だがそれが100社、1000社と増えたらどうなるか。

 NTT西日本の「おまかせAI OCR」はクラウドサービスでAIを活用したOCRを提供する。あらかじめ多くの文字データで学習したモデル使った認識エンジンを利用するという、個社の学習が不要で高い精度の文字認識を“サービス”にしたのだ。自社だけでは集められない多くの文字、多くの帳票を学習しているので、高い精度の認識エンジンを利用できる。

 クラウドサービスの利点を利用して、事前の学習による高い認識精度だけでなく、多くの利用者が認識させた文字や帳票のデータを継続的に学習させる。認識エンジンを成長させていく点も、このサービスの特徴だ。当初は認識がうまくいかなかったクセのある文字も、人の目による修正のデータをAIが学ぶ。次はきちんと読めるようになっていく。

こんな文字が解読可、取り消し線は読まない… 続きを読む

続きを読むにはログインが必要です。
まだ会員でない方は、会員登録(無料)いただくと、続きが読めます。

SID : 00102003

執筆=岩元 直久

執筆=岩元 直久

あわせて読みたい記事

連載記事≪注目のAIソリューション≫

PAGE TOP

閉じる
会員登録(無料) ここでしか読めないオリジナル記事が満載
閉じる