注目のAIソリューション(第3回)

AIによるOCR。自動でテキスト化、高精度

2019.12.25

クリップについて

 紙に書かれた文字を機械が読み取ってくれるOCR(光学的文字認識)。専用の装置やパソコンソフトなどでその存在は以前から知られる。実際に利用した経験のある方も多いだろう。ここで「ああ、OCRの話か」と諦めないでほしい。OCRは最近の人工知能(AI)の進化による成果を取り入れ、格段に性能が向上しているからだ。

 従来のOCRは、「活字で印字された書類であったり、丁寧に楷書で書かれた文書だったりすれば、まあまあ読み取ってくれるもの」というイメージだと思う。手書きだと、かなり壊滅的な認識結果に終わり、笑ってしまうこともあった。恐らく、実務では使いにくいという評価が下されているのではないか。

 ところが、AIの進化はOCRを実用的なツールに引き上げた。AIの中でもディープラーニングと呼ぶ技術は、これまで画像認識の分野で多くの成果を残してきた。多くの画像データを学習することで、人間や自動車、動物などの識別はもちろん、道路や建物などの画像から危険箇所を発見したり、医療画像から疾病の可能性を見つけたりし始めている。OCRでは、紙に書かれた「とある形」が、何の文字であるかを認識することに、AIの能力が生かされている。これまでOCRでは読み取れなかった文字が、AIを組み合わせて判読可能になった。実務でもOCRの活用が現実のものになってきている。

学習機能が付いたAI OCR、クラウドでデータを継続的に学習

 AI OCRの実用性が向上している理由は、ディープラーニングの技術発達だけではない。ディープラーニングでは多くのデータを使って学習した認識モデルによって、画像や文字を認識する。OCRでの利用を考えるとき、自社で書類を用意して学習させたモデルをつくるとなると、“進化”はそれ相応だろう。だがそれが100社、1000社と増えたらどうなるか。

 NTT西日本の「おまかせAI OCR」はクラウドサービスでAIを活用したOCRを提供する。あらかじめ多くの文字データで学習したモデル使った認識エンジンを利用するという、個社の学習が不要で高い精度の文字認識を“サービス”にしたのだ。自社だけでは集められない多くの文字、多くの帳票を学習しているので、高い精度の認識エンジンを利用できる。

 クラウドサービスの利点を利用して、事前の学習による高い認識精度だけでなく、多くの利用者が認識させた文字や帳票のデータを継続的に学習させる。認識エンジンを成長させていく点も、このサービスの特徴だ。当初は認識がうまくいかなかったクセのある文字も、人の目による修正のデータをAIが学ぶ。次はきちんと読めるようになっていく。

こんな文字が解読可、取り消し線は読まない

 おまかせAI OCRでは、実際にどのような文字が読めるのだろうか。サンプルとして手書き文字とおまかせAI OCRによる認識結果を見てもらいたい。

→作業効率UPをサポート
(くせ字を解読する)

→西日本電信電話株式会社
(手書きの訂正はテキスト化しない)

→大阪府大阪市中央区
(修正印を認識しテキスト化しない)

→読取精度
(枠からのはみ出しを認識)

 殴り書きのような文字、斜めに傾いたクセの強い文字、記入欄の中で2段以上に書かれた文字など、書類に記入された文字には限りないバリエーションがある。人間でも読み取りが難しい文字でも、おまかせAI OCRの認識エンジンは、過去の大量の文字を学習した成果から上手に読み取る。

 また書類でありがちなのが訂正。誤った文字に2重線を引いたり、斜線や塗りつぶしで文字を消したりして、その近傍に正しい文字を書くあれだ。おまかせAI OCRの認識エンジンは、こうした訂正にも柔軟に対応する。正しい文字だけを認識結果として示してくれる。訂正印を押した修正でも、訂正部分をしっかりと認識して必要な文字列だけを抽出する。印鑑の文字は読まない。非常に賢い。

 これだけのバリエーションの手書き文字を読み取るなら、“OCRは使えない”先入観は捨て去ってもよさそうだ。多くの企業や団体で、紙の書類をデータ化する需要は汎用的にある。担当者が目を凝らして悪筆の文字を読み取りながらパソコンのキーボードに打ち込んでいるなら、おまかせAI OCRで大幅に業務を効率化できるだろう。

月額利用なので利用開始が気軽。中小も手が届く

 しかし、高機能、高精度なAI OCRの利用となると、コストが気になる。AI insideが提供するDX Suiteのプライスリストには、初期費用が22万円(税込)、月額費用(Standard)が11万(税込)の料金が掲げられている。中小企業にとって年間120万円の固定費は、荷が重いケースもある。

 おまかせAI OCRでは、月額3.3万円(税込)からの料金体系を採用し、AI OCRを中小企業でも気軽に利用できるようにしている。3万円ちょっとの月額費用ならば、利用時の負担が少なく、多くの企業にAI OCR利用の間口を広げることになるだろう。低価格に抑えられたのはサービス内容を限定的にしたからだ。利用できる読み取り箇所の数はDX Suiteが5万であるのに対して、おまかせAI OCRは6000となっている。それでも、1つの帳票に「住所」「会社名」「氏名」など読み取り箇所が5つあったとして、月間に1200枚の帳票の認識が可能だ。月に20日の実稼働があるとして、1日に平均60枚の帳票の読み取りが月額費用で賄える。

 さらにスキャナーインターネット環境があれば初期費用が不要なので、気軽に導入できる。AI OCRのように、急速に発展した分野のソリューションやサービスは、実際に体験してみないとその効果やもたらされるメリットを判断しにくい。

 AI OCRは、紙の書類にまつわる業務を一気に効率化するツールになる実力を備えてきた。企業がリーズナブルなAI OCRを導入して、デジタルトランスフォーメーションの実現に取り組める土壌が整ってきた。

※「おまかせAI OCR」は、AI inside株式会社の「DX Suite」を活用している
※「DX Suite」はAI inside株式会社の登録商標

SID : 00102003

執筆=岩元 直久

執筆=岩元 直久

あわせて読みたい記事

連載記事≪注目のAIソリューション≫

PAGE TOP

閉じる
会員登録(無料) ここでしか読めないオリジナル記事が満載
閉じる