話題のサービス使ってみた(第2回)

おまかせAI OCR、文字認識を検証してみた

2020.06.03

クリップについて

 OCR(光学的文字認識)は「手書き文字だと間違いだらけになってしまって使えない」というイメージを持つ方が多い。実際、印刷された活字ならば正しく認識できても、手書き文字となると途端に爆笑の認識結果を吐き出したりする。

 ところがAIの“目”を組み合わせて文字認識するAI OCRが登場。手書き文字も高い精度で読み取れるようになった…と、説明されることが多いわけだが、実際はどうなのか。そこでBiz Clip編集部では、NTT西日本が提供するAI OCRサービスの「おまかせAI OCR with DX Suite」を使って、AIを活用したOCRの使い勝手や読み取り具合の体験レポートをお送りすることにした。前編では使い勝手を実体験。今回は、読み取りがどのぐらい正確にできるのかをチェックしてみる。

 おまかせAI OCRは、クラウド型で提供するAI OCRサービス。帳票や書類をスキャンして画像データ化するスキャナーなどと、ブラウザーからクラウド型のサービスにアクセスするパソコンとインターネット接続環境があれば利用できる(※)。
※利用には「フレッツ 光ネクスト」等やプロバイダーの契約・料金が別途必要

 それでは、実際におまかせAI OCRの手書き文字の読み取りがどのようなものか、検証しよう。

人間が読める文字ならばほぼ間違わない

 おまかせAI OCRを使って複数の人の手書き文字を読み取ってみたのが、下の図だ。サンプルとして読み取った文字が上段に、認識したテキストが下段に表示される。クセ字でも大丈夫そうだ。手書き文字の読み取りが苦手なOCRのイメージとは異なり、正しく読み取りができている。

何人かの文字で住所の入力欄を読み取り。クセ字であってもうまく読み取っている

 

 もちろん、百発百中というわけにはいかなかった。今回のテストの中では、「1泊」の文字を「(三白」と読み取ったところがあった。私たち人間は文脈から「1泊」と読めるが、自然言語解析と組み合わせたAIでも、ちょっと丸い文字は難易度が高かったようだ。

二重線の訂正は反映されているが、「1泊」の文字を「(三白」と認識してしまった

 

 名前や住所、電話番号、数字など、項目ごとに記載される内容を指定できるので、そうした項目ではより正しく認識ができるようだ。下の例のように、住所の指定の欄で実在しない「吉祥寺西町」といった手書き文字を読み取らせると、実在する「吉祥寺本町」という答えを返してくる。書いてある文字そのものを認識するだけでなく、指定した内容に沿った形で正しい答えを探しているのだ。

実在しない住所(吉祥寺西町)が、実在する住所(吉祥寺本町)として認識された

 

複数の行に分かれても、訂正線があってもOK… 続きを読む

続きを読むにはログインが必要です。
まだ会員でない方は、会員登録(無料)いただくと、続きが読めます。

SID : 00151002

執筆=岩元 直久

執筆=岩元 直久

あわせて読みたい記事

連載記事≪話題のサービス使ってみた≫

PAGE TOP

閉じる
会員登録(無料) ここでしか読めないオリジナル記事が満載
閉じる