AI OCR製品はやはり伊達ではなかった!

Azureの「Computer Vision API」で実務文書のAI OCRを試みて、見事に返り討ちにあってから約2ヶ月 ―
Watsonなんかも試してみようかと思いましたが、自作RPAの方がやたらと忙しくなり、全く手を付けられず。。。

そんな中、元々取引のあるとあるベンダーの営業から、ちょうどAI OCR製品の提案が最近あったので、話を聞いてみることにしました。

ちなみに、そのベンダーは自体が開発した製品ではなく、他社が開発したものの販売代理店&PoC受託が飯のタネとのこと。
RPAツールにしてもそうですが、まぁよくある話です。

とりあえず、パンフレットなんかを説明してもらって、ちょこちょこ質問。
と言っても、AI OCRについては、セミナーなんかも含めて常にアンテナは張っていますので、特に真新しい情報はありません。

しかし、せっかくの機会ですので、Azureで玉砕した手書き文書をどのぐらいの精度で読み取れるのか、試してもらうことにしました。
いくつかサンプル画像を送付してみて、待つこと約一週間。。。

結果が出たとのことで、SEと一緒に再度来社してもらいました。

そして、プロジェクタに映し出された読み取り結果のCSVデータを固唾をのんで見てみる・・・

す、す、すごい!!

当社用の学習は当然やっておらず、帳票設定もあまり細かいことはしていないとのことでしたが、それでも最低でも識字率は80%以上ありそう。

スタンドアロンで動作する上、推奨スペックは一昔前のPCレベルなので、高価なサーバ機など用意する必要もナシ。
ちなみに、イマドキの普通スペックPCだと、1枚読み取るのに30秒程度でした。
まぁ、このレベルなら、夜間バッチで夜通し読み込みさせれば問題無いので、十分な性能です。

う~ん、市販AI OCR製品・・・恐るべし。

尚、Computer Vision APIなどの無料の文字認識サービスがダメな点は、何と言っても項目指定ができないこと。
項目指定ができないので、「この項目は数値のみ」「この項目は英数字のみ」といった指定ができず、文書中の全ての文字に対して、英数記号+日本語のどの文字に近いかを判定するハメになります。
そうすると、候補文字がいくつも該当してしまうので、結果として誤読率が上がってしまうのです。

例えば、「1」と「I」と「|」って、手書きだと殆ど区別はつきません。
でも、金額欄とか時刻欄のような数字しか書かない項目なら「1」しか有り得ませんし、英字のみの項目に書いてあるなら「I」しか有り得ないでしょう。

このように、項目ごとに読み取り属性が指定できることは、識字率の向上において最も重要な要素なので、無料サービス達もここに対応してほしいのですが・・・
タダだから、そんな要求はさすがに厚かましいか。(苦笑)


スポンサーリンク


デモで読み取り過程の画像も見せてもらったのですが、何と罫線が全て消されています。これは、罫線と被ったりすると文字が認識しづらくなるので、事前処理として罫線を消す処理を行うようにしているとのこと。

しっかし、よく数字の「1」や漢数字の「一」と罫線の区別がつくな、コレ。

もちろん、この罫線認識にもAIが使われているのでしょうが、器用なことに罫線のみがほぼ100%消えています。
しかも、手書き文字が枠をはみ出していて、文字と被ってしまっている罫線すらもキッチリと消去される徹底ぶり。
これだけキレイに罫線が無くなれば、確かに文字認識の精度は上がるでしょう。

実際、Azureで文字認識を試したときも、罫線を「1」だの「I」だの、果ては「|」(パイプ)として読み取りやがりましたから、OCRにおいて罫線は邪魔以外の何物でもないのです。

ということで、AI OCR製品に関しては、セミナーや世間の評判は正しかったということが実証されました。
が、AIの悲しいところですが、学習を重ねると、大抵どの製品も95%を超える識字率になってしまうのです。

それはつまり、機能で差がつきにくいので、結局は価格競争になってしまうということ。

当然、うちの会社においても、今回の結果を受けてAI OCR製品の実力は良く分かったのですが、同時にとにかく安い製品を探し始めるという結果に。(笑)

相場的には、月額20万円~の製品が多そうです。
が、RPAツール市場と同様に、少し待てばすんごい安い製品が出てくる可能性も大いにあります。

どこかのベンダーが月額5万円ぐらいで提供するような事態になれば、恐らく当社はすぐにでも食い付くと思います。
でも、それを皮切りにして、一気に過当競争に陥ってしまいそうな気も・・・

AI OCR製品を開発しているベンダーが少ないのは、意外とこれが原因なのかもしれませんね。

コメントの投稿

非公開コメント

プロフィール

Author:たみおと
36歳にして社内SEに転職しました。
ベンダーSE・社内SEどちらの方が記事を読んでも、ご参考になる体験談をUPしていきたいと思っていますので、宜しくお願い致します。

ブログランキング
よろしければ、ポチっと一押しお願いします。m(__)m

ブログランキング・にほんブログ村へ
カテゴリ
よく読まれている記事
最新記事
おすすめ書籍
[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

なぜ、システム開発は必ずモメるのか? [ 細川義洋 ]
価格:2160円(税込、送料無料) (2016/11/7時点)



[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

絵で見てわかる RPAの仕組み (絵で見てわかる) [ 西村 泰洋 ]
価格:2786円(税込、送料無料) (2018/7/30時点)



月別アーカイブ
検索フォーム
リンク