今度はAI画像認識でOCRに挑戦してみる

AIチャットボット導入の実現が難しくなったのは、前回書いた通りです。
ただ、これでAI関連の取り組みが終了すると、経営層からは非難を浴びそうな気がしたので、代わりのネタを用意しておきました。

それが、今回のタイトルでもある、「AI画像認識を活用した、手書き文字のテキストデータ化」です。

つまり、文書のOCR読み取りをAIでやるってことです。

ご存知の方も多いと思いますが、この分野は今やRPAに並ぶ勢いで市場が伸びています。

特に、日本の役所や銀行、それに民間企業では、とにかく紙で書かせる文書が多い。。
ハンコも押させないといけないからっていうのもあるんでしょうけど、これが長年の間、日本の生産性向上の足枷になってきたのです。

で、当社においても例外ではなく、やはり毎月数百枚に及び手書き文書を回収し、それを見ながら担当者がシステムに手入力していくっていう業務があちらこちらにあるのです。

が、1年ほど前から、このどうしようもないと思われた業務の改善に、クモの糸が垂らされました。

AI画像認識の技術で、画像中の文字だけを抽出することができるようになったのです。
で、これを皮切りに、OCRとして活用しようという動きが盛んになってきています。

一応、市販製品としては、ベンチャー企業のコージェントラボが開発した「tegaki」がかなり評判が良く、導入企業も増えているらしいです。

が、月20万円~かぁ。。。
これを高いと見るか安いと見るかは、対象の手書き文書の枚数によるでしょうねぇ。

これも一応視野には入れつつ、やはりここはチャットボットやRPAと同様に、まず自作で安く仕上げる方法を模索してみましょう。(笑)

スポンサーリンク


現在では、Watsonをはじめ、AzureやGoogle Cloudなんかでも、OCR用のAPIが公開されています。

識字率を調べてみたところでは、Google>Azure>Watsonらしく、Watsonは日本語非対応なので、実質GoogleかAzureになると。
で、Googleは無料枠が月1000トランザクションしかなく、超過後は1000トランザクションごとに300円ぐらいかかります。
で、Azureだと、無料枠は月5000トランザクションで、超過後は1トランザクションごとに0.15円ぐらいずつかかると。

そう考えると、当社の規模ならAzureだとずっと無料で使い続けられそうな気がするので、まずはAzureで試してみることにしました。

早速、Freeプランでアカウントを作り、画像認識サービスであるComputer Vision APIのリソースを作成。
ここで、エンドポイントURLとAPIキーを控えておきます。
ちなみに、ここまでで約5分ぐらい。
(色々説明書きを読みながら進めたので、それがなければ1分ぐらいで終わってしまう・・・)

その後、認識を試してみるために、Postmanをインストールして、ちょこちょこ設定した後、いざ画像を送信。

で、で、できとる・・・(驚)

JSON形式のレスポンスを確認すると、ちゃんと座標位置と抽出された文字が返ってきてました。
しかも、今まで使っていたOCRソフトでは手書き文字が誤認識されることが多かったんですが、かなりの精度で正しく認識されています。

Googleの方がさらに認識率は高いらしいですが、Azureでも十分すぎる結果でした。
ちなみに、ここまでで約20分ほど。

チャットボットのときも思いましたが、ホントもうベンダー要らずの時代が来そうだな、コレ。

最大の懸念点だった認識精度ですが、今回Computer Vision APIを試してみて、あっさりとこの点がクリアされていたところに、時代の流れを感じました。

ちなみに、Computer Vision APIの日本語認識では、1文字ずつしか認識されません。
つまり、「日本語」という文字が書かれた画像を読み取ると、「日」「本」「語」という感じで、1つの文言にならずに分割されてきます。
これは仕様なので、これを自力で連結する仕組みを開発しなければなりません。

考え方としては、認識された文字の座標がセットで返ってくるので、「この座標範囲にある文字群は1つの文言と見なし、連結する」というプログラムを作る感じです。
まさしく、OCRの考え方ですね。

ネットを見ると、結構Pythonで連携プログラムを作っているケースが多いようですが、VBAからでもAPI連携してJSONを解析することが割と簡単に実現可能です。
なので、ユーザーの利便性も考慮し、Excelマクロで諸々のプログラムを開発してみようと思います。

還元率の高いポイントサイトで、ハイペースでポイントが貯まります ポイントサイトのポイントインカム

獲得ポイントの高いアンケートサイトで、効率的にポイントが貯められます infoQ新規会員登録

コメントの投稿

非公開コメント

プロフィール

Author:たみおと
36歳にして社内SEに転職しました。
ベンダーSE・社内SEどちらの方が記事を読んでも、ご参考になる体験談をUPしていきたいと思っていますので、宜しくお願い致します。

検索フォーム
ブログランキング
よろしければ、ポチっと一押しお願いします。m(__)m

ブログランキング・にほんブログ村へ
カテゴリ
よく読まれている記事
最新記事
おすすめ書籍
[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

なぜ、システム開発は必ずモメるのか? [ 細川義洋 ]
価格:2160円(税込、送料無料) (2016/11/7時点)



[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

絵で見てわかる RPAの仕組み (絵で見てわかる) [ 西村 泰洋 ]
価格:2786円(税込、送料無料) (2018/7/30時点)



月別アーカイブ
リンク