Computer Vision APIによる文字認識(OCR)の実験結果①

前回、AIによるOCRの手始めとして、Azureの「Computer Vision API」を試してみました。

テスト用のサンプル画像を読み込ませた感じでは、結構正しく識別できてそうでしたが、果たして業務で使用する文書はどうか。。。

ということで、今回は実際に当社で使われている手書き文書のうち、勤務表を読み込ませてみることにしました。

当社の場合、社員はWEB勤怠を使って打刻をするのですが、パートやアルバイトの方々については、手書きの勤務表が使われています。
理由は、所属長の承認印が必要なためです。

まぁ、ここでも日本のハンコ文化という悪しき風習がムダな業務を生んでいるわけですが、一旦それは置いておきます。

実務で使っている文書の中から、勤務表を最初の実験台に選んだのには、理由があります。

それは、勤務表から読み取ればよい文字は、基本的に数字・記号だけでOKなため、識別の難易度が低いと考えたからです。
逆に言うと、このレベルの文書が上手く読み取れないとなれば、他の文書には適用できないということになります。

さて、では早速勤務表を読み込ませてみよう・・・の前に、事前準備が必要。

前回触れた通り、Computer Vision APIでは、日本語識別モードにすると結果のテキストが1文字ずつ返ってきます。
なので、勤務表の結果をそのままJSONファイルで検証しようとすると、途方もない行数を見ることになってしまい、効率的ではありません。

なので、今回はPostmanではなく、Excel VBAで連携処理と結果の文字結合処理を作りました。
文字結合処理は、前回の最後に書いた「この座標範囲にある文字群は1つの文言と見なし、連結する」というロジックになります。

構想はこの土日で固まっていたので、今日他の業務をやりながらでも、だいたい半日ぐらいでプログラミングできました。

スポンサーリンク


前置きが長くなりましたが・・・いざ実行!

そして項目ごとに結合された文字列を恐る恐る見てみる。。。

結果は、ハーフハーフってとこですかね。(苦笑)

うーん、、、
プレ印字されている数字は完璧に読み取れているんですが、肝心の手書きの認識結果があまり良くないですねぇ。

例えば、"1"の書き方にちょっとクセがあると"["として誤読されてしまうのは、まぁご愛敬。
確かに、そう見えなくもないので。

しかし、なぜか日付によっては、誤読どころか全く読み取られていない日もあったりします。
せめて、多少間違っててもいいから何か読み取ってくれれば、プログラムで補正しようもあるんですが。
全く読み取られていないと、欠勤しているのか読み取りミスなのかが判別できません。
(文字の濃さも、ちゃんと読めているところと同じぐらい)

前回、サンプル画像で試したときの結果が割と良好だっただけに、ちょっと予想外。
ほぼCompute Vision APIで行こうと決めていたのに、どうやらWatsonやGoogleも真剣に試してみた方が良さそうです。

結果は、また後日。

還元率の高いポイントサイトで、ハイペースでポイントが貯まります ポイントサイトのポイントインカム

獲得ポイントの高いアンケートサイトで、効率的にポイントが貯められます infoQ新規会員登録

コメントの投稿

非公開コメント

プロフィール

Author:たみおと
36歳にして社内SEに転職しました。
ベンダーSE・社内SEどちらの方が記事を読んでも、ご参考になる体験談をUPしていきたいと思っていますので、宜しくお願い致します。

検索フォーム
ブログランキング
よろしければ、ポチっと一押しお願いします。m(__)m

ブログランキング・にほんブログ村へ
カテゴリ
よく読まれている記事
最新記事
おすすめ書籍
[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

なぜ、システム開発は必ずモメるのか? [ 細川義洋 ]
価格:2160円(税込、送料無料) (2016/11/7時点)



[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

絵で見てわかる RPAの仕組み (絵で見てわかる) [ 西村 泰洋 ]
価格:2786円(税込、送料無料) (2018/7/30時点)



月別アーカイブ
リンク