evernoteが日本語の識字率アップに挑戦するらしい

日本語の文字認識精度向上のためのお願い | Evernote Corporation
http://www.evernote.com/about/intl/jp/support/hwr.php

印刷 -> リアル文字記入 -> カメラ撮影かスキャナー -> その画像をメールで送信

って言うめんどくさい手順を踏むにも関わらず、インセンティブ無し。
なかなか、自信の感じられるキャンペーンではある。

でも、ちょうどスキャナ遊びづいてるし、自分のクセ字が(もしかしたら)考慮されるのって「利便性につながるんじゃね?」という暇つぶしも兼ねてトライしてみる。

やってみたが、指定される漢字が難しくて、漢検やってる気分になってきた(やったこと無いけど)。「安曇野」とか読めさえしないし。

で、結果がこれ。

我ながら酷い。まぁ、「自然に」書かないと意味はないんだから、正しい行為なのだが。特に見所は、英数字が枠からはみ出してしまってるところ。「日本人のアルファベット記述力」というものも配慮してもらいたいものだね。

上記のページにはファイルフォーマットの指定だの画像の大きさだの指定(dpiから察することはできるが、スキャン指定でdpi指定ってするかな普通?)は無いのだが、とりあえず読み込んだ生データを、jpegのクオリティ100で送っておく。まぁ、間違ったらペナルティがあるわけでもなし、正しかったら何かもらえるでも無し。

にしても、活字でも難しい日本語OCRが手描きで上手くいくものかね?
このへんの認識データって郵便局が凄まじいノウハウ持ってるんだろうなぁ。外部には出てこないだろうけど。

余談だが、指定文字が妙にウヨサヨしてるのは、ネットからサンプリングしたデータだからなのだろうか。考えすぎか。

EVERNOTE 基本ワザ&便利ワザ

EVERNOTE 基本ワザ&便利ワザ