OCRの続編

Mar 13, 2021
 

Appsheet曰く、「私は手書きの文書も読むことができます。」

 

試してみました。

 

手書きの書類? 周りを見渡しましたが見当たりません。すべてpcにデータとして入っていますので。確かに最近手書きでノートを取るといったことはなくなりました。(少なくとも自身のケース)

 

テストの対象となる手書きの文章をネットで検索したところ出てくるのは芸能人の謝罪文章のコピーばかり。仕方が有りません。芸能人の謝罪文をアップシートに取り込み、テキストデータに取り込んでみました。

 

版権問題があるかもしれずこちらのブログには画像は掲載しませんが、これは面白い結果でした。ネットで「字が汚い」と叩かれていたある女優の反省文。これをAPPSHEETに画像として読ませ、文字起ししたところ、高い精度で読み取れました。WELL DONE!

 

次に作曲家?ゴーストライターで世間を騒がせたあの方の手書きの反省・謝罪文。文章をみてみたところ、父親が書道の師範、でも字が汚く、子供に罵倒される私の目から見てもこの方の筆跡は達筆。但し、上記の女優さんの反省文の読取精度に比べると精度は格段に落ちてしまいました。

 

人間の目から見ると達筆。でもGOOGLEのAPIを使っているアップシートのOCR機能からするとさにあらず?

 

AI、OCRは人間の目に代わるツールとなるのでしょうが、本日現在のテストの結果として人間の感覚との乖離はまだ広い、といった印象です。

 

でも、このあたりのギャップも短期間で埋まっていくのだと思います。

 

テクノロジーの進化って本当に恐ろしいです