テクノロジー・動画・写真・デザインとか

Googleの画像文字認識変換OCR機能

Googleの技術に色々と依存しているのだが、そんなGoogleの技術の一つ、画像から文字を認識変換してくれる「OCR」機能を使ってみた。

OCRとは、Optical Character Reader の略で光学式文字読取装置のことで、実際にはGoogleの文字認識は装置は要らず画像をアップロードするだけで文字を読み取ってGoogle Docsに変換してくれる便利な機能だ。

精度の高い結果を得るために

精度の高いOCR結果を得るためには、以下の注意が必要。
・解像度は高い方がいい
・光度が均一でコントラストがハッキリとした画像を使うと精度の高い結果が得られる
・画像のブレや焦点があっていないと、検出のクオリティは下がる
・画像やPDFファイルの最大サイズは2MB

最近のスマホなどで撮影した画像でも綺麗に認識してくれるので、予め綺麗に撮影しておこう。
今回はスマホで雑誌の一部分を撮影してトリミングしたものをこんな感じで撮影してみた。
スマホで撮影した英文

続きを読む

OCR認識のやり方

実際の使い方は簡単だ。
まずはGoogleドライブにアクセスしてログイン。

そしたら「マイドライブ」のプルダウンメニューから、「ファイルをアップロード」と選択して、認識させたいファイルを選択してアップロード。
Chromeの場合には、ファイルをドラッグ&ドロップでで素早くアップロードできる。
マイドライブを選択

アップロードしたら画像を右クリックして、「アプリで開く」、「Googleドキュメント」と選択。
アップロードしたファイルを右クリック

そんで、うまく認識されるとGoogle Docsにこんな風に画像と共に表示される。
OCR認識された画像

もう一度比較してみると分かるだろうが、ほぼ綺麗に認識してくれているのが分かる。
スマホで撮影した英文

After Jan Nielsen and Ole Lund graduated from the Danish School of Contemporary Design in 1995, they established the 2GD-studio in 1996. The name 2 refers to their collaborate method of working, when one part say one thing the other part takes it and pushes it in a different direction. Their acitivity’s field are not only in art, design but fashion. They are aiming to fuse the progressions of design together the impulses of surrounding society.They base their work on an ideology that views style as the surface of meaning, and meaning as the essence of style. They believe that true style comes from the inside, and that their function is not that much different from the midwife.

日本語での文字認識もこんな感じでイケる。
日本語での文字認識

ちなみにiPhoneならこのアプリが高精度で認識されるのでお薦めだ。

カテゴリ:Google, Webサービス