Googleの技術に色々と依存しているのだが、そんなGoogleの技術の一つ、画像から文字を認識変換してくれる「OCR」機能を使ってみた。
OCRとは、Optical Character Reader の略で光学式文字読取装置のことで、実際にはGoogleの文字認識は装置は要らず画像をアップロードするだけで文字を読み取ってGoogle Docsに変換してくれる便利な機能だ。
関連 Google画像検索のやり方/スマホでできない場合の対処法
精度の高い結果を得るために
精度の高いOCR結果を得るためには、以下の注意が必要。
- スマホカメラで撮る場合はなるべく文字が鮮明に写るように撮影する
- スキャナーでスキャンする場合は、文字が鮮明に写る解像度でスキャンする
- 光度が均一でコントラストがハッキリとした画像を使うと精度の高い結果が得られる
- 画像のブレや焦点があっていないと、検出のクオリティは下がる
- 文字の周りが何もない方が良い
今回はスマホで雑誌の一部分を撮影してトリミングしたものをこんな感じで撮影してみた。
OCR認識のやり方
実際の使い方は簡単だ。
まずはGoogleドライブにアクセスしてログイン。
そしたら「マイドライブ」のプルダウンメニューから、「ファイルをアップロード」と選択して、認識させたいファイルを選択してアップロード。
Chromeの場合には、ファイルをドラッグ&ドロップでで素早くアップロードできる。
アップロードしたら画像を右クリックして、「アプリで開く」、「Googleドキュメント」と選択。
そんで、うまく認識されるとGoogle Docsにこんな風に画像と共に表示される。
もう一度比較してみると分かるだろうが、ほぼ綺麗に認識してくれているのが分かる。
After Jan Nielsen and Ole Lund graduated from the Danish School of Contemporary Design in 1995, they established the 2GD-studio in 1996. The name 2 refers to their collaborate method of working, when one part say one thing the other part takes it and pushes it in a different direction. Their acitivity’s field are not only in art, design but fashion. They are aiming to fuse the progressions of design together the impulses of surrounding society.They base their work on an ideology that views style as the surface of meaning, and meaning as the essence of style. They believe that true style comes from the inside, and that their function is not that much different from the midwife.
日本語での文字認識もこんな感じでイケる。
Geminiを使って画像のテキストを抽出する方法
最近のAIの画像認識は格段に向上している。Googleアカウントを持っているなら、GeminiのAIチャットを使うのも手だ。
まずは下記のURLにアクセスしてGoogleアカウントでログインする。
あとは、下記の手順で操作する。
- 画面下部の枠に画像をドラッグアンドドロップする。(スマホの場合は+から画像をアップロードする)
- 「添付画像のテキストを抽出して」と入力する
- 投稿する
関連記事
- Googleドライブとは何か?使い方まとめ【PC編】
- Googleドライブにアップロードする方法【PC編】
- Googleドライブのファイルをダウンロードする方法
- Googleドライブのダウンロードで文字化けした場合の対処法
- Googleドライブでファイルやフォルダを削除する一番楽な方法
- Googleドライブのフォルダ作成・移動の操作方法
- Google「バックアップと同期」の使い方/ダウンロード・インストール・設定など
- 本当に分かってる?!Googleドライブの共有方法
- Googleドライブの容量を増やす&節約する方法
- Google手書き入力のやり方・設定方法(iPhone・Android・Windows・Mac)