テック・ガジェット・ショッピングなど

Google OCR機能で画像の文字を認識して読み取りが便利!

Googleの技術に色々と依存しているのだが、そんなGoogleの技術の一つ、画像から文字を認識変換してくれる「OCR」機能を使ってみた。

OCRとは、Optical Character Reader の略で光学式文字読取装置のことで、実際にはGoogleの文字認識は装置は要らず画像をアップロードするだけで文字を読み取ってGoogle Docsに変換してくれる便利な機能だ。

関連 Google画像検索のやり方/スマホでできない場合の対処法

精度の高い結果を得るために

精度の高いOCR結果を得るためには、以下の注意が必要。

  • スマホカメラで撮る場合はなるべく文字が鮮明に写るように撮影する
  • スキャナーでスキャンする場合は、文字が鮮明に写る解像度でスキャンする
  • 光度が均一でコントラストがハッキリとした画像を使うと精度の高い結果が得られる
  • 画像のブレや焦点があっていないと、検出のクオリティは下がる
  • 文字の周りが何もない方が良い

今回はスマホで雑誌の一部分を撮影してトリミングしたものをこんな感じで撮影してみた。

スマホで撮影した英文

OCR認識のやり方

実際の使い方は簡単だ。

まずはGoogleドライブにアクセスしてログイン。

そしたら「マイドライブ」のプルダウンメニューから、「ファイルをアップロード」と選択して、認識させたいファイルを選択してアップロード。

Chromeの場合には、ファイルをドラッグ&ドロップでで素早くアップロードできる。

Googleドライブのマイドライブを選択

アップロードしたら画像を右クリックして、「アプリで開く」、「Googleドキュメント」と選択。

GoogleドライブでOCR

そんで、うまく認識されるとGoogle Docsにこんな風に画像と共に表示される。

OCR認識された画像

もう一度比較してみると分かるだろうが、ほぼ綺麗に認識してくれているのが分かる。

スマホで撮影した英文

After Jan Nielsen and Ole Lund graduated from the Danish School of Contemporary Design in 1995, they established the 2GD-studio in 1996. The name 2 refers to their collaborate method of working, when one part say one thing the other part takes it and pushes it in a different direction. Their acitivity’s field are not only in art, design but fashion. They are aiming to fuse the progressions of design together the impulses of surrounding society.They base their work on an ideology that views style as the surface of meaning, and meaning as the essence of style. They believe that true style comes from the inside, and that their function is not that much different from the midwife.

日本語での文字認識もこんな感じでイケる。

日本語での文字認識

Geminiを使って画像のテキストを抽出する方法

最近のAIの画像認識は格段に向上している。Googleアカウントを持っているなら、GeminiのAIチャットを使うのも手だ。

まずは下記のURLにアクセスしてGoogleアカウントでログインする。

https://gemini.google.com/app

あとは、下記の手順で操作する。

  1. 画面下部の枠に画像をドラッグアンドドロップする。(スマホの場合は+から画像をアップロードする)
  2. 「添付画像のテキストを抽出して」と入力する
  3. 投稿する

GoogleのAIチャットGeminiで画像のテキストを抽出

関連記事

Twitterで共有 Facebookで共有 はてなブックマークに登録 LINEで共有