光学式文字認識(OCR)とは、画像内のテキスト文字を認識することができるソフトウェアを指す言葉で、OCRソフトウェアでは通常、画像からテキストを抽出することができ、これが画像編集の第一歩となります。通常、どのスキャナーにも独自のOCRソフトウェアが付属していますが、それぞれの使用方法は異なります。対照的に、Microsoft OneNoteはMacとWindowsの両方で利用可能で、OCRとテキスト抽出機能を備え、最新のPC、タブレット、スマートフォンで自由に利用できるため、画像からテキストを抽出するプロセスがはるかにシンプルで予測しやすくなっています。OneNoteのすべてのデスクトップ版とモバイル版には、無料版であってもテキスト抽出機能が含まれていますが、画像からテキストを抽出できるのはOneNoteのデスクトップ版のみです。
スキャンしたテキストを抽出する
-
デスクトップPCにOneNoteをダウンロードします。Office.comからダウンロードできます。OCR機能は基本的にどちらも同じです。
-
写真」アイコンをクリックします。このアイコンは OneNote の挿入タブにあります(Mac では「ピクチャ」と表示されます)。OneNoteのインターフェースは、デフォルトでは上部に大きなリボンがあり、「写真」(Macでは「ピクチャ」)アイコンは左側の挿入タブにあります。Macの場合は、画面上部の「挿入」メニューから「写真」を選択することもできます。アイコンをクリックすると、「ピクチャの挿入」ウィンドウが表示されます(Macの場合は「ピクチャを選択」ウィンドウ)。
- タブやアイコンが表示されない場合は、アプリケーションウィンドウの右上にある最小化ボタンのすぐ左にあるリボン表示オプションボタンをクリックし、"タブとコマンドを表示 "を選択します。Macの場合、画面上部のメニューだけで操作できるので、タブは必要ありません。
- ボタンにマウスカーソルを合わせると、ボタンの名前が表示されます。
-
必要な画像を選択します。選択したら、「開く」(Macの場合は「挿入」)をクリックします。カーソルのある場所に画像ファイルが表示されます。
- 文書の印刷物からテキストを抽出するには、画像ではなくファイル印刷を選択することもできます。
- 別の方法として、キーボードの # PrtScr ボタンを押して現在の画面の画像をキャプチャし、Ctrl+V(Mac の場合は ⌘ Cmd+V)を使って文書に貼り付けます。
- 抽出する画像のテキストは、OCRを正しく認識するためにタイプセットする必要があります。
-
画像を右クリックし、"画像からテキストをコピー "を選択します。画像内のテキストがPCのクリップボードにコピーされます。
- Windowsの場合、ステップ2で画像の代わりにファイル・プリントアウトを選択した場合、プリントアウトの1ページを右クリックすると、ここで2つの選択肢が表示されます:「印刷物のこのページからテキストをコピー "または "印刷物のすべてのページからテキストをコピー"-必要な方を選択してください。
-
Ctrl+V(Macの場合は⌘Cmd+V)を使ってテキストをOneNoteに貼り戻し、必要に応じてアプリで編集します。画像を別のプログラムに貼り付けることもできます。
- マウスカーソルでテキストを選択し、Ctrl+C(Macの場合は⌘Cmd+C)を押します。または、テキストを右クリック(Macの場合はCtrl+クリック)して、"コピー "を選択することもできます。
- 抽出したテキストを保存し、デスクトップ版以外のOneNoteからアクセスしている場合、コピー&ペーストの手順は大きく異なります。例えばアンドロイドの場合、コピーしたいテキストの一部を長押しし、左右に表示される「ハンドル」を使ってすべてのテキストを選択し、「コピー」または「切り取り」ボタンを押す必要がある(アイコンはそれぞれ、2つのページが重なったものとハサミのもの)。
-
コピーしたテキストを別のアプリケーションに貼り付ける。Microsoft WordやGoogle Docsはよく使われるアプリケーションだ。そのアプリケーションで新規または既存のドキュメントを開き、Ctrl+V(Macの場合は⌘Cmd+V)を押すだけだ。テキストを貼り付けると、かなり醜く見えるだろう。
- 編集する前にドキュメントを保存しておくと、編集前の元のテキストに戻ることができます。
-
通常通りにテキストを編集し、書式を設定します。例えば、Microsoft Wordの最新バージョンは、Microsoft NotepadやGoogle Docsなどよりもはるかに多くのオプションがあり、コントロールしやすい。
他の抽出ツールを使う
-
使用している抽出ツールを開きます。どの抽出ツールを選んだとしても、そのプロセスでは、画像を抽出ツールで開き、そこからテキストを抽出し、テキストを編集用のドキュメントにコピー&ペーストします。さまざまなタイプのアプリケーションやサービスがあります:
- スキャナ付属のソフトウェア:スキャナをお持ちで、付属のソフトウェアが残っている場合、おそらくOCRテキスト抽出機能が含まれています。スキャナに説明書が付属しているか、比較的最新のスキャナであればオンラインで調べることができるはずだ。
- 無料ウェブサイト:これらの広告主導型だが機能的なウェブサイトでは、通常TIF、GIF、PDF、JPG、BMP、PNG、またはその組み合わせが利用できる。アップロードできるファイルサイズに制限(5MBなど)があることが多い。画像のテキストを含むWord文書やその他のファイルを無料でEメールしてくれるサイトもあれば、単にテキストをコピーして提供してくれるサイトもある。いくつか紹介しよう:
- フリーocr.com
- オンラインocr.net
- 高価なOCRソフトウェア:非常に精度の高いOCR結果が必要な場合のみ、これらを検討してください。TopTenReviews.comまたは同様のサイトで、より人気のあるものを見つけることができます:
- オムニページ・スタンダード
- Adobe Acrobat
- ABBYY Fine Reader
- フリーソフトウェア。これらのソリューションは、大きな画像では動作しない可能性が高く、多くはPDFの最初のページ以上では動作しません:
- フリーOCR
- シンプルOCR
- フリーOCR To Word
-
テキストを抽出するためのツールを使用します。通常、テキストはプレーンテキスト、Word .docフォーマット、またはリッチテキストフォーマット(RTF)のいずれかとして保存することができます。RTF形式は、.docの前身であり、(.docのように)テキストの書式設定、余白、画像などを単一の、ポータブルで共有可能なファイルに保存することができます。RTFファイルは.docファイルよりはるかに大きく、.docはほとんど誰でも見ることができるので(MS Wordには無料のビューワーがあります)、おそらく.docが最善の策でしょう。
-
出来上がったテキストをコピーし、選択した編集ツールに貼り付けます。貼り付けると書式が乱雑になる可能性が高いので、スペースをたくさん削除したり、詰め込まれた単語を分割したりする必要があります。書式の乱れの度合いは、テキストを抽出した画像がどの程度きれいだったかに大きく左右されます。
-
普通にテキストを編集し、書式を設定します。例えば、Microsoft Wordの最新バージョンは、Microsoft NotepadやGoogle Docsなどよりもはるかに多くのオプションがあり、コントロールできる。
コメント
最新を表示する
NG表示方式
NGID一覧