PDFからExcelへ特定のデータを抽出する方法

ページ名:PDFからExcelへ特定のデータを抽出する方法

PDF全体をExcel文書に変換する方法はたくさんありますが、データの特定の部分のみを抽出するのは少し難しいです。ありがたいことに、手動でデータをコピー&ペーストしたり、Docparserのような無料のオンラインツールを使ったり、Adobe Acrobat Pro DCやPanaFormaのような有料のツールを使うなど、まだいくつかの方法があります。このWikiHowでは、PDF内の特定のデータをExcelにエクスポートする方法をご紹介します。

方法1

コピー&ペーストを使う

  1. PDFリーダーでPDFを開きます。PDFファイルをダブルクリックすると、macOSのプレビューやWindowsのEdgeなど、デフォルトのPDFリーダーで自動的に開きます。
  2. PDFから抽出したいデータを選択します。セクションの左上から右下にクリック&ドラッグすることでデータを選択できます。セクションがハイライトされます。
  3. データをクリップボードにコピーします。ハイライトされたセクションを右クリックし、コピーを選択します。
    • または、Macの場合はCommand + C、Windowsの場合はControl + Cを押してデータをコピーすることもできます。
  4. エクセル文書を開き、複数のセルを選択します。先ほどと同じように、複数のセルを素早く選択するには、左上のセルから右下のセルまでマウスをクリックしてドラッグします。
    • 必ず、データが収まるだけのセルを選択してください。そうしないと、データの一部しか貼り付けることができません。
  5. データをエクセル文書に貼り付けます。ハイライトされたセルを右クリックし、貼り付けを選択します。いくつかの再フォーマットが必要になるかもしれませんが、PDFのデータがExcelファイルに貼り付けられるはずです!
    • グループとして効果的に貼り付けられない場合は、一行ずつコピーして目的のセルに貼り付けてみてください。
    • MacではCommand + V、WindowsではControl + Vを押してもデータを貼り付けることができます。
方法2

Docparserを使う

  1. .Docparser にアカウントを登録します。Docparserには様々なプランがあり、月に30文書を解析できる無料プランもあります。
    • 既存のGoogleまたはMicrosoftアカウントでサインアップするか、新しいDocparser専用のアカウントを作成するかを選択できます。
  2. Create Document Parserをクリックします。この青いボタンは画面の中央下にあります。
  3. 名前を入力し、テンプレートを選択します。解析したいドキュメントがプリセットのどれにも当てはまらない場合は、一番上の行の真ん中にあるカスタムオプションを選択してください。
    • Docparserのテンプレートには、そのドキュメントのタイプに合わせたルールがあらかじめ用意されていますが、カスタムテンプレートを作成するには、独自のルールを設定する必要があります。
  4. PDFをアップロードし、[続行]をクリックします。PDFファイルをサイトにドラッグ&ドロップするか、アップロードボックスをクリックしてコンピュータ上のファイルを選択します。PDFをアップロードしたら、画面右上の緑色のボタンをクリックします。
    • 同じルールで複数のPDFを変換したい場合は、さらにファイルをアップロードしてください。
  5. 解析ルールのビデオを見るか、スキップしてください。解析ルールにより、DocparserがPDFをどのように読み取り、変換するかを選択することができます。チュートリアルビデオを見たくない場合は、ポップアップウィンドウの右上にある "X "をクリックしてください。
    • ビデオは1分半強の長さですので、PDFの解析をカスタマイズする方法をよりよく理解するためにご覧ください。
  6. 画面に表示されるヒントに従ってください。Docparserはまず、Text Variable Positionルールのプリセットを選択し、ルールに名前を付けます。その後、解析されたデータ、フィルタを追加してデータを絞り込む場所、フィルタされたデータのプレビューを見る方法について説明します。
  7. テキストフィルターを追加し、下の「フィルターされた結果」ボックスを使ってそれぞれを調整します。各ボックスには、対応するフィルタを修正するためのドロップダウンメニューと、データのプレビューが含まれています。
    • 特定のデータを選択するには、「Add Text Filter」をクリックし、「Crop From Start & End」にカーソルを合わせて、ドキュメントの解析の開始点と終了点を設定します。
  8. 解析ルールの保存]をクリックします。この緑色のボタンは画面の右下にあり、小さな白いチェックマークのアイコンが付いています。
  9. 別の解析ルールを作成するか、エディタから離れます。ルールの作成が終了したら、グレーの[構文解析エディタを離れる]ボタンをクリックします。そうでない場合は、青い「別の構文解析ルールを作成する」ボタンをクリックし、ルールの作成を続行します。
  10. 文書名の横にあるチェックボックスをクリックします。黒いチェックマークが表示されます。
  11. アクションを実行]ドロップダウンメニューから[解析キューに移動]を選択します。ドロップダウンメニューは、画面の左上、文書名の真上にあります。
  12. OK]をクリックし、1分待ってからページを更新します。文書が表示されない場合は、まだ解析中である可能性があります。さらに1分待って、ドキュメント・パーサーのタブを切り替えてみてください。
  13. ファイル名を押してください。このボタンはページの左側にあり、アイコンとしてテクノロジーに下向きの矢印が付いています。
  14. エクセルのダウンロードをクリックします。これで、PDFから選択したデータを含むExcel文書ができるはずです!
    • ファイルのダウンロードを開始する前に、サイト上でダウンロードを許可する必要があるかもしれません。
方法3

Adobe Acrobat Pro DCを使用する

  1. 目的のPDFをAcrobatで開きます。AcrobatがデフォルトのPDFリーダーでない場合は、ファイルを右クリックし、[Open With]メニューからAcrobatを選択することで使用できます。
    • Macの場合は「その他...」、Windowsの場合は「別のアプリを選択」をクリックして、「開く」メニューからAcrobatを検索する必要があるかもしれません。
  2. 抽出したいデータを選択します。データを選択するには、セクションの左上から右下へクリック&ドラッグします。セクションがハイライトされます。
  3. 選択部分を右クリックし、「選択部分を別名でエクスポート...」を選択します。新しいウィンドウが表示され、PDFの選択した部分をエクスポートするためのさまざまなオプションが表示されます。
  4. Save As TypeリストからXLSXフォーマットを選択し、Saveをクリックします。これで、PDFの特定のデータを含むExcelスプレッドシートができあがります!
方法4

PanaFormaを使用する

PanaFormaは、データを抽出したい同じ形式の文書が多数ある場合に便利です。

  1. アプリをダウンロードしてインストールします(Windowsのみ) - PanaFormaには1ヶ月の無料トライアルがあり、有料プランを継続する義務はありません。
  2. PanaFormaアプリを開き、フォルダの追加をクリックします。このボタンはアプリウィンドウの左上にあります。フォルダピッカーで、PDFファイルが保存されているコンピュータ上のフォルダを選択します。
  3. フォルダが追加されたら、フォルダ ツリーを展開して、データを抽出する最初の PDF ファイルを探します。ツリー内のファイル名をクリックしてファイルを開きます。こ の フ ァ イ ルを使用 し て、 同 じ 形式を共有す る すべての PDF か ら デー タ を抽出す る ために適用す る テ ン プ レー ト を作成 し ます。
  4. アプリの右側のパネルで、新しいテンプレートに名前を付け、[作成]をクリックします。
  5. マウスを使って、抽出したいページの各データフィールドの周囲に選択ボックスをドラッグします。この例では、5つのデータフィールドが選択されています。
  6. テンプレート内のすべてのデータフィールドを選択したら、右側のパネルで各フィールドに特徴的な名前を付けます。
  7. 次に、テンプレートを必要なPDFすべてに適用します。これを行うには、左側のパネルのファイルツリーで各PDFを選択し、右側のパネルの「既存のテンプレートを適用」ドロップダウンでテンプレートを選択し、「OK」をクリックします。テンプレートの適用後、必要に応じてページ上の各フィールドを移動またはサイズ変更したり、右側のパネルで抽出されたデータ値を手動で編集することができます。
  8. 必要なすべてのPDFにテンプレートを適用したら、アプリの左側にあるナビゲーションボタンを使用して「データ抽出」画面に移動します。左上のツールバーにある「データのエクスポート」をクリックします。まだサブスクリプションをお持ちでない場合は、無料トライアルを開始する必要があります。トライアルは1ヶ月間有効で、トライアル期間中にキャンセルした場合、トライアル終了時に有料プランに進むことはできません。エクスポート・ダイアログには、エクスポートされる行/列、およびファイル形式を制御するためのオプションが多数あります。必要なオプションを選択し、エクスポートをクリックします。ファイルダイアログで、出力ファイルを保存する場所を選択する。エクセルでファイルを開き、抽出されたデータを確認する。
この記事は、CC BY-NC-SAの下で公開された「 How to Extract Specific Data from PDF to Excel 」を改変して作成しました。特に断りのない限り、CC BY-NC-SAの下で利用可能です。

シェアボタン: このページをSNSに投稿するのに便利です。

コメント

返信元返信をやめる

※ 悪質なユーザーの書き込みは制限します。

最新を表示する

NG表示方式

NGID一覧