PDFからExcelへの変換ツール
Excelこそが、財務関連のPDFを有効に活用できる場所です。このコンバーターはページ内容を分析し、各テーブルを実際のワークシートとして再構築します。ヘッダー行は第1行に、数値列は「数値」として、日付列は「日付」として設定されます。複数ページからなるテーブルはすべて単一のシートにまとめられ、ヘッダー行は1回だけ繰り返され、それぞれのテーブルは独立したタブに配置されます。
PDFをExcelに変換する方法
-
1
PDFをアップロードしてください
テーブルを含むテキスト型PDF(請求書、明細書、レポートなど)をアップロードします。
-
2
シートの戦略を選択してください
テーブルごとに1枚のシート、またはページごとに1枚のシートを使用します。ワークフローに合った方法を選択してください。
-
3
列の種類を確認します
量の列は自動的に通貨として検出され、日付はISO形式に解析され、テキストはテキストのまま保持されます。
-
4
XLSXをダウンロードします
Excel、Numbers、Google SheetsまたはLibreOfficeで開きます。数式を上部に追加できます。
データ型検出のチートシート
一列に並んだ長々とした文字列ではなく、実際の型を提供することを目指しています:
| パターン | 検出タイプ | サンプルソース |
|---|---|---|
-?[0-9]{1,3}(,[0-9]{3})*(\.[0-9]+)? |
部分番号 | 1,234.56 |
\$-?[0-9,]+\.[0-9]{2} |
貨幣(米ドル) | $1,234.56 |
[0-9]{4}-[0-9]{2}-[0-9]{2} |
ISO日付 | 2025-03-14 |
[0-9]{1,2}/[0-9]{1,2}/[0-9]{2,4} |
米国/EUの発売日 | 03/14/2025 |
| それ以外 | テキスト | Invoice-A122 |
Excelで開く前に
- ロケールが重要です。
es-ESまたはde-DE形式のExcelファイルの場合、ファイル開閉オプションを「システム区切りを使用」に変更してください。そうしないと、1,234.56などの数値がテキストとして表示されます。 - セル内の末尾スペースは自動的に削除されます。必要場合は「セルの空白を標準化」オプションを無効にしてください。 PDFから取得した「結合セル」が分割されます。左上のセルに値が設定され、残りのセルは空白になります。
正しく変換できない項目
テキストが回転しているテーブル、3行以上にわたって重ねられた列ヘッダー、および入力可能なフォームのPDFファイルについては、その後手動での整理が必要となります。このような場合、PDFからテキストへの変換ツールを使用し、その内容をExcelに貼り付けて手作業で分割する方が通常より迅速です。
よくある質問
通常はローカル設定の不一致によるものです。米国のPDFで作成された1,234.56ファイルは、de-DEのExcelファイルではテキストとして読み込まれます。「データ」>「テキストを列に変換」を使用するか、XLSXファイルを自分のローカル設定で再度保存してください。
スキャンしたPDFはまずOCR処理を経ます。300 DPIでスキャンした印刷レシートの精度は高いですが、手書きまたはファックス送付されたレシートは信頼性が低いです。
はい。変換オプションで「テーブルごとのシート」を「ページごとのシート」に切り替えます。PDFページに含まれるテーブルの数に関わらず、各ページにつき1つのタブが表示されます。
はい。PDFファイルおよび生成されたXLSXファイルは一時的なユーザーにのみ保存されており、ダウンロードが完了すると自動的に削除されます。