JAVA向けIRONPDFの使用

JavaでPDFファイルを読み取る方法

ジョルディ・バルディア
ジョルディ・バルディア
2023年3月19日
更新済み 2024年8月25日
共有:

JavaでPDFドキュメントを読み取ることは、ビジネスアプリケーションからデータ分析に至るまで、あらゆるプロジェクトの重要な部分となり得ます。 IronPDFライブラリを使用すると、JavaプロジェクトにPDF処理機能を統合することがこれまでになく簡単になります。

IronPDF: Java PDFライブラリのインポート

IronPDF Java PDFライブラリ概要は、高品質でHTMLから迅速にキャプチャ準備完了のPDFを作成する必要があるソフトウェア開発者にとって最適なソリューションです。 このライブラリはまた、IronPDFでのページレイアウトとフォーマット、コンテンツ、およびフォーマットに対する動的な制御を可能にする強力なドキュメント操作ツールを提供します。

JavaプログラムでIronPDFライブラリを使用して、指定されたパスに保存されているPDFファイルを読み取る方法を見てみましょう。

IronPDFを使ってPDFを読む

最初のステップは、Mavenを使用してIronPDFをインストールすることです。詳細はIronPDFインストールガイドをご参照ください。

MavenにIronPDFをインストール

MavenプロジェクトにIronPDFをインストールする手順は以下の通りです:

  1. お好みのIDEでMavenプロジェクトを開いてください。

  2. pom.xmlファイルで、dependenciesセクションにIronPDFライブラリの依存関係を追加します。
    :ProductInstall
  1. pom.xml ファイルを保存し、Maven が IronPDF ライブラリをダウンロードしてインストールするようにします。

    インストールが完了すると、プロジェクト内でIronPDFの次のクラスおよびApache Tikaパーサーをインポートして使用できるようになります。

PDFドキュメントを読み取るJavaコード

こちらは、IronPDFライブラリを使用して、新しいファイルをタブ境界の有無にかかわらず読み取るためのコードです。

import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;

public class Test {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));  
        String text = pdf.extractAllText();
        System.out.println(text);
    }
}
JAVA

このプログラムでは、IronPDF の PdfDocument クラスを使用してPDFファイルの内容を読み取ります。プログラムの最初の行は、IronPDFライブラリから必要なクラスをインポートします。 2行目はJava標準ライブラリからIOExceptionクラスをインポートします。

プログラムはTestという名前のパブリッククラスを定義します。 クラス内には、public static メソッド main があり、文字列の配列を引数として受け取ります。

mainメソッドは、PdfDocumentクラスのIronPDFのPdfDocumentのfromFileメソッドメソッドを使用して、"C:\sample.pdf"にあるPDFファイルをロードします。 このメソッドは、PDFファイルを表すPdfDocumentオブジェクトを返します。

PDFファイルが読み込まれたら、プログラムはPdfDocumentクラスの[IronPDFのPdfDocumentのextractAllTextメソッド](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())メソッドを呼び出し、PDFファイルからすべてのテキストを抽出します。このメソッドは、PDFファイル内のすべてのテキストを含むStringを返します。

抽出されたテキストは、その後「text」という名前のString変数に格納されます。 この変数を使用して、PDFファイルの内容を処理または表示することができます。

最後に、プログラムはSystem.out.println メソッドを使用して抽出されたテキストをコンソールに出力します。

JavaでPDFファイルを読む方法、図1:プログラム出力

プログラム出力

結論

IronPDFは、Javaで同じパスや複数の異なるパス内のPDFファイルを読み取るための優れたソリューションです。高性能であり、PDFの開発を容易にする多くの機能を提供します。 その構文は分かりやすく、ユーザーフレンドリーです。 そのAPIにより、開発者はプロジェクトに必要なコードを迅速に作成できます。

IronPDFのライセンスオプションを探るプランは$749から始まり、予算を抑えたい方でもアクセスしやすくなっています。 全体として、IronPDFはJavaアプリケーションプログラミングでPDFを扱いたいと考えているJava開発者にとって、優れた選択肢を提供します。

ジョルディ・バルディア
ソフトウェアエンジニア
ジョルディは、Iron Softwareでのスキルを活かしていないときには、ゲームプログラミングをしており、Python、C#、C++に最も堪能です。彼は製品テスト、製品開発、研究の責任を共有しており、継続的な製品改善に大きな価値をもたらしています。この多様な経験は彼を常に挑戦的で魅力的に保ち、彼はIron Softwareで働く一番好きな側面の一つだと言っています。ジョルディはフロリダ州マイアミで育ち、フロリダ大学でコンピューターサイエンスと統計学を学びました。
< 以前
JavaでPDFにデジタル署名を追加する方法
次へ >
JavaでPDFファイルを回転する方法

Mavenでインストール

バージョン:2025.3.6

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2025.3.6</version>
</dependency>