透かしなしで本番環境でテストしてください。
必要な場所で動作します。
30日間、完全に機能する製品をご利用いただけます。
数分で稼働させることができます。
製品トライアル期間中にサポートエンジニアリングチームへの完全アクセス
JavaでPDFドキュメントを読み取ることは、ビジネスアプリケーションからデータ分析に至るまで、あらゆるプロジェクトの重要な部分となり得ます。 IronPDFライブラリを使用すると、JavaプロジェクトにPDF処理機能を統合することがこれまでになく簡単になります。
fromFile
メソッドを使用して既存のPDFドキュメントを読み込むextractAllText
メソッドを使用するIronPDF Java PDFライブラリ概要は、高品質でHTMLから迅速にキャプチャ準備完了のPDFを作成する必要があるソフトウェア開発者にとって最適なソリューションです。 このライブラリはまた、IronPDFでのページレイアウトとフォーマット、コンテンツ、およびフォーマットに対する動的な制御を可能にする強力なドキュメント操作ツールを提供します。
JavaプログラムでIronPDFライブラリを使用して、指定されたパスに保存されているPDFファイルを読み取る方法を見てみましょう。
最初のステップは、Mavenを使用してIronPDFをインストールすることです。詳細はIronPDFインストールガイドをご参照ください。
MavenプロジェクトにIronPDFをインストールする手順は以下の通りです:
お好みのIDEでMavenプロジェクトを開いてください。
pom.xml
ファイルで、dependencies
セクションにIronPDFライブラリの依存関係を追加します。 :ProductInstall
pom.xml
ファイルを保存し、Maven が IronPDF ライブラリをダウンロードしてインストールするようにします。
インストールが完了すると、プロジェクト内でIronPDFの次のクラスおよびApache Tikaパーサーをインポートして使用できるようになります。
こちらは、IronPDFライブラリを使用して、新しいファイルをタブ境界の有無にかかわらず読み取るためのコードです。
import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
public class Test {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
}
}
このプログラムでは、IronPDF の PdfDocument クラス
を使用してPDFファイルの内容を読み取ります。プログラムの最初の行は、IronPDFライブラリから必要なクラスをインポートします。 2行目はJava標準ライブラリからIOException
クラスをインポートします。
プログラムはTest
という名前のパブリッククラスを定義します。 クラス内には、public static
メソッド main
があり、文字列の配列を引数として受け取ります。
main
メソッドは、PdfDocument
クラスのIronPDFのPdfDocumentのfromFileメソッド
メソッドを使用して、"C:\sample.pdf"にあるPDFファイルをロードします。 このメソッドは、PDFファイルを表すPdfDocument
オブジェクトを返します。
PDFファイルが読み込まれたら、プログラムはPdfDocument
クラスの[IronPDFのPdfDocumentのextractAllTextメソッド
](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())メソッドを呼び出し、PDFファイルからすべてのテキストを抽出します。このメソッドは、PDFファイル内のすべてのテキストを含むString
を返します。
抽出されたテキストは、その後「text」という名前のString
変数に格納されます。 この変数を使用して、PDFファイルの内容を処理または表示することができます。
最後に、プログラムはSystem.out.println
メソッドを使用して抽出されたテキストをコンソールに出力します。
プログラム出力
IronPDFは、Javaで同じパスや複数の異なるパス内のPDFファイルを読み取るための優れたソリューションです。高性能であり、PDFの開発を容易にする多くの機能を提供します。 その構文は分かりやすく、ユーザーフレンドリーです。 そのAPIにより、開発者はプロジェクトに必要なコードを迅速に作成できます。
IronPDFのライセンスオプションを探るプランは$749から始まり、予算を抑えたい方でもアクセスしやすくなっています。 全体として、IronPDFはJavaアプリケーションプログラミングでPDFを扱いたいと考えているJava開発者にとって、優れた選択肢を提供します。