import com.ironsoftware.ironpdf.*; import java.io.IOException; import java.nio.file.Paths; // Apply your license key License.setLicenseKey("YOUR-LICENSE-KEY"); // Set a log path Settings.setLogPath(Paths.get("C:/tmp/IronPdfEngine.log")); // Render the HTML as a PDF. Stored in myPdf as type PdfDocument; PdfDocument myPdf = PdfDocument.renderHtmlAsPdf("<h1> ~Hello World~ </h1> Made with IronPDF!"); // Save the PdfDocument to a file myPdf.saveAs(Paths.get("html_saved.pdf"));

使用 IRONPDF FOR JAVA

如何在 Java 中閱讀 PDF 檔案

Name: IronPDF
Brand: Iron Software
Availability: InStock

喬迪·巴迪亞

2023年3月19日

已更新 2024年8月25日

在 Java 中閱讀 PDF 文件可以成為任何專案的核心部分，無論是商業應用程式還是資料分析。借助IronPDF庫，在您的Java專案中整合PDF處理功能比以往任何時候都更容易。

如何在 Java 中讀取 PDF 檔案

安裝 IronPDF 以在 Java 中讀取 PDF 檔案
使用fromFile方法載入現有的PDF文件
從 HTML 字串、文件或 Web URL 渲染新的 PDF
利用 extractAllText 方法從開啟的 PDF 中讀取文字
將提取的 PDF 文本打印到控制台或保存到 Java 中

IronPDF：導入 Java PDF 庫

IronPDF Java PDF 庫概述是軟體開發人員的完美解決方案，他們需要快速從 HTML 生成高品質的可捕捉PDF。該程式庫還提供強大的文件操作工具，使您能夠在IronPDF中對頁面佈局和格式、內容和格式進行動態控制。

讓我們看看如何使用IronPDF庫在Java程式中讀取存儲在路徑上的PDF文件。

使用 IronPDF 閱讀 PDF 文件

第一步是使用Maven安裝IronPDF，更多細節可以參考IronPDF安裝指南。

在 Maven 中安裝 IronPDF

以下是在 Maven 項目中安裝 IronPDF 的步驟：

在您偏好的 IDE 中打開您的 Maven 專案。
在pom.xml文件中，於dependencies部分添加IronPDF庫的依賴。

    :ProductInstall

保存 pom.xml 文件並讓 Maven 下載並安裝 IronPDF 庫。
安裝完成後，您應該能夠在您的專案中匯入並使用 IronPDF 的下列類別和 Apache Tika 解析器。

讀取 PDF 文件的 Java 程式碼

以下是可以使用 IronPDF 庫讀取新文件（無論是否具有表格邊界）的代碼。

import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;

public class Test {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));  
        String text = pdf.extractAllText();
        System.out.println(text);
    }
}

import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;

public class Test {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));  
        String text = pdf.extractAllText();
        System.out.println(text);
    }
}

JAVA

在這個程式中，使用 IronPDF 中的 PdfDocument 類別 來讀取 PDF 檔案的內容。程式的第一行從 IronPDF 函式庫中匯入所需的類別。第二行從 Java 標準庫中導入IOException類。

該程式定義了一個名為Test的公共類別。在這個類中，有一個名為main的public static方法，該方法將一個字符串數組作為參數。

main 方法使用 IronPDF 的 PdfDocument 的 fromFile 方法 來載入位於 "C:\sample.pdf" 的 PDF 文件。此方法返回一個代表 PDF 文件的 PdfDocument 對象。

一旦載入 PDF 文件，程式會調用 [IronPDF 中 PdfDocument 的 extractAllText 方法](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())，從 PDF 文件中提取所有文字。這個方法會返回包含 PDF 文件中所有文字的 String。

提取的文本然後儲存在名為 "text" 的String變數中。此變數可用於處理或顯示 PDF 文件的內容。

最後，程式使用System.out.println方法將提取的文字列印到控制台。

如何在 Java 中讀取 PDF 文件，圖 1: 程式輸出

程式輸出

結論

IronPDF 是在 Java 中读取同一路径或多个不同路径中的 PDF 文件的绝佳解决方案，因为它提供了高性能和许多功能，使 PDF 的开发变得简单。其語法簡單易用。它的 API 允許開發者快速撰寫他們專案所需的程式碼。

探索 IronPDF 授權選項計劃起價只需 $749，對於預算有限的人來說，它是可負擔得起的選擇來提取內容。總體而言，IronPDF 為任何希望在 Java 應用程式中處理 PDF 的 Java 開發人員提供了一個出色的選擇。

喬迪·巴迪亞

立即與工程團隊聊天

軟體工程師

Jordi 最擅長 Python、C# 和 C++，當他不在 Iron Software 發揮技能時，他會進行遊戲編程。他負責產品測試、產品開發和研究，為持續產品改進增添了巨大的價值。多樣化的經驗使他感到挑戰和投入，他說這是與 Iron Software 合作的最喜歡的方面之一。Jordi 在佛羅里達州邁阿密長大，並在佛羅里達大學學習計算機科學和統計學。

< 上一頁
如何在 Java 中添加數位簽名到 PDF

下一個 >
如何在 Java 中旋轉 PDF 文件

使用 Maven 安裝

版本：2025.3.6

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2025.3.6</version>
</dependency>

報告問題

加入我們的漏洞獎勵計劃以獲得 Iron Swag

準備開始了嗎？版本： 2025.3 剛剛發布

查看許可證 >