使用 Python 將多個 PDF 檔案合併成一個 PDF

查克尼思·賓
查克尼思·賓
2023年6月4日
已更新 2024年10月20日
分享:
This article was translated from English: Does it need improvement?
Translated
View the article in English

PDF格式,代表便攜式文件格式,廣泛用於在不同平台和軟件應用程序中以一致的方式顯示文本和圖形。

Python 是一種高階程式語言,它在處理各種電腦系統時提供了多功能性和易用性。 然而,在Python中處理來源PDF文件和輸入流可能會遇到挑戰。 幸運的是,IronPDF 這個 Python 函式庫提供了一個便利的解決方案,可以輕鬆地操作和處理現有的 PDF 檔案。

在本指南中,我們將引導您完成安裝IronPDF Python庫的過程,並展示如何將多個PDF文件合併為一個PDF文件。

IronPDF:Python 函式庫

IronPDF 是一款功能強大的 Python PDF 操作庫。 它使您能够轻松创建、阅读和编辑PDF文件。 使用 IronPDF,您可以從頭開始生成 PDF,使用 HTML、CSS、Javascript 自定義它們的外觀,並添加如標題和作者名稱等元數據。 值得注意的是,IronPDF 支持將多個 PDF 文件無縫合併到一個目標文件中。它提供了一個不依賴外部框架的自包含解決方案。

此外,IronPDF 被設計為跨平台兼容,支持 Windows 和 Linux 上的Python 3.x。 這確保您可以在任何操作環境中利用其功能。

透過 Pip 安裝 IronPDF

要使用 pip 安裝 IronPDF 函式庫,請執行以下命令:

pip install ironpdf

在您的 Python 腳本中,請確保包括以下導入語句,以利用 IronPDF 的功能來生成和合併 PDF 文件

from ironpdf import *
PYTHON

使用 IronPDF 在 Python 中合併兩個 PDF 文件

合併 PDF 檔案的示例涉及兩個步驟:

  • 建立 PDF 檔案
  • 將它們合併成一個最終的PDF文件

    這是一個展示該過程的程式碼範例:

html_a = """<p> [PDF_A] </p>
            <p> [PDF_A] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_A] 2nd Page</p>"""

html_b = """<p> [PDF_B] </p>
            <p> [PDF_B] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_B] 2nd Page</p>"""

renderer = ChromePdfRenderer()

pdfdoc_a = renderer.RenderHtmlAsPdf(html_a)
pdfdoc_b = renderer.RenderHtmlAsPdf(html_b)
merged = PdfDocument.Merge(pdfdoc_a, pdfdoc_b)
PYTHON

在提供的代碼中,創建了兩個HTML字符串,每個代表跨越兩頁的內容。 IronPDF 的 RenderHtmlAsPdf 方法用於將 HTML 字串轉換為單獨的 PDF 文件作為 PdfDocument 物件。

若要合併 PDF 文件,使用 PdfDocument.Merge 方法。 它通過將第二個PdfDocument的內容附加到第一個文件的末尾,將兩個PDF文件合併為一個PDF文件。 結果是一個包含合併內容的新PdfDocument。

保存合併的多個PDF文件

要將合併後的PDF文件儲存到特定的目的檔案路徑,您可以使用以下簡潔的一行程式碼:

merged.SaveAs("Merged.pdf")
PYTHON

合併的 PDF 檔案輸出如下所示:

Python 合併 PDF - 圖 2: 合併多個 PDF 文檔

合併兩個 PDF 文件

合併超過兩個 PDF 文件

要在 Python 中使用 IronPDF 合併兩個以上的 PDF 文件,您可以按照這兩個簡單的步驟操作:

  • 創建一個列表並添加您想要合併的 PDF 的 PdfDocument 對象
  • 將此列表作為單個參數傳遞給PdfDocument.Merge方法

    以下程式碼片段說明了這個過程:

html_a = """<p> [PDF_A] </p>
            <p> [PDF_A] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_A] 2nd Page</p>"""

html_b = """<p> [PDF_B] </p>
            <p> [PDF_B] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_B] 2nd Page</p>"""

html_c = """<p> [PDF_C] </p>
            <p> [PDF_C] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_C] 2nd Page</p>"""

renderer = ChromePdfRenderer()

pdfdoc_a = renderer.RenderHtmlAsPdf(html_a)
pdfdoc_b = renderer.RenderHtmlAsPdf(html_b)
pdfdoc_c = renderer.RenderHtmlAsPdf(html_c)

pdfs = List [PdfDocument]()
pdfs.Add(pdfdoc_a)
pdfs.Add(pdfdoc_b)
pdfs.Add(pdfdoc_c)
pdf = PdfDocument.Merge(pdfs)
pdf.SaveAs("merged.pdf")
PYTHON

在上述代碼中,使用 HTML 渲染方法生成了三個 PDF 文件。 之後,創建了一個新的List集合來存儲這些PDF。 此列表然後作為單一參數傳遞給合併方法,從而將PDF合併成一個單一文件。

Python 合併PDF - 圖3:合併多於兩個PDF文件

合併超過兩個 PDF 文件

結論

本文提供了使用 IronPDF for Python 合併 PDF 檔案的詳盡指南。

我們首先討論IronPDF for Python的安裝過程。 然後,我們探討使用HTML渲染方法生成PDF的直接方法。 此外,我們探討將兩個或多個PDF合併成一個PDF文件。

憑藉其高效的性能和精確的執行,IronPDF 成為 Python 中處理 PDF 文件的絕佳選擇。 利用 IronPDF for .NET 的功能,該庫能夠無縫地從 HTML/URL/字符串轉換為 PDF。 它支持常見的文件類型,如 HTML、CSS、JS、JPG 和 PNG,確保生成高品質的 PDF 文檔。 採用尖端技術構建,IronPDF 是您在 Python 中處理 PDF 相關任務的可靠解決方案。

要深入了解如何使用IronPDF for Python,您可以探索我們豐富的代碼範例集合。

IronPDF 為開發目的提供免費使用,並為商業應用提供授權選項。 如需關於許可證的詳細資訊,請訪問以下連結

下載該軟體產品。

查克尼思·賓
軟體工程師
Chaknith 致力於 IronXL 和 IronBarcode。他在 C# 和 .NET 方面擁有豐富的專業知識,協助改進軟體並支持客戶。他從用戶互動中獲得的洞察力有助於提高產品、文檔和整體體驗。