PDF轉HTML
就像IronPDF可以處理從HTML內容生成像素完美的PDF文件一樣,它也可以用於將PDF文檔轉換為HTML。 透過使用 PdfDocument
和 HtmlFormatOptions
類別,用戶將能夠使用將 PDF 轉換為 HTML 所需的方法,並可控制最終 HTML 內容的格式化方式。
將 PDF 轉換為 HTML 的 5 個步驟
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
string html = pdf.ToHtmlString();
pdf.SaveAsHtml(myHtml.html);
-
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
要開始將 PDF 文件轉換為 HTML,我們必須先使用
PdfDocument
類別的FromFile
方法載入我們想要轉換的 PDF。 此方法將接受我們傳遞的檔名/檔案位置,並將其載入到我們新的PdfDocument
對象 pdf 中。 現在,我們可以簡單地引用此對象,每當我們想要訪問它以進行轉換過程時。接下來,我們將演示將 PDF 文件轉換為 HTML 的第一種方法。 此方法將 PDF 轉換為簡單的 HTML 字串物件,然後可以在控制台上顯示,準備根據開發人員的需求進一步操作。 下一行演示了另一種方式,我們將 PDF 轉換為 HTML 文件,與簡單的 HTML 字串相比,更適合進行更複雜的工作或分享。 這兩種方法僅需一行就能執行轉換過程,使其易於高效使用。
現在讓我們看看一個更進階的範例,其中我們使用
HtmlFormatOptions
類別及其方法來操作和自訂最終的 HTML 輸出。 使用此類別,您可以自訂 HTML 輸出的不同方面,例如背景顏色、標題(H1)顏色、H1文本對齊、頁邊距等。 首先,我們需要創建這個類的新實例,我們將其命名為htmlformat。接下來,我們將背景顏色更改為白色,同時將 H1 文本顏色設為藍色。 這是通過訪問
IronSoftware.Drawing.Color
類來完成的。 接著,我們將調整 H1 字體大小(以像素為單位指定)以滿足我們的需求,將其設置為25。接下來我們想要進行的自定義是指定 H1 文本對齊,並將其設置為置中。 我們在這裡將進行的最後一項自訂是設置 HTML 文件中的 PDF 頁邊距(以像素再次)到10。此過程的最後一步是使用與之前相同的方法將 PDF 轉換為 HTML,但這次我們傳遞了更多的參數。 首先是我們希望儲存新生成的 HTML 文件的名稱和位置,就像之前一樣。 第二個是將布林值 fullContentWidth 設為 true,這將把 HTML 中的 PDF 內容設置為全寬。 下一個參數是 HTML 輸出的標題,然後最終將我們之前創建的自訂設定應用到 HTML 輸出中。