如何將PDF轉換為HTML
將 PDF 轉換為 HTML 提供各種好處,包括增強用戶的網頁可訪問性、不同設備的響應能力以及改進的搜尋引擎優化。(搜索引擎優化)無縫的網頁整合、通過基於網絡的工具和CMS輕鬆編輯內容、跨平台兼容性,以及利用動態元素和多媒體的能力。
IronPdf 簡化了在 .NET C# 中將 PDF 轉換為 HTML 的過程。
開始使用 IronPDF
立即在您的專案中使用IronPDF,並享受免費試用。
如何將PDF轉換為HTML
PDF 轉 HTML 範例
ToHtmlString
方法主要設計用於讓使用者分析現有 PDF 文檔中的 HTML 元素。 它是用於調試或PDF比較目的的實用工具。 除了將 PDF 文件轉換為 HTML 字串之外,我們還提供了一種直接的方法,讓用戶可以使用 SaveAsHtml
方法將 PDF 文件保存為 HTML 文件。 這為用戶提供了靈活性,讓他們根據自己的特定需求選擇最合適的方法。
請注意
範例 PDF 檔案
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
IRON VB CONVERTER ERROR developers@ironsoftware.com
輸出 HTML
SaveAsHtml
方法生成的所有輸出 HTML 已輸入到下面的網站中。
PDF 到 HTML 高級範例
ToHtmlString
和 SaveAsHtml
方法都提供了各種配置選項。 以下是可用的屬性:
- BackgroundColor:指定背景類色。
PdfPageMargin:指定頁面邊距。
此外,以下屬性用於
ToHtmlString
和SaveAsHtml
方法中的 'title' 參數。 這將在內容開始處添加一個新標題。 他們不會修改輸入PDF文件的標題或h1。- H1Color:指定標題顏色。
- H1FontSize:指定標題字體大小。
- H1TextAlignment:指定標題對齊方式,例如左對齊、居中或右對齊。
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
IRON VB CONVERTER ERROR developers@ironsoftware.com
輸出 HTML
SaveAsHtml
方法生成的所有輸出 HTML 已輸入到下面的網站中。
這些方法將產生包含內聯CSS的HTML字符串。 輸出的 HTML 使用 SVG 術語/標籤,而不是通常的 HTML 標籤。 儘管有這種差異,它仍是一個有效的 HTML 字符串,並且可以在網頁瀏覽器中以相同的方式呈現。 然而,使用者需注意,由於上述原因,在使用RenderHtmlAsPdf
方法渲染的PDF文件時,此方法返回的HTML字符串可能與HTML輸入不同。