如何將PDF轉換為HTML
將 PDF 轉換為 HTML 提供了多種優勢,包括增強用戶的網頁可達性、適應不同設備的響應性、改進的搜尋引擎優化(SEO)、無縫的網頁整合、通過基於網路的工具和 CMS 進行簡便的內容編輯、跨平台相容性,以及使用動態元素和多媒體的能力。
IronPdf 簡化了在 .NET C# 中將 PDF 轉換為 HTML 的過程。
開始使用 IronPDF
立即在您的專案中使用IronPDF,並享受免費試用。
立即在您的專案中使用IronPDF,並享受免費試用。
如何將PDF轉換為HTML
PDF 轉 HTML 範例
ToHtmlString
方法主要是為了讓用戶分析現有 PDF 文件中的 HTML 元素而設計的。 它是用於調試或PDF比較目的的實用工具。 除了將 PDF 文件轉換為 HTML 字串之外,我們還提供了一種直接方法,讓使用者可以使用SaveAsHtml
方法將 PDF 文件儲存為 HTML 檔案。 這為用戶提供了靈活性,讓他們根據自己的特定需求選擇最合適的方法。
請注意
範例 PDF 檔案
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
IRON VB CONVERTER ERROR developers@ironsoftware.com
輸出 HTML
整個由SaveAsHtml
方法生成的輸出HTML已輸入到下面的網站中。
PDF 到 HTML 高級範例
無論是ToHtmlString
方法還是SaveAsHtml
方法,都提供多種配置選項。 以下是可用的屬性:
- BackgroundColor:指定背景顏色。
PdfPageMargin:指定頁邊距。
此外,以下屬性適用於
ToHtmlString
和SaveAsHtml
方法中的 'title' 參數。 這將在內容開始處添加一個新標題。 他們不會修改輸入PDF文件的標題或h1。- H1Color:指定標題顏色。
- H1FontSize:指定標題字體大小。
- H1TextAlignment:指定標題對齊方式,例如左對齊、中心對齊或右對齊。
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
IRON VB CONVERTER ERROR developers@ironsoftware.com
輸出 HTML
整個由SaveAsHtml
方法生成的輸出HTML已輸入到下面的網站中。
這些方法將產生包含內聯CSS的HTML字符串。 輸出的 HTML 使用 SVG 術語/標籤,而不是通常的 HTML 標籤。 儘管有這種差異,它仍是一個有效的 HTML 字符串,並且可以在網頁瀏覽器中以相同的方式呈現。 然而,使用者需注意,當使用 RenderHtmlAsPdf
方法渲染的 PDF 文件時,該方法返回的 HTML 字串可能會與輸入的 HTML 不同,這是由於上面提到的原因。