如何將PDF轉換為HTML

Hairil related to 如何將PDF轉換為HTML
海里海西米·賓·奧馬
2023年7月24日
已更新 2024年12月10日
分享:
This article was translated from English: Does it need improvement?
Translated
View the article in English

將 PDF 轉換為 HTML 提供了多種優勢,包括增強用戶的網頁可達性、適應不同設備的響應性、改進的搜尋引擎優化(SEO)、無縫的網頁整合、通過基於網路的工具和 CMS 進行簡便的內容編輯、跨平台相容性,以及使用動態元素和多媒體的能力。

IronPdf 簡化了在 .NET C# 中將 PDF 轉換為 HTML 的過程。

開始使用 IronPDF

立即在您的專案中使用IronPDF,並享受免費試用。

第一步:
green arrow pointer


PDF 轉 HTML 範例

ToHtmlString 方法主要是為了讓用戶分析現有 PDF 文件中的 HTML 元素而設計的。 它是用於調試或PDF比較目的的實用工具。 除了將 PDF 文件轉換為 HTML 字串之外,我們還提供了一種直接方法,讓使用者可以使用SaveAsHtml方法將 PDF 文件儲存為 HTML 檔案。 這為用戶提供了靈活性,讓他們根據自己的特定需求選擇最合適的方法。

請注意
原始 PDF 中的所有互動式表單字段在生成的 HTML 文件中將不再可用。

範例 PDF 檔案

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

輸出 HTML

整個由SaveAsHtml方法生成的輸出HTML已輸入到下面的網站中。


PDF 到 HTML 高級範例

無論是ToHtmlString方法還是SaveAsHtml方法,都提供多種配置選項。 以下是可用的屬性:

  • BackgroundColor:指定背景顏色。
  • PdfPageMargin:指定頁邊距。

    此外,以下屬性適用於 ToHtmlStringSaveAsHtml 方法中的 'title' 參數。 這將在內容開始處添加一個新標題。 他們不會修改輸入PDF文件的標題或h1。

  • H1Color:指定標題顏色。
  • H1FontSize:指定標題字體大小。
  • H1TextAlignment:指定標題對齊方式,例如左對齊、中心對齊或右對齊。
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

輸出 HTML

整個由SaveAsHtml方法生成的輸出HTML已輸入到下面的網站中。

這些方法將產生包含內聯CSS的HTML字符串。 輸出的 HTML 使用 SVG 術語/標籤,而不是通常的 HTML 標籤。 儘管有這種差異,它仍是一個有效的 HTML 字符串,並且可以在網頁瀏覽器中以相同的方式呈現。 然而,使用者需注意,當使用 RenderHtmlAsPdf 方法渲染的 PDF 文件時,該方法返回的 HTML 字串可能會與輸入的 HTML 不同,這是由於上面提到的原因。

Hairil related to 輸出 HTML
海里海西米·賓·奧馬
軟體工程師
和所有優秀的工程師一樣,Hairil 是一位熱衷學習的人。他正在精進自己對 C#、Python 和 Java 的知識,利用這些知識為 Iron Software 團隊的成員創造價值。Hairil 從馬來西亞的馬來西亞工藝大學加入了 Iron Software 團隊,他在那裡獲得了化學和過程工程學士學位。