如何將PDF轉換為HTML

This article was translated from English: Does it need improvement?
Translated
View the article in English

海里海西米·賓·奧馬

將 PDF 轉換為 HTML 提供各種好處,包括增強用戶的網頁可訪問性、不同設備的響應能力以及改進的搜尋引擎優化。(搜索引擎優化)無縫的網頁整合、通過基於網絡的工具和CMS輕鬆編輯內容、跨平台兼容性,以及利用動態元素和多媒體的能力。

IronPdf 簡化了在 .NET C# 中將 PDF 轉換為 HTML 的過程。

開始使用 IronPDF

立即在您的專案中使用IronPDF,並享受免費試用。

第一步:
green arrow pointer



PDF 轉 HTML 範例

ToHtmlString 方法主要設計用於讓使用者分析現有 PDF 文檔中的 HTML 元素。 它是用於調試或PDF比較目的的實用工具。 除了將 PDF 文件轉換為 HTML 字串之外,我們還提供了一種直接的方法,讓用戶可以使用 SaveAsHtml 方法將 PDF 文件保存為 HTML 文件。 這為用戶提供了靈活性,讓他們根據自己的特定需求選擇最合適的方法。

請注意
原始 PDF 中的所有互動式表單字段在生成的 HTML 文件中將不再可用。

範例 PDF 檔案

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

輸出 HTML

SaveAsHtml 方法生成的所有輸出 HTML 已輸入到下面的網站中。


PDF 到 HTML 高級範例

ToHtmlStringSaveAsHtml 方法都提供了各種配置選項。 以下是可用的屬性:

  • BackgroundColor:指定背景類色。
  • PdfPageMargin:指定頁面邊距。

    此外,以下屬性用於 ToHtmlStringSaveAsHtml 方法中的 'title' 參數。 這將在內容開始處添加一個新標題。 他們不會修改輸入PDF文件的標題或h1。

  • H1Color:指定標題顏色。
  • H1FontSize:指定標題字體大小。
  • H1TextAlignment:指定標題對齊方式,例如左對齊、居中或右對齊。
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

輸出 HTML

SaveAsHtml 方法生成的所有輸出 HTML 已輸入到下面的網站中。

這些方法將產生包含內聯CSS的HTML字符串。 輸出的 HTML 使用 SVG 術語/標籤,而不是通常的 HTML 標籤。 儘管有這種差異,它仍是一個有效的 HTML 字符串,並且可以在網頁瀏覽器中以相同的方式呈現。 然而,使用者需注意,由於上述原因,在使用RenderHtmlAsPdf方法渲染的PDF文件時,此方法返回的HTML字符串可能與HTML輸入不同。

Hairil related to 輸出 HTML

海里海西米·賓·奧馬

軟體工程師

和所有優秀的工程師一樣,Hairil 是一位熱衷學習的人。他正在精進自己對 C#、Python 和 Java 的知識,利用這些知識為 Iron Software 團隊的成員創造價值。Hairil 從馬來西亞的馬來西亞工藝大學加入了 Iron Software 團隊,他在那裡獲得了化學和過程工程學士學位。