PDFをHTMLに変換

VB C#

using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;
htmlformat.PdfPageMargin = 10;

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);

IRON VB CONVERTER ERROR developers@ironsoftware.com

Install-Package IronPdf

PDFをHTMLに変換

IronPDFがHTMLコンテンツからピクセルパーフェクトなPDFファイルを生成できるのと同様に、PDFドキュメントをHTMLに変換するためにも使用できます。 PdfDocument クラスと HtmlFormatOptions クラスを使用することで、ユーザーはPDFをHTMLに変換するために必要なメソッドにアクセスでき、最終的なHTMLコンテンツのフォーマットを制御することができます。

PDFをHTMLに変換する5つのステップ

PdfDocument pdf = PdfDocument.FromFile(sample.pdf);

string html = pdf.ToHtmlString();

pdf.SaveAsHtml(myHtml.html);

HtmlFormatOptions htmlformat = new HtmlFormatOptions();
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);

PDFファイルをHTMLに変換し始めるには、まずPdfDocumentクラスを使用してFromFileを通じて変換したいPDFを読み込む必要があります。このメソッドは、渡されたファイル名/ファイル場所を取得し、新しいPdfDocumentオブジェクトpdfにロードします。これで、変換プロセスのためにこのオブジェクトにアクセスしたいときは、簡単に参照することができます。

次に、PDF ドキュメントを HTML に変換する最初の方法を示します。このメソッドはPDFを受け取り、シンプルなHTML文字列オブジェクトに変換します。その後、このオブジェクトはコンソール上に表示され、開発者のニーズに応じてさらに操作する準備が整います。次の行は、PDFをHTMLファイルに変換する別の方法を示しています。これは、単純なHTML文字列と比較して、より複雑な作業や共有に適しています。これらの方法はいずれも、変換プロセスを実行するために単一の行のみを必要とするため、効率的に使用するのが簡単です。

次に、HtmlFormatOptionsクラスを使用して、最終的なHTML出力を操作およびカスタマイズする方法を説明する、より高度な例を見てみましょう。このクラスを使用すると、背景色や見出しなど、HTML出力のさまざまな側面をカスタマイズできます。(H1)色、H1のテキスト配置、ページマージン、その他。まず、このクラスの新しいインスタンスを作成する必要があります。それをhtmlformatと名付けました。

次に、背景色を白に変更し、H1テキストの色を青に設定します。これは IronSoftware.Drawing.Color クラスにアクセスすることで行われます。次に、H1フォントサイズを調整します。(ピクセルで指定)私たちのニーズに合わせるために、それを25に設定します。次に行いたいカスタマイズは、H1テキストの配置を指定し、それを中央揃えに設定することです。ここで行う最終的なカスタマイズは、HTMLドキュメント内のPDFページの余白を設定することです。(ピクセルで再び)から10まで。

このプロセスの最終段階は、前回と同じ方法でPDFをHTMLに変換することです。ただし、今回はより多くのパラメータを渡しています。最初は、新しく生成されたHTMLドキュメントを保存したい名前と場所です。前回と同様です。 2つ目は、ブール値のfullContentWidthをtrueに設定することです。これにより、HTML内のPDFコンテンツが全幅に設定されます。次のパラメーターはHTML出力のタイトルで、最後に先に作成したカスタマイズ設定をHTML出力に適用します。

こちらをクリックして、例、サンプルコード、ファイルを含むハウツーガイドを表示してください >