PDFをHTMLに変換

IronPDFがHTMLコンテンツからピクセルパーフェクトなPDFファイルを生成できるのと同様に、PDFドキュメントをHTMLに変換するためにも使用できます。 PdfDocument クラスと HtmlFormatOptions クラスを使用することで、ユーザーはPDFをHTMLに変換するために必要なメソッドにアクセスでき、最終的なHTMLコンテンツのフォーマットを制御することができます。

PDFをHTMLに変換する5つのステップ

PdfDocument pdf = PdfDocument.FromFile(sample.pdf);

string html = pdf.ToHtmlString();

  • pdf.SaveAsHtml(myHtml.html);

    HtmlFormatOptions htmlformat = new HtmlFormatOptions();

  • pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);

    PDFファイルをHTMLに変換し始めるには、まずPdfDocumentクラスを使用してFromFileを通じて変換したいPDFを読み込む必要があります。 このメソッドは、渡されたファイル名/ファイル場所を取得し、新しいPdfDocumentオブジェクトpdfにロードします。 これで、変換プロセスのためにこのオブジェクトにアクセスしたいときは、簡単に参照することができます。

    次に、PDF ドキュメントを HTML に変換する最初の方法を示します。 このメソッドはPDFを受け取り、シンプルなHTML文字列オブジェクトに変換します。その後、このオブジェクトはコンソール上に表示され、開発者のニーズに応じてさらに操作する準備が整います。 次の行は、PDFをHTMLファイルに変換する別の方法を示しています。これは、単純なHTML文字列と比較して、より複雑な作業や共有に適しています。 これらの方法はいずれも、変換プロセスを実行するために単一の行のみを必要とするため、効率的に使用するのが簡単です。

    次に、HtmlFormatOptionsクラスを使用して、最終的なHTML出力を操作およびカスタマイズする方法を説明する、より高度な例を見てみましょう。 このクラスを使用すると、背景色や見出しなど、HTML出力のさまざまな側面をカスタマイズできます。(H1)色、H1のテキスト配置、ページマージン、その他。 まず、このクラスの新しいインスタンスを作成する必要があります。それをhtmlformatと名付けました。

    次に、背景色を白に変更し、H1テキストの色を青に設定します。 これは IronSoftware.Drawing.Color クラスにアクセスすることで行われます。 次に、H1フォントサイズを調整します。(ピクセルで指定)私たちのニーズに合わせるために、それを25に設定します。次に行いたいカスタマイズは、H1テキストの配置を指定し、それを中央揃えに設定することです。 ここで行う最終的なカスタマイズは、HTMLドキュメント内のPDFページの余白を設定することです。(ピクセルで再び)から10まで。

    このプロセスの最終段階は、前回と同じ方法でPDFをHTMLに変換することです。ただし、今回はより多くのパラメータを渡しています。 最初は、新しく生成されたHTMLドキュメントを保存したい名前と場所です。前回と同様です。 2つ目は、ブール値のfullContentWidthをtrueに設定することです。これにより、HTML内のPDFコンテンツが全幅に設定されます。 次のパラメーターはHTML出力のタイトルで、最後に先に作成したカスタマイズ設定をHTML出力に適用します。

    こちらをクリックして、例、サンプルコード、ファイルを含むハウツーガイドを表示してください >