PDFをHTMLに変換
IronPDFがHTMLコンテンツからピクセルパーフェクトなPDFファイルを生成できるのと同様に、PDFドキュメントをHTMLに変換するためにも使用できます。 PdfDocument
クラスと HtmlFormatOptions
クラスを使用することで、ユーザーはPDFをHTMLに変換するために必要なメソッドにアクセスでき、最終的なHTMLコンテンツのフォーマットを制御することができます。
PDFをHTMLに変換する5つのステップ
PdfDocument pdf = PdfDocument.FromFile(sample.pdf);
string html = pdf.ToHtmlString();
-
pdf.SaveAsHtml(myHtml.html);
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
-
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
PDFファイルをHTMLに変換し始めるには、まず
PdfDocument
クラスを使用してFromFile
を通じて変換したいPDFを読み込む必要があります。 このメソッドは、渡されたファイル名/ファイル場所を取得し、新しいPdfDocument
オブジェクトpdfにロードします。 これで、変換プロセスのためにこのオブジェクトにアクセスしたいときは、簡単に参照することができます。次に、PDF ドキュメントを HTML に変換する最初の方法を示します。 このメソッドはPDFを受け取り、シンプルなHTML文字列オブジェクトに変換します。その後、このオブジェクトはコンソール上に表示され、開発者のニーズに応じてさらに操作する準備が整います。 次の行は、PDFをHTMLファイルに変換する別の方法を示しています。これは、単純なHTML文字列と比較して、より複雑な作業や共有に適しています。 これらの方法はいずれも、変換プロセスを実行するために単一の行のみを必要とするため、効率的に使用するのが簡単です。
次に、
HtmlFormatOptions
クラスを使用して、最終的なHTML出力を操作およびカスタマイズする方法を説明する、より高度な例を見てみましょう。 このクラスを使用すると、背景色や見出しなど、HTML出力のさまざまな側面をカスタマイズできます。(H1)色、H1のテキスト配置、ページマージン、その他。 まず、このクラスの新しいインスタンスを作成する必要があります。それをhtmlformatと名付けました。次に、背景色を白に変更し、H1テキストの色を青に設定します。 これは
IronSoftware.Drawing.Color
クラスにアクセスすることで行われます。 次に、H1フォントサイズを調整します。(ピクセルで指定)私たちのニーズに合わせるために、それを25に設定します。次に行いたいカスタマイズは、H1テキストの配置を指定し、それを中央揃えに設定することです。 ここで行う最終的なカスタマイズは、HTMLドキュメント内のPDFページの余白を設定することです。(ピクセルで再び)から10まで。このプロセスの最終段階は、前回と同じ方法でPDFをHTMLに変換することです。ただし、今回はより多くのパラメータを渡しています。 最初は、新しく生成されたHTMLドキュメントを保存したい名前と場所です。前回と同様です。 2つ目は、ブール値のfullContentWidthをtrueに設定することです。これにより、HTML内のPDFコンテンツが全幅に設定されます。 次のパラメーターはHTML出力のタイトルで、最後に先に作成したカスタマイズ設定をHTML出力に適用します。