Comment convertir un PDF en HTML
La conversion de PDF en HTML offre divers avantages, notamment une accessibilité web améliorée pour les utilisateurs, une réactivité pour différents appareils, une optimisation améliorée pour les moteurs de recherche (SEO), une intégration web transparente, une modification facile du contenu via des outils web et des CMS, une compatibilité multiplateforme, et la possibilité d'utiliser des éléments dynamiques et multimédias.
IronPDF simplifie le processus de conversion de PDF en HTML en .NET C#.
Commencez avec IronPDF
Commencez à utiliser IronPDF dans votre projet dès aujourd'hui avec un essai gratuit.
Commencez à utiliser IronPDF dans votre projet dès aujourd'hui avec un essai gratuit.
Comment convertir un PDF en HTML
- Télécharger la bibliothèque IronPdf pour .NET
- Importer un document PDF existant en utilisant la méthode
FromFile
- Configurez le HTML de sortie à l'aide de la classe HtmlFormatOptions
- Convertir le PDF en une chaîne HTML en utilisant la méthode
ToHtmlString
- Exportez le fichier HTML en utilisant la méthode
SaveAsHtml
Exemple de conversion de PDF en HTML
La méthode ToHtmlString
est principalement conçue pour permettre aux utilisateurs d'analyser les éléments HTML dans un document PDF existant. Il s'agit d'un outil utile pour le débogage ou la comparaison des PDF. En plus de convertir un document PDF en une chaîne HTML, nous proposons une méthode directe pour permettre aux utilisateurs de sauvegarder un document PDF en tant que fichier HTML en utilisant la méthode SaveAsHtml
. Cela permet aux utilisateurs de choisir l'approche la plus appropriée en fonction de leurs besoins spécifiques.
A noter
Exemple de fichier PDF
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
IRON VB CONVERTER ERROR developers@ironsoftware.com
Sortie HTML
L'ensemble du HTML généré par la méthode SaveAsHtml
a été saisi dans le site Web ci-dessous.
Exemple avancé de conversion de PDF en HTML
Les méthodes ToHtmlString
et SaveAsHtml
proposent diverses options de configuration. Vous trouverez ci-dessous les propriétés disponibles :
- BackgroundColor : Spécifie la couleur de fond.
PdfPageMargin : Spécifie la marge de la page.
De plus, les propriétés ci-dessous sont destinées au paramètre 'title' dans les méthodes
ToHtmlString
etSaveAsHtml
. Cela ajoutera un nouveau titre au début du contenu. Ils ne modifieront pas le titre ou le h1 du document PDF d'entrée.- H1Color : Spécifie la couleur du titre.
- H1FontSize : Spécifie la taille de la police du titre.
- H1TextAlignment : Spécifie l'alignement du titre, comme à gauche, au centre ou à droite.
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
IRON VB CONVERTER ERROR developers@ironsoftware.com
Sortie HTML
L'ensemble du HTML généré par la méthode SaveAsHtml
a été saisi dans le site Web ci-dessous.
Ces méthodes produisent une chaîne HTML avec des feuilles de style CSS en ligne. Le code HTML de sortie utilise des termes/balises SVG au lieu des balises HTML habituelles. Malgré cette différence, il s'agit d'une chaîne HTML valide qui peut être restituée de la même manière dans un navigateur web. Toutefois, il est important pour les utilisateurs de savoir que la chaîne HTML renvoyée par cette méthode peut différer de l'entrée HTML lorsqu'on utilise un document PDF qui a été rendu en utilisant la méthode RenderHtmlAsPdf
, en raison des raisons mentionnées ci-dessus.