Comment convertir un PDF en HTML

Hairil related to Comment convertir un PDF en HTML
Hairil Hasyimi Bin Omar
juillet 24, 2023
Mise à jour décembre 10, 2024
Partager:
This article was translated from English: Does it need improvement?
Translated
View the article in English

La conversion de PDF en HTML offre divers avantages, notamment une accessibilité web améliorée pour les utilisateurs, une réactivité pour différents appareils, une optimisation améliorée pour les moteurs de recherche (SEO), une intégration web transparente, une modification facile du contenu via des outils web et des CMS, une compatibilité multiplateforme, et la possibilité d'utiliser des éléments dynamiques et multimédias.

IronPDF simplifie le processus de conversion de PDF en HTML en .NET C#.

Commencez avec IronPDF

Commencez à utiliser IronPDF dans votre projet dès aujourd'hui avec un essai gratuit.

Première étape :
green arrow pointer


Exemple de conversion de PDF en HTML

La méthode ToHtmlString est principalement conçue pour permettre aux utilisateurs d'analyser les éléments HTML dans un document PDF existant. Il s'agit d'un outil utile pour le débogage ou la comparaison des PDF. En plus de convertir un document PDF en une chaîne HTML, nous proposons une méthode directe pour permettre aux utilisateurs de sauvegarder un document PDF en tant que fichier HTML en utilisant la méthode SaveAsHtml. Cela permet aux utilisateurs de choisir l'approche la plus appropriée en fonction de leurs besoins spécifiques.

A noter
Tous les champs de formulaire interactifs du PDF original ne seront plus fonctionnels dans le document HTML résultant.

Exemple de fichier PDF

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Sortie HTML

L'ensemble du HTML généré par la méthode SaveAsHtml a été saisi dans le site Web ci-dessous.


Exemple avancé de conversion de PDF en HTML

Les méthodes ToHtmlString et SaveAsHtml proposent diverses options de configuration. Vous trouverez ci-dessous les propriétés disponibles :

  • BackgroundColor : Spécifie la couleur de fond.
  • PdfPageMargin : Spécifie la marge de la page.

    De plus, les propriétés ci-dessous sont destinées au paramètre 'title' dans les méthodes ToHtmlString et SaveAsHtml. Cela ajoutera un nouveau titre au début du contenu. Ils ne modifieront pas le titre ou le h1 du document PDF d'entrée.

  • H1Color : Spécifie la couleur du titre.
  • H1FontSize : Spécifie la taille de la police du titre.
  • H1TextAlignment : Spécifie l'alignement du titre, comme à gauche, au centre ou à droite.
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Sortie HTML

L'ensemble du HTML généré par la méthode SaveAsHtml a été saisi dans le site Web ci-dessous.

Ces méthodes produisent une chaîne HTML avec des feuilles de style CSS en ligne. Le code HTML de sortie utilise des termes/balises SVG au lieu des balises HTML habituelles. Malgré cette différence, il s'agit d'une chaîne HTML valide qui peut être restituée de la même manière dans un navigateur web. Toutefois, il est important pour les utilisateurs de savoir que la chaîne HTML renvoyée par cette méthode peut différer de l'entrée HTML lorsqu'on utilise un document PDF qui a été rendu en utilisant la méthode RenderHtmlAsPdf, en raison des raisons mentionnées ci-dessus.

Hairil related to Sortie HTML
Ingénieur logiciel
Comme tous les grands ingénieurs, Hairil est un fervent apprenant. Il affine ses connaissances en C#, Python et Java, et les utilise pour apporter une valeur ajoutée aux membres de l'équipe d'Iron Software. Hairil a rejoint l'équipe d'Iron Software en provenance de l'Universiti Teknologi MARA en Malaisie, où il a obtenu une licence en génie chimique et des procédés.