Cómo convertir PDF a HTML

This article was translated from English: Does it need improvement?
Translated
View the article in English

por Hairil Hasyimi Bin Omar

La conversión de PDF a HTML ofrece varias ventajas, como la mejora de la accesibilidad web para los usuarios, la capacidad de respuesta para distintos dispositivos y la optimización de los motores de búsqueda.(SEO)La integración perfecta en la web, la facilidad de edición de contenidos mediante herramientas basadas en la web y CMS, la compatibilidad entre plataformas y la posibilidad de utilizar elementos dinámicos y multimedia.

IronPdf simplifica el proceso de conversión de PDF a HTML en .NET C#.

Comience con IronPDF

Comience a usar IronPDF en su proyecto hoy con una prueba gratuita.

Primer Paso:
green arrow pointer



Ejemplo de PDF a HTML

El método ToHtmlString está diseñado principalmente para permitir a los usuarios analizar elementos HTML en un documento PDF existente. Sirve como herramienta útil para depurar o comparar archivos PDF. Además de convertir un documento PDF en una cadena HTML, ofrecemos un método directo para que los usuarios guarden un documento PDF como archivo HTML mediante el método SaveAsHtml. Esto proporciona flexibilidad a los usuarios para elegir el enfoque más adecuado en función de sus necesidades específicas.

Atención
Todos los campos de formulario interactivos del PDF original dejarán de funcionar en el documento HTML resultante.

Ejemplo de archivo PDF

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

HTML de salida

Todo el HTML de salida generado a partir del método SaveAsHtml se ha introducido en el sitio web a continuación.


Ejemplo avanzado de PDF a HTML

Tanto el método ToHtmlString como el método SaveAsHtml ofrecen varias opciones de configuración. A continuación figuran las propiedades disponibles:

  • Color de fondo: Especifica el color de fondo.
  • Margen de página de PDF: Especifica el margen de página.

    Además, las siguientes propiedades están pensadas para el parámetro 'title' de los métodos ToHtmlString y SaveAsHtml. Esto añadirá un nuevo título al principio del contenido. No modificarán el título ni el h1 del documento PDF de entrada.

  • H1Color: Especifica el color del título.
  • TamañoFuenteH1F: Especifica el tamaño de la fuente del título.
  • AlineaciónH1Texto: Especifica la alineación del título, como izquierda, centro o derecha.
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

HTML de salida

Todo el HTML de salida generado a partir del método SaveAsHtml se ha introducido en el sitio web a continuación.

Estos métodos producirán una cadena HTML con CSS en línea. El HTML de salida utiliza términos/etiquetas SVG en lugar de las etiquetas HTML habituales. A pesar de esta diferencia, se trata de una cadena HTML válida y puede representarse del mismo modo en un navegador web. Sin embargo, es importante que los usuarios sean conscientes de que la cadena HTML devuelta por este método puede diferir de la entrada HTML cuando se utiliza un documento PDF renderizado con el método RenderHtmlAsPdf, debido a las razones mencionadas anteriormente.

Hairil related to HTML de salida

Hairil Hasyimi Bin Omar

Ingeniero de software

Como todos los grandes ingenieros, Hairil es un ávido aprendiz. Está perfeccionando sus conocimientos de C#, Python y Java, y los utiliza para añadir valor a los miembros del equipo de Iron Software. Hairil se unió al equipo de Iron Software desde la Universiti Teknologi MARA de Malasia, donde se licenció en Ingeniería Química y de Procesos.