PDF in HTML konvertieren

Regan Pun
Regan Pun
24. Juli 2023
Aktualisiert 10. Dezember 2024
Teilen Sie:
This article was translated from English: Does it need improvement?
Translated
View the article in English

Die Umwandlung von PDF in HTML bietet verschiedene Vorteile, darunter eine verbesserte Webzugänglichkeit für Benutzer, Reaktionsfähigkeit für verschiedene Geräte, verbesserte Suchmaschinenoptimierung (SEO), nahtlose Web-Integration, einfache Inhaltsbearbeitung durch webbasierten Tools und CMS, plattformübergreifende Kompatibilität sowie die Möglichkeit, dynamische Elemente und Multimedia zu nutzen.

IronPDF vereinfacht den Prozess der Konvertierung von PDF in HTML in .NET C#.

Erste Schritte mit IronPDF

Beginnen Sie noch heute mit der Verwendung von IronPDF in Ihrem Projekt mit einer kostenlosen Testversion.

Erster Schritt:
green arrow pointer


PDF-zu-HTML-Beispiel

Die ToHtmlString-Methode ist hauptsächlich dazu gedacht, Benutzern zu ermöglichen, HTML-Elemente in einem bestehenden PDF-Dokument zu analysieren. Es dient als nützliches Werkzeug für die Fehlersuche oder den PDF-Vergleich. Zusätzlich zur Umwandlung eines PDF-Dokuments in einen HTML-String bieten wir eine direkte Methode an, mit der Benutzer ein PDF-Dokument als HTML-Datei speichern können, indem sie die SaveAsHtml-Methode verwenden. Dies bietet den Nutzern die Flexibilität, den für ihre spezifischen Bedürfnisse am besten geeigneten Ansatz zu wählen.

Bitte beachten Sie
Alle interaktiven Formularfelder in der ursprünglichen PDF-Datei sind im resultierenden HTML-Dokument nicht mehr funktionsfähig.

Beispiel-PDF-Datei

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

HTML-Ausgabe

Der gesamte von der SaveAsHtml-Methode erzeugte HTML-Ausgabe wurde in die unten stehende Website eingegeben.


PDF zu HTML Fortgeschrittenes Beispiel

Sowohl die ToHtmlString- als auch die SaveAsHtml-Methoden bieten verschiedene Konfigurationsoptionen. Nachstehend finden Sie die verfügbaren Immobilien:

  • Hintergrundfarbe: Gibt die Hintergrundfarbe an.
  • PdfPageMargin: Gibt den Seitenrand an.

    Zusätzlich sind die unten aufgeführten Eigenschaften für den 'title'-Parameter in den ToHtmlString- und SaveAsHtml-Methoden vorgesehen. Dadurch wird ein neuer Titel am Anfang des Inhalts hinzugefügt. Sie ändern weder den Titel noch h1 des PDF-Eingabedokuments.

  • H1Color: Gibt die Farbe des Titels an.
  • H1FontSize: Gibt die Schriftgröße des Titels an.
  • H1TextAlignment: Gibt die Ausrichtung des Titels an, wie links, zentriert oder rechts.
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

HTML-Ausgabe

Der gesamte von der SaveAsHtml-Methode erzeugte HTML-Ausgabe wurde in die unten stehende Website eingegeben.

Diese Methoden erzeugen einen HTML-String mit Inline-CSS. Die HTML-Ausgabe verwendet SVG-Begriffe/Tags anstelle der üblichen HTML-Tags. Trotz dieses Unterschieds handelt es sich um eine gültige HTML-Zeichenkette, die in einem Webbrowser auf die gleiche Weise wiedergegeben werden kann. Es ist jedoch wichtig, dass Benutzer sich dessen bewusst sind, dass der zurückgegebene HTML-String aus dieser Methode vom HTML-Eingabewert abweichen kann, wenn ein PDF-Dokument verwendet wird, das mithilfe der RenderHtmlAsPdf-Methode gerendert wurde, aufgrund der oben genannten Gründe.

Regan Pun
Software-Ingenieur
Regan schloss sein Studium an der University of Reading mit einem BA in Elektrotechnik ab. Bevor er zu Iron Software kam, konzentrierte er sich in seinen früheren Jobs auf einzelne Aufgaben. Was ihm bei Iron Software am meisten Spaß macht, ist das Spektrum der Aufgaben, die er übernehmen kann, sei es im Vertrieb, im technischen Support, in der Produktentwicklung oder im Marketing. Es macht ihm Spaß, die Art und Weise zu verstehen, wie Entwickler die Bibliothek von Iron Software nutzen, und dieses Wissen zu nutzen, um die Dokumentation und die Produkte kontinuierlich zu verbessern.