PDF zu HTML
Genau wie IronPDF pixelgenaue PDF-Dateien aus HTML-Inhalten erzeugen kann, kann es auch verwendet werden, um PDF-Dokumente in HTML zu konvertieren. Durch die Verwendung der Klassen PdfDocument
und HtmlFormatOptions
erhalten Benutzer Zugriff auf die notwendigen Methoden zur Umwandlung von PDF in HTML und Kontrolle darüber, wie der endgültige HTML-Inhalt formatiert wird.
5 Schritte zur Umwandlung von PDF in HTML
- PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
string html = pdf.ToHtmlString();
pdf.SaveAsHtml("myHtml.html");
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
Um eine PDF-Datei in HTML zu konvertieren, müssen wir zuerst die PDF-Datei, die wir konvertieren möchten, mit der Methode
FromFile
über diePdfDocument
-Klasse laden. Diese Methode übernimmt den Dateinamen/den Dateispeicherort, den wir ihr übergeben, und lädt ihn in unser neuesPdfDocument
-Objekt, pdf. Nun können wir einfach auf dieses Objekt verweisen, wann immer wir darauf für den Konvertierungsprozess zugreifen möchten.Als nächstes demonstrieren wir die erste Methode zur Umwandlung eines PDF-Dokuments in HTML. Diese Methode nimmt die PDF und wandelt sie in ein einfaches HTML-String-Objekt um, das dann auf der Konsole angezeigt werden kann und je nach den Bedürfnissen des Entwicklers weiter manipuliert werden kann. Die nächste Zeile demonstriert die andere Methode, mit der wir die PDF-Datei in eine HTML-Datei umwandeln, bereit für komplexere Arbeiten oder zum Teilen, im Vergleich zum einfachen HTML-String. Beide Methoden erfordern nur eine einzige Zeile, um den Umwandlungsprozess selbst durchzuführen, wodurch sie einfach und effizient zu verwenden sind.
Schauen wir uns nun ein fortgeschritteneres Beispiel an, bei dem wir die
HtmlFormatOptions
-Klasse verwenden und deren Methoden nutzen, um die endgültige HTML-Ausgabe zu manipulieren und anzupassen. Mit dieser Klasse können Sie verschiedene Aspekte der HTML-Ausgabe anpassen, wie z. B. die Hintergrundfarbe und die Überschrift(H1)Farbe, H1-Textausrichtung, Seitenränder und mehr. Zuerst müssen wir eine neue Instanz dieser Klasse erstellen, die wir htmlformat genannt haben.Als nächstes ändern wir die Hintergrundfarbe auf Weiß, während wir die H1-Textfarbe auf Blau setzen. Dies wird erreicht, indem auf die Klasse
IronSoftware.Drawing.Color
zugegriffen wird. Dann werden wir die H1-Schriftgröße anpassen(in Pixeln angegeben)um unseren Bedürfnissen gerecht zu werden und es auf 25 festzulegen. Die nächste Anpassung, die wir vornehmen möchten, ist die Ausrichtung des H1-Textes zu spezifizieren und auf zentriert einzustellen. Die letzte Anpassung, die wir hier vornehmen werden, ist das Festlegen der PDF-Seitenränder im HTML-Dokument.(wieder in Pixeln)bis 10.Der letzte Schritt in diesem Prozess besteht darin, wie zuvor die Methode zur Umwandlung von PDF in HTML zu verwenden, wobei wir diesmal mehr Parameter übergeben haben. Der erste Punkt ist der Name und der Speicherort, an dem wir unser neu generiertes HTML-Dokument speichern möchten, genau wie zuvor. Das zweite ist das Setzen eines Booleschen Wertes, fullContentWidth, auf true, was den PDF-Inhalt im HTML auf volle Breite setzen wird. Der nächste Parameter ist der Titel für die HTML-Ausgabe, gefolgt von der abschließenden Anwendung der benutzerdefinierten Einstellung, die wir zuvor für die HTML-Ausgabe erstellt haben.