using IronPdf; // Disable local disk access or cross-origin requests Installation.EnableWebSecurity = true; // Instantiate Renderer var renderer = new ChromePdfRenderer(); // Create a PDF from a HTML string using C# var pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>"); // Export to a file or Stream pdf.SaveAs("output.pdf"); // Advanced Example with HTML Assets // Load external html assets: Images, CSS and JavaScript. // An optional BasePath 'C:\site\assets\' is set as the file location to load assets from var myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", @"C:\site\assets\"); myAdvancedPdf.SaveAs("html-with-assets.pdf");

PRODUKT-VERGLEICHE

QuestPDF Text aus PDF in C# extrahieren Alternativen vs IronPDF

Name: IronPDF
Brand: Iron Software
Availability: InStock
Rating: 4.87 (307 reviews)

Chipego Kalinda

13. Februar 2025

Teilen Sie:

Für dieses Tutorial werden wir uns ansehen, wie mantext extrahierenaus PDF(Portable Document Format)Dokumente in C# mit zwei verschiedenen PDF-Bibliotheken.

In der heutigen modernen Web-Ära gibt es eine Reihe von Bibliotheken, die in der Lage sind, Text und Bilder aus PDF-Dateien zum Parsen und Lesen zu extrahieren. Heute werden wir zwei leistungsstarke PDF-Bibliotheken verwenden,IronPDF undQuestPDF, um Text aus einer PDF-Datei zu extrahieren. Durch den Vergleich, wie diese beiden Bibliotheken eine einfache Textextraktionsaufgabe verarbeiten, können wir feststellen, welche besser für die Bewältigung solcher fortgeschrittener PDF-Aufgaben geeignet sein könnte. Bevor wir zum Vergleichsabschnitt kommen, werfen wir zunächst einen kurzen Blick auf eine kurze Einführung zu jeder Bibliothek.

QuestPDF

QuestPDF ist eine moderne Open-Source-Bibliothek zur PDF-Erstellung, die speziell für .NET-Entwickler entwickelt wurde. Es nutzt eine moderne deklarative API, die es Nutzern ermöglicht, komplexe PDF-Layouts mit großer Flexibilität und Präzision zu definieren und zu erzeugen. Während sich QuestPDF primär auf die Dokumentenerstellung anstatt auf die Textextraktion konzentriert, bietet es einen sauberen, intuitiven Ansatz zum Erstellen von Dokumenten von Grund auf und zum Manipulieren verschiedener Elemente innerhalb des Dokuments. Dies macht es besonders geeignet für Anwendungen, die benutzerdefinierte, dynamische PDF-Inhalte erfordern.

IronPDF

IronPDF ist eine vielseitige PDF-Verarbeitungsbibliothek, die entwickelt wurde, um die Arbeit mit PDFs in C# einfacher und effizienter zu gestalten. Im Gegensatz zu QuestPDF ist IronPDF speziell für die Erstellung und Bearbeitung von PDFs entwickelt worden. Zu den angebotenen Funktionen gehört PDFverschlüsselung, umfangreiche Unterstützung für die Bearbeitung undanmerkenvorhandene PDFs, Konvertierung verschiedener Dokumente in das PDF-Format, Hinzufügen vonkopfzeilen und Fußzeilen (die verwendet werden können, um Seitenzahlen anzuzeigen), Bearbeitung von Dokumentmetadaten, Multithreading- & asynchrone Unterstützung sowie fortschrittliche PDF-Konvertierungswerkzeuge.

Zusätzlich zu seinem umfangreichen Funktionsumfang bietet IronPDF vollständige plattformübergreifende Unterstützung und unterstützt .NET 5/6/7, .NET Core und .NET Framework. Es ist auch vollständig kompatibel mit Windows, macOS, Linux und Cloud-Plattformen wie Azure und AWS, was es zu einer ausgezeichneten Wahl für plattformübergreifende .NET-Anwendungen macht.

In unserem heutigen Beispiel werden wir Text aus unserem Beispiel-Rechnungs-PDF-Dokument mit beiden Bibliotheken extrahieren.

QuestPDF Extrahieren Sie Text aus PDF in C#-Alternativen vs IronPDF: Abbildung 1

Zuerst werden wir schauen, ob QuestPDF diese Aufgabe bewältigen kann.

Text aus einer PDF-Datei extrahieren mit QuestPDF

Leider, obwohl QuestPDF bei der PDF-Erstellung und der Durchführung bestimmter PDF-Aufgaben hervorragend ist, gehört die Textextraktion nicht zu den Funktionen, die es derzeit anbietet. Obwohl QuestPDF nicht von Natur aus für die Extraktion von Text aus bestehenden PDF-Dateien ausgelegt ist, bietet es grundlegende Tools zur Arbeit mit PDFs, die mit zusätzlicher Logik oder Drittanbieter-Integrationen für die Textextraktion erweitert werden können. Zum Beispiel könnte QuestPDF verwendet werden, um PDF-Dokumente mit strukturiertem Inhalt zu erstellen, und Sie könnten eine maßgeschneiderte Lösung implementieren, um Inhalte basierend auf der Struktur des Dokuments mithilfe einer Drittanbieterbibliothek zu extrahieren.

Text aus einer PDF-Datei mit IronPDF extrahieren

Text-Extraktionist nur eine der Aufgaben, in denen IronPDF bei der Arbeit mit PDFs glänzt. Mit nur wenigen Codezeilen können wir Text aus einem gesamten PDF-Dokument extrahieren. Dies kann im folgenden Code-Snippet gesehen werden:

using IronPdf;
public class Program
{
    public static void main(string[] args)
    {
        PdfDocument pdf = PdfDocument.FromFile("exampleInvoice.pdf");
        string text = pdf.ExtractAllText();
        Console.WriteLine(text);
    }
}

using IronPdf;
public class Program
{
    public static void main(string[] args)
    {
        PdfDocument pdf = PdfDocument.FromFile("exampleInvoice.pdf");
        string text = pdf.ExtractAllText();
        Console.WriteLine(text);
    }
}

Imports IronPdf
Public Class Program
	Public Shared Sub main(ByVal args() As String)
		Dim pdf As PdfDocument = PdfDocument.FromFile("exampleInvoice.pdf")
		Dim text As String = pdf.ExtractAllText()
		Console.WriteLine(text)
	End Sub
End Class

$vbLabelText $csharpLabel

Ausgabe-Datei

QuestPDF Extrahiere Text aus PDF in C# Alternativen vs IronPDF: Abbildung 2

Vergleich

IronPDF bietet eine einfache API zum Extrahieren von Text, was es ideal für Entwickler macht, die auf Effizienz achten. In nur drei Zeilen konnten wir den Textinhalt aus unserem PDF-Dokument extrahieren und zur Ansicht anzeigen. Von hier aus können Sie den extrahierten Text einfach für die weitere Verwendung oder Bearbeitung speichern.

QuestPDF hingegen konnte eine Aufgabe wie die Textextraktion nicht bewältigen, da es über weniger Funktionen verfügt als Bibliotheken wie IronPDF. Während es andere Aufgaben wie die PDF-Erstellung und grundlegende Manipulation bewältigen kann, müssten Sie externe Bibliotheken implementieren, um Text zu extrahieren.

Schlussfolgerung

Wenn es darum gehtextrahieren von Text. QuestPDF ist kostenlos über die Verwendung seiner Community-Lizenz für private Projekte, bietet jedoch auch die Option fürkommerzielle Lizenzen.

Beide Bibliotheken sind genau und zuverlässig, aber die Wahl hängt letztendlich von den Anforderungen Ihres Projekts ab.

Für einen tieferen Vergleich dieser Bibliotheken, lesen Sie den vollständigen Blog aufIronPDF vs QuestPDF.

Chipego Kalinda

Jetzt mit dem Ingenieurteam chatten

Software-Ingenieur

Chipego hat eine natürliche Fähigkeit zum Zuhören, die ihm hilft, Kundenprobleme zu verstehen und intelligente Lösungen anzubieten. Er trat dem Iron Software-Team 2023 bei, nachdem er einen Bachelor of Science in Informationstechnologie erworben hatte. IronPDF und IronOCR sind die beiden Produkte, auf die sich Chipego konzentriert hat, aber sein Wissen über alle Produkte wächst täglich, da er neue Wege findet, Kunden zu unterstützen. Er genießt die Zusammenarbeit bei Iron Software, da Teammitglieder aus dem gesamten Unternehmen ihre unterschiedlichen Erfahrungen einbringen und so zu effektiven, innovativen Lösungen beitragen. Wenn Chipego nicht an seinem Schreibtisch sitzt, kann man ihn oft bei einem guten Buch oder beim Fußballspielen antreffen.

< PREVIOUS
QuestPDF PDF-Dokumente signieren vs IronPDF (Codebeispiel)

NÄCHSTES >
C# PDF SDK Vergleich (Kostenlose & Kostenpflichtige Tools)