PRODUKT-VERGLEICHE

iTextSharp Read PDF-Alternativen (Entwickler-Tutorial)

Chipego
Chipego Kalinda
3. April 2024
Teilen Sie:

PDF (Portable Document Format) ist ein weit verbreitetes Dateiformat zum konsistenten und sicheren Teilen von Dokumenten. Das Lesen und Bearbeiten solcher Dateien in C# ist eine häufige Anforderung in verschiedenen Anwendungen, wie z. B. Dokumentenverwaltungssystemen, Berichtstools und mehr. In diesem Artikel werden wir zwei beliebte Bibliotheken für das Lesen von PDF-Dateien in C# vergleichen: IronPDF und iTextSharp (die neueste .NET-Bibliothek iText).

IronPDF ist eine umfassende C#-Bibliothek von Iron Software, die eine breite Palette von Funktionen zum Arbeiten mit PDF-Dateien bietet. Es ermöglicht Entwicklern, PDF-Dokumente nahtlos zu erstellen, zu bearbeiten und zu manipulieren. IronPDF ist für seine Einfachheit und Benutzerfreundlichkeit bekannt und damit eine ausgezeichnete Wahl für Entwickler, die PDF-Funktionen schnell in ihre Anwendungen integrieren müssen.

iTextSharp ist eine weitere beliebte Bibliothek für die Arbeit mit PDF-Dateien in C#. Es gibt sie schon seit geraumer Zeit und sie ist in der Industrie weit verbreitet. iText bietet eine Vielzahl von Funktionen zur Erstellung und Bearbeitung von PDF-Dokumenten. Es ist bekannt für seine Flexibilität und Erweiterbarkeit, wodurch es sich für komplexe Aufgaben im Zusammenhang mit PDF eignet.

Wie man IronPDF vs. iTextSharp verwendet, um PDFs in C#17 zu lesen

  1. Erstellen Sie ein neues C#-Projekt in Visual Studio, um IronPDF mit iTextSharp für das Lesen von PDF-Dateien zu vergleichen.

  2. Installieren Sie IronPDF- und iTextSharp-Bibliotheken in das Projekt.

  3. Lesen Sie PDF-Dateien mit IronPDF.

  4. PDF-Dateien mit iTextSharp lesen.

Voraussetzungen

  1. Visual Studio: Stellen Sie sicher, dass Visual Studio oder eine andere C#-Entwicklungsumgebung installiert ist.

  2. NuGet-Paket-Manager: Stellen Sie sicher, dass Sie NuGet verwenden können, um Pakete in Ihrem Projekt zu verwalten.

Schritt 1: Erstellen Sie ein neues C# 17-Projekt in Visual Studio, um IronPDF mit iTextSharp beim Lesen von PDF-Dateien zu vergleichen

Beginnen Sie mit dem Einrichten einer C#-Konsolenanwendung. Öffnen Sie Visual Studio und wählen Sie Neues Projekt erstellen. Wählen Sie den Typ Konsolenanwendung.

iTextSharp PDF-Lesealternativen (Entwickler-Tutorial): Abbildung 1 - Konsolenanwendung

Geben Sie den Projektnamen wie unten gezeigt an.

iTextSharp PDF-Lesealternativen (Entwickler-Tutorial): Abbildung 2 - Projektkonfiguration

Wählen Sie die gewünschte .NET-Version für das Projekt aus.

iTextSharp Read PDF-Alternativen (Entwickler-Tutorial): Abbildung 3 - Framework

Sobald dies geschehen ist, erstellt Visual Studio ein neues Projekt.

Schritt 2: Installieren Sie IronPDF- und iTextSharp-Bibliotheken in das Projekt

iTextSharp kann über den NuGet Package Manager für iText installiert werden. Die neueste Version ist als iText-Paket erhältlich.

iTextSharp PDF-Lesealternativen (Entwickler-Tutorial): Abbildung 4 - iText

Oder über den Visual Studio Package Manager wie unten gezeigt. Suchen Sie im Paketmanager nach iText und klicken Sie auf Installieren.

iTextSharp PDF-Lese-Alternativen (Entwickleranleitung): Abbildung 5 - NuGet-Paket-Manager

IronPDF kann wie unten gezeigt über den NuGet Package Manager für IronPDF installiert werden.

iTextSharp-Alternativen zum Lesen von PDFs (Entwickler-Tutorial): Abbildung 6 - IronPDF

Oder über den Visual Studio-Paketmanager wie unten gezeigt. Suche im Paketmanager nach IronPDF: C# PDF Library und klicke auf Installieren.

iTextSharp-PDF-Lesealternativen (Entwickler-Tutorial): Abbildung 7 - IronPDF installieren

Schritt 3: Lesen von Text aus einer PDF-Datei mit IronPDF

Fügen Sie den folgenden Code zur Datei program.cs hinzu und erstellen Sie ein PDF-Beispieldokument mit dem folgenden Inhalt.

iTextSharp-Lese-PDF-Alternativen (Entwickler-Tutorial): Abbildung 8 - PDF-Eingabe

using IronPdf;
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#");
// pdfreader reader
ReadUsingIronPDF.Read();
public class ReadUsingIronPDF
{
    public static void Read()
    {
        // read from specific location
        string filename = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        var pdfReader = PdfDocument.FromFile(filename);
        // Get all text to put in a search index using new simpletextextractionstrategy
        var allText = pdfReader.ExtractAllText();
        Console.WriteLine("------------------Text From PDF-----------------");
        Console.WriteLine(allText);
        Console.WriteLine("------------------Text From PDF-----------------");
        var allIMages = pdfReader.ExtractAllImages();
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine($"Total Images={allIMages.Count()}");
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine("------------------one Page Text From PDF page-----------------");
        var pageCount = pdfReader.PageCount;
        for (int page = 0; page < pageCount; page++)
        {
            string Text = pdfReader.ExtractTextFromPage(page);
            Console.WriteLine(Text);
        }
    }
}
using IronPdf;
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#");
// pdfreader reader
ReadUsingIronPDF.Read();
public class ReadUsingIronPDF
{
    public static void Read()
    {
        // read from specific location
        string filename = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        var pdfReader = PdfDocument.FromFile(filename);
        // Get all text to put in a search index using new simpletextextractionstrategy
        var allText = pdfReader.ExtractAllText();
        Console.WriteLine("------------------Text From PDF-----------------");
        Console.WriteLine(allText);
        Console.WriteLine("------------------Text From PDF-----------------");
        var allIMages = pdfReader.ExtractAllImages();
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine($"Total Images={allIMages.Count()}");
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine("------------------one Page Text From PDF page-----------------");
        var pageCount = pdfReader.PageCount;
        for (int page = 0; page < pageCount; page++)
        {
            string Text = pdfReader.ExtractTextFromPage(page);
            Console.WriteLine(Text);
        }
    }
}
Imports IronPdf
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#")
' pdfreader reader
ReadUsingIronPDF.Read()
'INSTANT VB TODO TASK: Local functions are not converted by Instant VB:
'public class ReadUsingIronPDF
'{
'	public static void Read()
'	{
'		' read from specific location
'		string filename = "C:\code\articles\ITextSharp\ITextSharpIronPdfDemo\Example.pdf";
'		var pdfReader = PdfDocument.FromFile(filename);
'		' Get all text to put in a search index using new simpletextextractionstrategy
'		var allText = pdfReader.ExtractAllText();
'		Console.WriteLine("------------------Text From PDF-----------------");
'		Console.WriteLine(allText);
'		Console.WriteLine("------------------Text From PDF-----------------");
'		var allIMages = pdfReader.ExtractAllImages();
'		Console.WriteLine("------------------Image Count From PDF-----------------");
'		Console.WriteLine(string.Format("Total Images={0}", allIMages.Count()));
'		Console.WriteLine("------------------Image Count From PDF-----------------");
'		Console.WriteLine("------------------one Page Text From PDF page-----------------");
'		var pageCount = pdfReader.PageCount;
'		for (int page = 0; page < pageCount; page++)
'		{
'			string Text = pdfReader.ExtractTextFromPage(page);
'			Console.WriteLine(Text);
'		}
'	}
'}
$vbLabelText   $csharpLabel

Code Erläuterung

  1. Um ein Text-PDF zu erstellen, erstellen Sie ein Word-Dokument, fügen Sie den obigen Text in das Word-Dokument ein und speichern Sie es als PDF-Dokument unter dem Namen Beispiel.pdf

  2. Im Code erstellen wir einen PDFReader aus dem Pfad der PDF-Datei und extrahieren den gesamten Text

  3. Die Bilder in PDF können mit der Methode ExtractImages extrahiert werden

  4. Jede Seite in PDF-Dokumenten kann mit der Methode ExtractTextFromPage gelesen werden

Ausgabe

iTextSharp Read PDF Alternativen (Entwickler-Tutorial): Abbildung 9 - Lesen Sie PDF mit IronPDF-Ausgabe

Schritt 3: Lesen von Text aus einer PDF-Datei mit iTextSharp

Um nun den gelesenen Text aus iTextSharp zu vergleichen, fügen Sie den folgenden Code in dieselbe program.cs-Datei ein. Der Einfachheit halber haben wir die Klassen nicht in verschiedene Dateien aufgeteilt.

using IronPdf;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#");
//ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read();
public class ReadUsingITextSharp
{
    public static void Read()
    {
        string pdfFile = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        // Create a PDF reader
        PdfReader pdfReader = new PdfReader(pdfFile);
        iText.Kernel.Pdf.PdfDocument pdfDocument = new iText.Kernel.Pdf.PdfDocument(pdfReader);
        // Extract plain text from the PDF
        LocationTextExtractionStrategy strategy = new LocationTextExtractionStrategy();
        string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
        // Display or manipulate the extracted text as needed
        Console.WriteLine(pdfText);
    }
}
using IronPdf;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#");
//ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read();
public class ReadUsingITextSharp
{
    public static void Read()
    {
        string pdfFile = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        // Create a PDF reader
        PdfReader pdfReader = new PdfReader(pdfFile);
        iText.Kernel.Pdf.PdfDocument pdfDocument = new iText.Kernel.Pdf.PdfDocument(pdfReader);
        // Extract plain text from the PDF
        LocationTextExtractionStrategy strategy = new LocationTextExtractionStrategy();
        string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
        // Display or manipulate the extracted text as needed
        Console.WriteLine(pdfText);
    }
}
Imports IronPdf
Imports iText.Kernel.Pdf
Imports iText.Kernel.Pdf.Canvas.Parser.Listener
Imports iText.Kernel.Pdf.Canvas.Parser
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#")
'ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read()
'INSTANT VB TODO TASK: Local functions are not converted by Instant VB:
'public class ReadUsingITextSharp
'{
'	public static void Read()
'	{
'		string pdfFile = "C:\code\articles\ITextSharp\ITextSharpIronPdfDemo\Example.pdf";
'		' Create a PDF reader
'		PdfReader pdfReader = New PdfReader(pdfFile);
'		iText.Kernel.Pdf.PdfDocument pdfDocument = New iText.Kernel.Pdf.PdfDocument(pdfReader);
'		' Extract plain text from the PDF
'		LocationTextExtractionStrategy strategy = New LocationTextExtractionStrategy();
'		string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
'		' Display or manipulate the extracted text as needed
'		Console.WriteLine(pdfText);
'	}
'}
$vbLabelText   $csharpLabel

Ausgabe

iTextSharp PDF-Lesealternativen (Entwickler-Tutorial): Abbildung 10 - PDF mit iTextSharp lesen Ausgabe

iTextSharp-Einschränkungen

  1. Lernkurve: iTextSharp hat eine steilere Lernkurve, insbesondere für Anfänger.

  2. Lizenzierung: Das Lizenzmodell von iTextSharp ist möglicherweise nicht für alle Projekte geeignet, insbesondere für solche mit Budgetbeschränkungen.

IronPDF Vorteile

  1. Benutzerfreundlichkeit: IronPDF ist bekannt für seine einfache API, die es Entwicklern leicht macht, schnell loszulegen.

  2. Dokumentdarstellung: IronPDF bietet eine genaue Darstellung von PDF-Dokumenten, um sicherzustellen, dass der extrahierte Text dem Original treu bleibt.

Lizenzierung (kostenlose Testversion verfügbar)

Fügen Sie Ihren IronPDF-Lizenzschlüssel in die appsettings.json-Datei ein.

"IronPdf.LicenseKey": "your license key"

Um eine Testlizenz zu erhalten, geben Sie bitte Ihre E-Mail-Adresse an.

Schlussfolgerung

Die Wahl zwischen IronPDF und iTextSharp hängt von den spezifischen Anforderungen Ihres Projekts ab. Wenn Sie eine unkomplizierte und benutzerfreundliche Bibliothek für gängige PDF-Operationen benötigen, ist IronPDF möglicherweise die bessere Wahl. Berücksichtigen Sie Faktoren wie die Komplexität Ihrer Anwendung, Ihr Budget und die Lernkurve, wenn Sie Ihre Entscheidung treffen.

IronPDF wurde entwickelt, um die PDF-Erzeugung nahtlos in Ihre Anwendung zu integrieren und die Konvertierung von formatierten Dokumenten in PDFs mühelos durchzuführen. Mit diesem vielseitigen Tool können Sie Webformulare, lokale HTML-Seiten und andere Webinhalte mit .NET in PDF konvertieren. Die Benutzer können Dokumente bequem herunterladen, per E-Mail versenden oder in der Cloud speichern. Ob Sie Rechnungen, Angebote, Berichte, Verträge oder andere professionelle Dokumente erstellen müssen, IronPDF's PDF-Erstellungsmöglichkeiten haben Sie abgedeckt. Verbessern Sie Ihre Anwendung mit den intuitiven und effizienten PDF-Erstellungsfunktionen von IronPDF.

Chipego
Software-Ingenieur
Chipego hat eine natürliche Fähigkeit zum Zuhören, die ihm hilft, Kundenprobleme zu verstehen und intelligente Lösungen anzubieten. Er trat dem Iron Software-Team 2023 bei, nachdem er einen Bachelor of Science in Informationstechnologie erworben hatte. IronPDF und IronOCR sind die beiden Produkte, auf die sich Chipego konzentriert hat, aber sein Wissen über alle Produkte wächst täglich, da er neue Wege findet, Kunden zu unterstützen. Er genießt die Zusammenarbeit bei Iron Software, da Teammitglieder aus dem gesamten Unternehmen ihre unterschiedlichen Erfahrungen einbringen und so zu effektiven, innovativen Lösungen beitragen. Wenn Chipego nicht an seinem Schreibtisch sitzt, kann man ihn oft bei einem guten Buch oder beim Fußballspielen antreffen.
< PREVIOUS
Wie man PDF-Dokumente in C# mit iTextSharp liest:
NÄCHSTES >
PDFsharp vs. iTextSharp (C# PDF Library Vergleich)