COMPARAISON DES PRODUITS

alternatives à iTextSharp Read PDF (Tutoriel du développeur)

Chaknith Bin
Chaknith Bin
avril 3, 2024
Partager:

Le PDF (Portable Document Format) est un format de fichier largement utilisé pour partager des documents de manière cohérente et sécurisée. La lecture et la manipulation de tels fichiers en C# est une exigence courante dans diverses applications, telles que les systèmes de gestion de documents, les outils de reporting, etc. Dans cet article, nous allons comparer deux bibliothèques populaires pour la lecture de fichiers PDF en C# : IronPDF et iTextSharp (la dernière bibliothèque .NET iText).

IronPDF est une bibliothèque C# complète de Iron Software qui offre un large éventail de fonctionnalités pour travailler avec des fichiers PDF. Il permet aux développeurs de créer, d'éditer et de manipuler des documents PDF de manière transparente. IronPDF est connu pour sa simplicité et sa facilité d'utilisation, ce qui en fait un excellent choix pour les développeurs qui ont besoin d'intégrer rapidement des fonctionnalités PDF dans leurs applications.

iTextSharp est une autre bibliothèque populaire pour travailler avec des fichiers PDF en C#. Il existe depuis un certain temps et est largement utilisé dans l'industrie. iText offre un ensemble riche de fonctionnalités pour créer et manipuler des documents PDF. Il est connu pour sa flexibilité et son extensibilité, ce qui le rend adapté aux tâches complexes liées aux PDF.

Comment utiliser IronPDF vs iTextSharp pour lire des PDF en C#17

  1. Créez un nouveau projet C# dans Visual Studio pour comparer IronPDF et iTextSharp pour la lecture de fichiers PDF.

  2. Installez les bibliothèques IronPDF et iTextSharp dans le projet.

  3. Lire des fichiers PDF à l'aide d'IronPDF.

  4. Lire des fichiers PDF à l'aide d'iTextSharp.

Conditions préalables

  1. Visual Studio : Assurez-vous d'avoir Visual Studio ou tout autre environnement de développement C# installé.

  2. Gestionnaire de packages NuGet : Assurez-vous de pouvoir utiliser NuGet pour gérer les packages dans votre projet.

Étape 1 : Créez un nouveau projet C#17 dans Visual Studio pour comparer IronPDF et iTextSharp pour lire des fichiers PDF

Commencez par mettre en place une application console C#. Ouvrez Visual Studio et sélectionnez Créer un nouveau projet. Sélectionnez le type d'application de la console.

iTextSharp Lire les alternatives PDF (Tutoriel développeur) : Figure 1 - Application Console

Indiquez le nom du projet comme indiqué ci-dessous.

iTextSharp Lire les alternatives PDF (Tutoriel pour développeurs) : Figure 2 - Configuration du projet

Sélectionnez la version .NET requise pour le projet.

iTextSharp Lire des alternatives PDF (Tutoriel pour développeurs) : Figure 3 - Framework

Une fois cette opération effectuée, Visual Studio génère un nouveau projet.

Étape 2 : Installer les bibliothèques IronPDF et iTextSharp dans le projet

iTextSharp peut être installé à partir du Gestionnaire de packages NuGet pour iText. La dernière version est disponible sous forme de paquet iText.

iTextSharp Alternatives pour Lire des PDF (Tutoriel Développeur) : Figure 4 - iText

Ou à partir du gestionnaire de paquets de Visual Studio, comme indiqué ci-dessous. Recherchez iText dans le Gestionnaire de paquets et cliquez sur Installer.

 Alternatives pour Lire un PDF avec iTextSharp (Tutoriel Développeur) : Figure 5 - Gestionnaire de Paquets NuGet

IronPDF peut être installé à partir du gestionnaire de packages NuGet pour IronPDF comme illustré ci-dessous.

Alternatives à iTextSharp pour la Lecture de PDF (Tutoriel Développeur) : Figure 6 - IronPDF

Ou à partir du gestionnaire de paquets de Visual Studio, comme indiqué ci-dessous. Recherchez IronPDF: C# PDF Library dans le Gestionnaire de Paquets et cliquez sur Installer.

Alternatives à iTextSharp pour Lire un PDF (Tutoriel Développeur) : Figure 7 - Installer IronPDF

Étape 3 : Lire le texte d'un fichier PDF à l'aide d'IronPDF

Ajoutez le code ci-dessous au fichier program.cs et fournissez un exemple de document PDF dont le contenu est le suivant.

iTextSharp Lire les alternatives PDF (Tutoriel pour développeur) : Figure 8 - Entrée PDF

using IronPdf;
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#");
// pdfreader reader
ReadUsingIronPDF.Read();
public class ReadUsingIronPDF
{
    public static void Read()
    {
        // read from specific location
        string filename = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        var pdfReader = PdfDocument.FromFile(filename);
        // Get all text to put in a search index using new simpletextextractionstrategy
        var allText = pdfReader.ExtractAllText();
        Console.WriteLine("------------------Text From PDF-----------------");
        Console.WriteLine(allText);
        Console.WriteLine("------------------Text From PDF-----------------");
        var allIMages = pdfReader.ExtractAllImages();
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine($"Total Images={allIMages.Count()}");
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine("------------------one Page Text From PDF page-----------------");
        var pageCount = pdfReader.PageCount;
        for (int page = 0; page < pageCount; page++)
        {
            string Text = pdfReader.ExtractTextFromPage(page);
            Console.WriteLine(Text);
        }
    }
}
using IronPdf;
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#");
// pdfreader reader
ReadUsingIronPDF.Read();
public class ReadUsingIronPDF
{
    public static void Read()
    {
        // read from specific location
        string filename = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        var pdfReader = PdfDocument.FromFile(filename);
        // Get all text to put in a search index using new simpletextextractionstrategy
        var allText = pdfReader.ExtractAllText();
        Console.WriteLine("------------------Text From PDF-----------------");
        Console.WriteLine(allText);
        Console.WriteLine("------------------Text From PDF-----------------");
        var allIMages = pdfReader.ExtractAllImages();
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine($"Total Images={allIMages.Count()}");
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine("------------------one Page Text From PDF page-----------------");
        var pageCount = pdfReader.PageCount;
        for (int page = 0; page < pageCount; page++)
        {
            string Text = pdfReader.ExtractTextFromPage(page);
            Console.WriteLine(Text);
        }
    }
}
Imports IronPdf
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#")
' pdfreader reader
ReadUsingIronPDF.Read()
'INSTANT VB TODO TASK: Local functions are not converted by Instant VB:
'public class ReadUsingIronPDF
'{
'	public static void Read()
'	{
'		' read from specific location
'		string filename = "C:\code\articles\ITextSharp\ITextSharpIronPdfDemo\Example.pdf";
'		var pdfReader = PdfDocument.FromFile(filename);
'		' Get all text to put in a search index using new simpletextextractionstrategy
'		var allText = pdfReader.ExtractAllText();
'		Console.WriteLine("------------------Text From PDF-----------------");
'		Console.WriteLine(allText);
'		Console.WriteLine("------------------Text From PDF-----------------");
'		var allIMages = pdfReader.ExtractAllImages();
'		Console.WriteLine("------------------Image Count From PDF-----------------");
'		Console.WriteLine(string.Format("Total Images={0}", allIMages.Count()));
'		Console.WriteLine("------------------Image Count From PDF-----------------");
'		Console.WriteLine("------------------one Page Text From PDF page-----------------");
'		var pageCount = pdfReader.PageCount;
'		for (int page = 0; page < pageCount; page++)
'		{
'			string Text = pdfReader.ExtractTextFromPage(page);
'			Console.WriteLine(Text);
'		}
'	}
'}
$vbLabelText   $csharpLabel

Explication du code

  1. Pour créer un texte PDF, créez un document Word, ajoutez-y le texte ci-dessus et enregistrez-le en tant que document PDF nommé Exemple.pdf

  2. Dans le code, nous créons un PDFReader à partir du chemin du fichier PDF et extrayons tout le texte

  3. Les images du PDF peuvent être extraites à l'aide de la méthode ExtractImages

  4. Chaque page d'un document PDF peut être lue à l'aide de la méthode ExtractTextFromPage

Sortie

Alternatives à iTextSharp pour la lecture de PDF (Tutoriel pour développeurs) : Figure 9 - Lecture de PDF en utilisant IronPDF Output

Étape 3 : Lire le texte d'un fichier PDF avec iTextSharp

Pour comparer le texte lu par iTextSharp, ajoutez le code ci-dessous au même fichier program.cs. Pour des raisons de simplicité, nous n'avons pas séparé les classes dans des fichiers différents.

using IronPdf;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#");
//ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read();
public class ReadUsingITextSharp
{
    public static void Read()
    {
        string pdfFile = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        // Create a PDF reader
        PdfReader pdfReader = new PdfReader(pdfFile);
        iText.Kernel.Pdf.PdfDocument pdfDocument = new iText.Kernel.Pdf.PdfDocument(pdfReader);
        // Extract plain text from the PDF
        LocationTextExtractionStrategy strategy = new LocationTextExtractionStrategy();
        string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
        // Display or manipulate the extracted text as needed
        Console.WriteLine(pdfText);
    }
}
using IronPdf;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#");
//ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read();
public class ReadUsingITextSharp
{
    public static void Read()
    {
        string pdfFile = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        // Create a PDF reader
        PdfReader pdfReader = new PdfReader(pdfFile);
        iText.Kernel.Pdf.PdfDocument pdfDocument = new iText.Kernel.Pdf.PdfDocument(pdfReader);
        // Extract plain text from the PDF
        LocationTextExtractionStrategy strategy = new LocationTextExtractionStrategy();
        string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
        // Display or manipulate the extracted text as needed
        Console.WriteLine(pdfText);
    }
}
Imports IronPdf
Imports iText.Kernel.Pdf
Imports iText.Kernel.Pdf.Canvas.Parser.Listener
Imports iText.Kernel.Pdf.Canvas.Parser
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#")
'ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read()
'INSTANT VB TODO TASK: Local functions are not converted by Instant VB:
'public class ReadUsingITextSharp
'{
'	public static void Read()
'	{
'		string pdfFile = "C:\code\articles\ITextSharp\ITextSharpIronPdfDemo\Example.pdf";
'		' Create a PDF reader
'		PdfReader pdfReader = New PdfReader(pdfFile);
'		iText.Kernel.Pdf.PdfDocument pdfDocument = New iText.Kernel.Pdf.PdfDocument(pdfReader);
'		' Extract plain text from the PDF
'		LocationTextExtractionStrategy strategy = New LocationTextExtractionStrategy();
'		string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
'		' Display or manipulate the extracted text as needed
'		Console.WriteLine(pdfText);
'	}
'}
$vbLabelText   $csharpLabel

Sortie

Alternatives pour lire un PDF avec iTextSharp (Tutoriel pour développeurs) : Figure 10 - Lire un PDF en utilisant la sortie iTextSharp

limites d'iTextSharp

  1. Courbe d'apprentissage : iTextSharp a une courbe d'apprentissage plus raide, notamment pour les débutants.

  2. Licences : Le modèle de licence d'iTextSharp peut ne pas convenir à tous les projets, en particulier ceux avec des contraintes budgétaires.

Avantages d'IronPDF

  1. Facilité d'utilisation : IronPDF est réputé pour son API simple, ce qui facilite la tâche des développeurs pour commencer.

  2. Rendu des Documents : IronPDF offre un rendu précis des documents PDF, garantissant que le texte extrait est fidèle à l'original.

Licence (essai gratuit disponible)

Insérez votre clé de licence IronPDF dans le fichier appsettings.json.

"IronPdf.LicenseKey": "your license key"

Pour recevoir une licence d'essai, veuillez indiquer votre adresse électronique.

Conclusion

Choisir entre IronPDF et iTextSharp dépend des exigences spécifiques de votre projet. Si vous avez besoin d'une bibliothèque simple et facile à utiliser pour les opérations PDF courantes, IronPDF est peut-être le meilleur choix. Prenez en compte des facteurs tels que la complexité de votre application, votre budget et la courbe d'apprentissage avant de prendre votre décision.

IronPDF est conçu pour intégrer de manière transparente la génération de PDF dans votre application, en gérant sans effort la conversion de documents formatés en PDF. Cet outil polyvalent vous permet de convertir des formulaires Web, des pages HTML locales et d'autres contenus Web en PDF à l'aide de .NET. Les utilisateurs peuvent télécharger, envoyer par courrier électronique ou stocker des documents dans le nuage. Que vous ayez besoin de produire des factures, des devis, des rapports, des contrats ou d'autres documents professionnels, les capacités de génération de PDF d'IronPDF vous couvrent. Améliorez votre application grâce aux capacités de génération de PDF intuitives et efficaces d'IronPDF.

Chaknith Bin
Ingénieur logiciel
Chaknith travaille sur IronXL et IronBarcode. Il possède une expertise approfondie en C# et .NET, aidant à améliorer le logiciel et à soutenir les clients. Ses idées issues des interactions avec les utilisateurs contribuent à de meilleurs produits, une documentation améliorée et une expérience globale enrichie.
< PRÉCÉDENT
Comment lire des documents PDF en C# en utilisant iTextSharp :
SUIVANT >
PDFsharp vs iTextSharp (Comparaison des bibliothèques PDF C#)