UTILISATION D'IRONPDF

C# Lire un fichier PDF : Tutoriel facile

Mise à jour décembre 2, 2023
Partager:

Si vous êtes un développeur, vous avez probablement rencontré des problèmes en essayant de lire du texte dans un fichier PDF. Peut-être qu'un ou plusieurs des scénarios suivants s'appliquent à vous.

  1. Vous développez une application qui prend deux documents PDF en entrée et trouve la similarité entre les documents.

  2. Vous développez une application qui doitlire des documents PDF avec IronPDF et renvoie le nombre de mots.

  3. Vous développez une application quiextrait des données d'un fichier PDF à l'aide d'IronPDF et les place dans une base de données structurée.

  4. Vous développez une application qui doitextraire le contenu textuel d'un PDF et la convertir en chaîne de caractères.

  5. L'extraction de données à partir de fichiers PDF à l'aide de C# était une tâche difficile et complexe jusqu'au développement d'IronPDF.

    Présentation de la bibliothèque IronPDF est une bibliothèque qui facilite grandement la lecture des fichiers PDF par les développeurs.

    Vous pouvez en savoir plus surOffres IronPDF et Iron Software Suite.

    Vous pouvez lire des fichiers PDF et afficher les données dans une zone de texte C# en utilisant seulement deux lignes de code. Oui, juste deux lignes de code. Vous pouvez égalementextraire toutes les images des PDF. En outre, vous pouvez créer un autre document avec ces images ou les afficher dans votre application en fonction de vos besoins.

    Laissez-nous vous montrer comment faire.

    Nous pouvons procéder étape par étape avec l'application pour sélectionner n'importe quel fichier PDF et afficher son contenu.

    Les étapes suivantes vous montrent comment lire des fichiers PDF en C# :

    Connaissances préalables:

  6. Connaissance de base de la programmation C#

  7. Connaissance de base des contrôles d'interface graphique C#

    J'ai conçu ce tutoriel de manière à ce que même une personne n'ayant aucune formation en programmation puisse progresser.

    Qui devrait lire ceci

    Tout nouveau venu apprenant le C# devrait savoir commentlire des fichiers PDF à l'aide d'IronPDF parce que c'est quelque chose que vous allez certainement utiliser dans votre carrière.

    Les développeurs professionnels devraient également lire ce document pour être en mesure de comprendre la bibliothèque IronPDF, qui nous aide à lire, générer et manipuler des documents PDF.

    Maintenant, comment pouvons-nous utiliser cette bibliothèque dans notre projet pour lire un fichier PDF ?

    J'utilise une application Windows Forms pour la démonstration. Vous pouvez utiliser une application console, une application WPF ou une application web ASP.NET selon vos préférences.

    Un autre avantage majeur de la bibliothèque IronPDF est qu'elle peut être utilisée à la fois avec C# et VB.NET.

    Commençons la démonstration sans plus attendre.


Étape #1 : Créer un projet Visual Studio

Ouvrez Visual Studio. J'utilise Visual Studio 2019.

Cliquez sur "Créer un nouveau projet" :

C# Lire un fichier PDF : Tutoriel facile, Figure 3 : Créer un nouveau projet

Créer un nouveau projet

Sélectionnez maintenant l'application Windows Forms dans le modèle, appuyez sur "Next", et la fenêtre suivante apparaîtra. Saisissez un nom de projet. J'ai écrit 'Read Pdf using IronPDF'.

C# Lire un fichier PDF : Tutoriel facile, Figure 16 : Configurer le projet via Visual Studio

Configurer le projet via Visual Studio

Cliquez ensuite sur "Suivant", et la fenêtre suivante apparaîtra. Sélectionnez '.NET Core 3.1' dans le menu déroulant.

C# Lire un fichier PDF : Tutoriel facile, Figure 9 : Version .NET Core 3.1

.NET Core 3.1 version

Cliquez sur le bouton "Créer" et le projet sera créé comme indiqué ci-dessous.

C# Read PDF File : Easy Tutorial, Figure 6 : Phase initiale d'une nouvelle application Windows Forms

Étape initiale d'une nouvelle application Windows Forms


Étape #2 : Installer le package NuGet IronPDF

Cliquez sur le menu Projet dans la barre de menu, et une liste déroulante apparaît. Sélectionnez Manage NuGet Packages, et cliquez dessus. La fenêtre suivante apparaît :

C# Lire un fichier PDF : Tutoriel facile, Figure 1 : NuGet Package Manager

NuGet Package Manager

Cliquez ensuite sur "Parcourir". La fenêtre suivante apparaît :

C# Read PDF File : Easy Tutorial, Figure 2 : Interface utilisateur du gestionnaire de paquets NuGet

NuGet Package Manager UI

Tapez IronPDF dans la boîte de recherche et appuyez sur "Enter". La fenêtre suivante apparaît :

C# Lire un fichier PDF : Tutoriel facile, Figure 4 : Solution NuGet

NuGet Solution

Sélectionnez et cliquez sur IronPDF. La fenêtre suivante apparaît :

C# Read PDF File : Easy Tutorial, Figure 7 : Installer IronPDF gratuitement

Installer IronPDF gratuit

Appuyez sur le bouton "Installer" et attendez la fin de l'installation. La fenêtre suivante apparaît après une installation réussie :

C# Read PDF File : Easy Tutorial, Figure 5 : IronPDF for .NET

IronPDF for .NET (en anglais)

Appuyez sur le bouton "Ok" et vous pouvez commencer.

Note : Il existe d'autres moyens de télécharger le paquet NuGet. Vous pouvez également installer IronPdf en utilisant la Console du Gestionnaire de Paquets ; pour ce faire, ouvrez la console du gestionnaire de paquets et écrivez le code suivant :

Install-Package IronPdf

Vous pouvez également le télécharger surla page du paquet NuGet pour IronPDF.

Le fichier Readme.txt suivant s'ouvre :

C# Read PDF File : Easy Tutorial, Figure 12 : Fichier readme d'IronPDF avec des exemples de code

Le fichier readme d'IronPDF avec des exemples de code

Je vous suggère de parcourir tous les liens etexplorer plus d'exemples de code IronPDF à propos de cette bibliothèque.


Étape #3 : Concevoir une application Windows Forms

Une fois le projet créé et le paquet NuGet installé, l'étape suivante consiste à concevoir une application Windows Forms qui demandera à l'utilisateur de rechercher un fichier et d'en afficher le contenu.

Forme ouverte1 Conception :

C# Lire un fichier PDF : Tutoriel facile, Figure 14 : Form1 Design UI

Form1 Design UI

Cliquez sur la barre d'outils située à gauche de la fenêtre :

C# Read PDF File : Easy Tutorial, Figure 15 : Boîte à outils pour Label et TextBox

Toolbox UI for Label and TextBox (interface utilisateur pour les étiquettes et les boîtes de texte)

Recherchez Label, et glissez-déposez-le dans la conception du formulaire

Nommez l'étiquette. Ici, je l'ai nommé "C# Read Pdf using IronPDF".

C# Read PDF File : Easy Tutorial, Figure 20 : Form1 UI avec l'ajout d'une étiquette

Form1 UI avec l'ajout d'une étiquette

Ensuite, faites glisser et déposez une zone de texte(pour afficher le chemin d'accès au fichier), trois boutons(un pour parcourir les fichiers, un pour lire les fichiers PDF à l'aide d'IronPdf, et le troisième bouton pour les champs "Effacer le texte")et une RichTextBox(pour lire et afficher le contenu du fichier).

Définissez la "propriété de lecture seule" de la TextBox et de la RichTextBox sur "False". Ainsi, les utilisateurs ne peuvent lire que le contenu et le chemin d'accès du fichier.

C# Read PDF File : Easy Tutorial, Figure 10 : Form1 entièrement conçu

Form1 entièrement conçu


Étape #4 : Ajouter le code back-end pour la navigation dans les fichiers PDF

Double-cliquez sur le bouton "Parcourir" et la fenêtre suivante apparaîtra :

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

Ensuite, écrivez le code suivant dans la fonction Browse_Click :

private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim browseFile As New OpenFileDialog With {
		.InitialDirectory = "D:\",
		.Title = "Browse Pdf Files",
		.CheckFileExists = True,
		.CheckPathExists = True,
		.DefaultExt = "pdf",
		.Filter = "pdf files (*.pdf) *.pdf",
		.FilterIndex = 2,
		.RestoreDirectory = True,
		.ReadOnlyChecked = True,
		.ShowReadOnly = True
	}
	If browseFile.ShowDialog() = DialogResult.OK Then
		FilePath.Text = browseFile.FileName
	End If
End Sub
VB   C#

OpenFileDialogue créera l'instance du contrôle File Dialogue de l'application Windows Forms.

J'ai défini le chemin d'accès initial sur le lecteur D ; vous pouvez le définir sur n'importe quel lecteur.

J'ai défini DefaultExt = "pdf" car nous n'avons qu'à lire le fichier PDF.

J'ai utilisé un filtre pour que la boîte de dialogue Parcourir le fichier n'affiche que le fichier PDF à sélectionner.

Lorsque l'utilisateur clique sur "Ok", le chemin d'accès au fichier s'affiche dans le champ Chemin d'accès au fichier.

Exécutons la solution et testons le bouton "Parcourir".

C# Lire un fichier PDF : Tutoriel facile, Figure 10 : Form1 UI

Form1 UI

Appuyez sur le bouton "Parcourir" et la fenêtre suivante s'affiche :

C# Read PDF File : Easy Tutorial, Figure 11 : Boîte de dialogue Browse File pour sélectionner un fichier PDF

Consulter le fichier pour sélectionner un fichier PDF

Sélectionner le fichier(Je sélectionne IronPDFTest.pdf) et appuyez sur "Ouvrir". La fenêtre suivante apparaît.

C# Lire un fichier PDF : Tutoriel facile, Figure 13 : PDF en C#

PDF en C#

Écrivons maintenant le code derrière le bouton "Lire" pour lire le fichier.


Étape #5 : Ajouter le code back-end pour lire les documents PDF à l'aide d'IronPDF

Vous pensez peut-être que le code de lecture d'un fichier PDF est complexe et difficile à écrire et à comprendre.

Ne vous inquiétez pas. IronPDF a simplifié les choses et les a rendues tellement plus faciles. Nous pouvons facilement lire le fichier PDF en utilisant seulement deux lignes de code.

Allez dans le formulaire 1 Design et "double-cliquez" sur le bouton "Lire". La fenêtre suivante apparaît :

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

Ajoutez un espace de noms utilisant IronPdf pour importer la bibliothèque IronPDF :

using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
VB   C#

Ecrivez le code suivant dans la fonction Read_Click :

private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
	Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
		FileContent.Text = pdf.ExtractAllText()
	End Using
End Sub
VB   C#

FilePath est le nom du champ de texte qui affiche l'emplacement du document PDF que nous voulons lire. Nous obtiendrons l'emplacement du fichier de manière dynamique.

ExtractAllText avec IronPDF est la fonction IronPDF qui va extraire toutes les données des pages PDF. Ces données seront ensuite affichées dans la zone de texte enrichi et nommées "Contenu du fichier".

Ensuite, écrivons le code derrière le "bouton d'effacement". Il s'agit d'un élément supplémentaire si vous souhaitez effacer l'écran après avoir lu le document PDF.

Double-cliquez sur le "bouton d'effacement", et vous obtiendrez le code suivant :

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

Ecrivez le code suivant dans la fonction Clear_Click :

void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
	FileContent.Text = ""
	FilePath.Text = ""
End Sub
VB   C#

Exécuter la solution

Cliquez sur le bouton "Parcourir" et sélectionnez le document que vous souhaitez lire. Dans mon cas, je lis le fichier IronPDF.pdf à titre d'exemple :

C# Read PDF File : Easy Tutorial, Figure 8 : Documents PDF

Documents PDF

Appuyez sur le bouton "Ouvrir" et la fenêtre suivante apparaîtra :

C# Read PDF File : Easy Tutorial, Figure 13 : Application avec un fichier PDF sélectionné

Application avec un fichier PDF sélectionné

Appuyez sur le bouton "Lire". Il lira le fichier et affichera le contenu comme indiqué ci-dessous.

C# Lire un fichier PDF : Tutoriel facile, Figure 19 : Afficher le contenu textuel du PDF

**Afficher le contenu textuel du PDF


Résumé

Il s'agit d'un exemple de solution. Quel que soit le nombre de pages, d'images ou de textes contenus dans vos fichiers PDF, IronPDF extraira tous les textes et toutes les images pour que vous puissiez les utiliser à n'importe quelle fin. Il vous suffit d'obtenir la licence de la bibliothèque et de commencer à l'utiliser.

Ceci complète le tutoriel. J'espère que vous avez tout compris, et si vous avez des questions, n'hésitez pas à les poser dans la section des commentaires.

Vous pouvez téléchargerle fichier zip du projet. Si vous souhaitez acheter l'ensemble des logiciels Iron Software, notre offre spéciale vous permet de les acheter tous pour le prix de deux seulement. Si vous avez besoin de plus de détails sur la licence et l'assistance, veuillez cliquer surInformations sur les prix d'Iron Software. Vous pouvez également obtenirles offres de licence d'essai gratuite.

< PRÉCÉDENT
.NET Générateur de PDF en 1 clic
SUIVANT >
Comment protéger un document PDF par un mot de passe