UTILISATION D'IRONPDF FOR JAVA

Comment lire un fichier PDF en Java ?

Kannaopat Udonpant
Kannapat Udonpant
mars 19, 2023
Mise à jour août 25, 2024
Partager:

La lecture d'un document PDF en Java peut faire partie intégrante de n'importe quel projet, qu'il s'agisse d'applications commerciales ou d'analyses de données. Avec la bibliothèque IronPDF, il est devenu plus facile que jamais d'intégrer des capacités de traitement de fichiers PDF dans vos projets Java.

IronPDF : Importation de la bibliothèque Java PDF

Présentation de la bibliothèque Java PDF IronPDF est la solution parfaite pour les développeurs de logiciels qui ont besoin de produire des PDF de haute qualité, prêts à être capturés rapidement à partir de HTML. La bibliothèque offre également des outils puissants de manipulation de documents qui permettent un contrôle dynamique sur la mise en page et le formatage dans IronPDF, le contenu et le formatage.

Voyons comment lire un fichier PDF stocké à un chemin dans un programme Java en utilisant la bibliothèque IronPDF.

Lire des PDF à l'aide d'IronPDF

La première étape consiste à installer IronPDF en utilisant Maven, plus de détails peuvent être trouvés dans le Guide d'installation d'IronPDF.

Installer IronPDF dans Maven

Voici les étapes pour installer IronPDF dans un projet Maven :

  1. Ouvrez votre projet Maven dans votre IDE préféré.

  2. Dans le fichier pom.xml, ajoutez la dépendance de la bibliothèque IronPDF dans la section dependencies.
    :ProductInstall
  1. Enregistrez le fichier pom.xml et laissez Maven télécharger et installer la bibliothèque IronPDF.

    Une fois l'installation terminée, vous devriez pouvoir importer et utiliser les classes suivantes d'IronPDF et les analyseurs Apache Tika dans votre projet.

Code Java pour lire un document PDF

Voici le code que vous pouvez utiliser pour lire le nouveau fichier avec ou sans limites tabulaires en utilisant la bibliothèque IronPDF.

import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;

public class Test {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));  
        String text = pdf.extractAllText();
        System.out.println(text);
    }
}
JAVA

Dans ce programme, la classe PdfDocument dans IronPDF est utilisée pour lire le contenu d'un fichier PDF. La première ligne du programme importe les classes nécessaires depuis la bibliothèque IronPDF. La deuxième ligne importe la classe IOException de la bibliothèque standard Java.

Le programme définit une classe publique nommée Test. À l'intérieur de la classe, il y a une méthode public static nommée main qui prend un tableau de chaînes comme argument.

La méthode main utilise la méthode fromFile method of PdfDocument in IronPDF de la classe PdfDocument pour charger un fichier PDF situé à "C:\sample.pdf". Cette méthode renvoie un objet PdfDocument qui représente le fichier PDF.

Une fois le fichier PDF chargé, le programme appelle la méthode [extractAllText d'un objet PdfDocument dans IronPDF](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText()) de la classe PdfDocument pour extraire tout le texte du fichier PDF. Cette méthode retourne une String qui contient tout le texte du fichier PDF.

Le texte extrait est ensuite stocké dans une variable String nommée "text". Cette variable peut être utilisée pour traiter ou afficher le contenu du fichier PDF.

Enfin, le programme affiche le texte extrait sur la console en utilisant la méthode System.out.println.

Comment lire un fichier PDF en Java, Figure 1 : Sortie du programme

Sortie du programme

Conclusion

IronPDF est une excellente solution pour lire des fichiers PDF dans le même chemin ou dans plusieurs chemins différents en Java, car il offre des performances élevées et de nombreuses fonctionnalités qui facilitent le développement de PDF. Sa syntaxe est simple et conviviale. Son API permet aux développeurs de créer rapidement le code dont ils ont besoin pour leurs projets.

Explorez les options de licence IronPDF les forfaits commencent à partir de seulement $749, ce qui le rend accessible pour extraire du contenu pour ceux qui ont un budget limité. Dans l'ensemble, IronPDF constitue une excellente option pour tout développeur Java souhaitant travailler avec des PDF dans le cadre de la programmation d'applications Java.

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Tout en poursuivant ses études, Kannapat est également devenu membre du Vehicle Robotics Laboratory, qui fait partie du Department of Bioproduction Engineering (département d'ingénierie de la bioproduction). En 2022, il a mis à profit ses compétences en C# pour rejoindre l'équipe d'ingénieurs d'Iron Software, où il se concentre sur IronPDF. Kannapat apprécie son travail car il apprend directement auprès du développeur qui écrit la majeure partie du code utilisé dans IronPDF. Outre l'apprentissage par les pairs, Kannapat apprécie l'aspect social du travail chez Iron Software. Lorsqu'il n'écrit pas de code ou de documentation, Kannapat peut généralement être trouvé en train de jouer sur sa PS5 ou de revoir The Last of Us.
< PRÉCÉDENT
Comment ajouter des signatures numériques aux PDF en Java
SUIVANT >
Comment faire pivoter un fichier PDF en Java

Installer avec Maven

Version :2025.3.6

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2025.3.6</version>
</dependency>