import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
// Apply your license key
License.setLicenseKey("YOUR-LICENSE-KEY");
// Set a log path
Settings.setLogPath(Paths.get("C:/tmp/IronPdfEngine.log"));
// Render the HTML as a PDF. Stored in myPdf as type PdfDocument;
PdfDocument myPdf = PdfDocument.renderHtmlAsPdf("<h1> ~Hello World~ </h1> Made with IronPDF!");
// Save the PdfDocument to a file
myPdf.saveAs(Paths.get("html_saved.pdf"));
Comment extraire une image d'un fichier PDF en Java ?
Regan Pun
mars 11, 2023
Mise à jour septembre 1, 2024
Partager:
Cet article explorera comment extraire des images d'un document PDF existant et les enregistrer dans un seul dossier en utilisant le langage de programmation Java. À cet effet, la bibliothèque IronPDF for Java est utilisée pour extraire des images.
Comment extraire une image d'un fichier PDF en Java ?
Vérifier les images extraites dans le répertoire spécifié
IronPDF for Java PDF Library (Bibliothèque PDF Java)
IronPDF est une bibliothèque Java conçue pour aider les développeurs à générer, modifier et extraire des données à partir des fichiers PDF dans leurs applications Java. Avec IronPDF, vous pouvez créer des documents PDF à partir de diverses sources, telles que HTML, des images, et plus encore. De plus, vous avez la possibilité de fusionner, diviser et manipuler des PDF existants. IronPDF comprend également des fonctionnalités de sécurité, telles que la protection par mot de passe et les signatures numériques.
Développé et maintenu par Iron Software, IronPDF est connu pour sa capacité à extraire du texte à partir de PDF, HTML et URL. Il s'agit donc d'un outil polyvalent et puissant pour un grand nombre d'applications, que vous créiez des PDF à partir de zéro ou que vous travailliez sur des PDF existants.
Conditions préalables
Avant d'utiliser IronPDF pour extraire des données d'un fichier PDF, quelques conditions préalables doivent être remplies :
Installation de Java : Assurez-vous que Java est installé sur votre système et que son chemin est défini dans les variables d'environnement. Si vous n'avez pas encore installé Java, suivez les instructions sur la page de téléchargement du site web de Java.
IDE Java : Ayez soit Eclipse, soit IntelliJ installé comme votre IDE Java. Vous pouvez télécharger Eclipse à partir de ce lien et IntelliJ depuis cette page de téléchargement.
Bibliothèque IronPDF : Téléchargez et ajoutez la bibliothèque IronPDF à votre projet en tant que dépendance. Pour obtenir des instructions d'installation, visitez le site web d'IronPDF.
Installation de Maven : Assurez-vous que Maven est installé et intégré à votre IDE avant de commencer le processus de conversion de PDF. Suivez le tutoriel dans le guide de JetBrains pour obtenir de l'aide sur l'installation et l'intégration de Maven.
Installation d'IronPDF for Java
L'installation d'IronPDF for Java est un processus simple, à condition que toutes les conditions requises soient remplies. Ce guide utilisera JetBrains IntelliJ IDEA pour démontrer l'installation et exécuter du code exemple.
Voici ce qu'il faut faire :
Lancer IntelliJ IDEA : Ouvrez JetBrains IntelliJ IDEA sur votre système.
Créer un projet Maven : Dans IntelliJ IDEA, créer un nouveau projet Maven. Ceci fournira un environnement approprié pour l'installation d'IronPDF for Java.
Créer un nouveau projet Maven
Une nouvelle fenêtre apparaît. Saisissez le nom du projet et cliquez sur Terminer.
Entrez le nom du projet
Après avoir cliqué sur Terminer, un nouveau projet s'ouvrira sur un fichier pom.xml pour ajouter les dépendances Maven d'IronPDF for Java.
Ensuite, ajoutez les dépendances suivantes dans le fichier pom.xml ou vous pouvez télécharger le fichier JAR depuis le dépôt Maven suivant.
Une fois que vous avez placé les dépendances dans le fichier pom.xml, une petite icône apparaîtra dans le coin supérieur droit du fichier.
Le fichier pom.xml avec une petite icône pour installer les dépendances
Cliquez sur cette icône pour installer les dépendances Maven d'IronPDF for Java. Cela ne prendra que quelques minutes en fonction de votre connexion internet.
Extraire des images
Vous pouvez extraire des images d'un document PDF en utilisant IronPDF avec une méthode unique appelée [extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages(). Cette méthode renvoie toutes les images disponibles dans un fichier PDF. Ensuite, vous pouvez enregistrer toutes les images extraites dans le chemin de fichier de votre choix en utilisant la méthode ImageIO.write en fournissant le chemin et le format de l'image de sortie.
5.1. Extraire des images d'un document PDF
Dans l'exemple ci-dessous, les images d'un document PDF seront extraites et sauvegardées dans le système de fichiers en tant qu'images PNG.
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws Exception {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws Exception {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
JAVA
Le programme ci-dessus ouvre le fichier "Final Project Report Craft Arena.pdf" et utilise la méthode extractAllImages pour extraire toutes les images du fichier dans une liste d'objets BufferedImage. Il enregistre ensuite chaque nouvelle image dans des fichiers PNG distincts portant un nom unique.
Extraction d'images à partir de la sortie PDF
Extraire les images à partir de l'URL
Cette section expliquera comment extraire des images directement à partir des URLs. Dans le code ci-dessous, l'URL est convertie en page PDF, puis la navigation est basculée pour extraire les images du PDF.
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
JAVA
Dans le code ci-dessus, l'URL de la page d'accueil d'Amazon est fournie en entrée, et elle renvoie 74 images.
Extraction d'images à partir de la sortie PDF
Conclusion
L'extraction d'images d'un document PDF peut être réalisée en Java à l'aide de la bibliothèque IronPDF. Pour installer IronPDF, vous devez avoir Java, un IDE Java (Eclipse ou IntelliJ), Maven, et la bibliothèque IronPDF installés et intégrés à votre projet. Le processus d'extraction d'images d'un document PDF à l'aide de IronPDF est simple et nécessite juste un appel de méthode à extractAllImages. Vous pouvez ensuite enregistrer les images dans un chemin de fichier de votre choix en utilisant la méthode ImageIO.write.
Cet article propose un guide étape par étape sur la façon d'extraire des images d'un document PDF en utilisant Java et la bibliothèque IronPDF. Plus de détails, y compris des informations sur comment extraire du texte à partir de PDF, peuvent être trouvés dans l'Exemple de Code pour Extraire du Texte.
IronPDF est une bibliothèque avec une licence commerciale, à partir de $749. Cependant, vous pouvez l'évaluer en production avec un essai gratuit.
Regan est diplômé de l'université de Reading, où il a obtenu une licence en ingénierie électronique. Avant de rejoindre Iron Software, il s'était concentré sur une seule tâche. Ce qu'il apprécie le plus chez Iron Software, c'est la diversité des tâches qu'il peut accomplir, qu'il s'agisse d'apporter une valeur ajoutée aux ventes, à l'assistance technique, au développement de produits ou à la commercialisation. Il aime comprendre comment les développeurs utilisent la bibliothèque d'Iron Software et utiliser ces connaissances pour améliorer continuellement la documentation et développer les produits.
< PRÉCÉDENT Comment générer un fichier PDF en Java ?
SUIVANT > Comment extraire des données d'un fichier PDF en Java ?
Des millions d'ingénieurs dans le monde entier lui font confiance
Réservez une démo en direct gratuite
Réservez une démonstration personnelle de 30 minutes.
Pas de contrat, pas de détails de carte, pas d'engagements.
Voici ce à quoi vous pouvez vous attendre :
Une démonstration en direct de notre produit et de ses principales fonctionnalités
Obtenez des recommandations de fonctionnalités spécifiques au projet
Toutes vos questions trouvent réponse pour vous assurer de disposer de toutes les informations dont vous avez besoin. (Aucun engagement de votre part.)
CHOISIR L'HEURE
VOS INFORMATIONS
Réservez votre démo en direct gratuite
Fiable par plus de 2 millions d'ingénieurs dans le monde entier