import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
// Apply your license key
License.setLicenseKey("YOUR-LICENSE-KEY");
// Set a log path
Settings.setLogPath(Paths.get("C:/tmp/IronPdfEngine.log"));
// Render the HTML as a PDF. Stored in myPdf as type PdfDocument;
PdfDocument myPdf = PdfDocument.renderHtmlAsPdf("<h1> ~Hello World~ </h1> Made with IronPDF!");
// Save the PdfDocument to a file
myPdf.saveAs(Paths.get("html_saved.pdf"));
Das Lesen eines PDF-Dokuments in Java kann ein integraler Bestandteil eines jeden Projekts sein, von Geschäftsanwendungen bis hin zu Datenanalysen. Mit der IronPDF-Bibliothek ist es einfacher als je zuvor geworden, PDF-Verarbeitungsfunktionen in Ihre Java-Projekte zu integrieren.
Sehen wir uns an, wie man eine PDF-Datei, die an einem Pfad gespeichert ist, in einem Java-Programm mit der IronPDF-Bibliothek liest.
PDFs mit IronPDF lesen
Der erste Schritt besteht darin, IronPDF mithilfe von Maven zu installieren, weitere Details finden Sie im IronPDF-Installationshandbuch.
IronPDF in Maven installieren
Hier sind die Schritte zur Installation von IronPDF in einem Maven-Projekt:
Öffnen Sie Ihr Maven-Projekt in Ihrer bevorzugten IDE.
Fügen Sie im pom.xml-Datei die IronPDF-Bibliotheksabhängigkeit im dependencies-Abschnitt hinzu.
:ProductInstall
Speichern Sie die pom.xml-Datei und lassen Sie Maven die IronPDF-Bibliothek herunterladen und installieren.
Sobald die Installation abgeschlossen ist, sollten Sie in der Lage sein, die folgenden Klassen von IronPDF und Apache Tika Parser in Ihr Projekt zu importieren und zu verwenden.
Java-Code zum Lesen von PDF-Dokumenten
Hier ist der Code, den Sie verwenden können, um die neue Datei mit oder ohne tabellarische Begrenzungen unter Verwendung der IronPDF-Bibliothek zu lesen.
import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
public class Test {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
}
}
import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
public class Test {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
}
}
JAVA
In diesem Programm wird die PdfDocument-Klasse in IronPDF verwendet, um die Inhalte einer PDF-Datei zu lesen. Die erste Zeile des Programms importiert die benötigten Klassen aus der IronPDF-Bibliothek. Die zweite Zeile importiert die IOException-Klasse aus der Java-Standardbibliothek.
Das Programm definiert eine öffentliche Klasse namens Test. Innerhalb der Klasse gibt es eine public static Methode namens main, die ein Array von Zeichenfolgen als Argument annimmt.
Die main-Methode verwendet die [fromFile-Methode von PdfDocument in IronPDF](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#fromFile(java.nio.file.Path) Methode der PdfDocument-Klasse, um eine PDF-Datei, die sich unter "C:\sample.pdf" befindet, zu laden. Diese Methode gibt ein PdfDocument-Objekt zurück, das die PDF-Datei repräsentiert.
Sobald die PDF-Datei geladen ist, ruft das Programm die [extractAllText-Methode von PdfDocument in IronPDF](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())-Methode der PdfDocument-Klasse auf, um den gesamten Text aus der PDF-Datei zu extrahieren. Diese Methode gibt einen String zurück, der den gesamten Text der PDF-Datei enthält.
Der extrahierte Text wird dann in einer String-Variable namens "text" gespeichert. Diese Variable kann verwendet werden, um den Inhalt der PDF-Datei zu verarbeiten oder anzuzeigen.
Schließlich gibt das Programm den extrahierten Text mit der Methode System.out.println auf der Konsole aus.
Programmausgabe
Schlussfolgerung
IronPDF ist eine großartige Lösung für das Lesen von PDF-Dateien innerhalb desselben Pfades oder mehrerer verschiedener Pfade in Java, da es eine hohe Leistung und viele Funktionen bietet, die die Entwicklung von PDFs erleichtern. Die Syntax ist einfach und benutzerfreundlich. Die API ermöglicht es Entwicklern, den Code, den sie für ihre Projekte benötigen, schnell zu erstellen.
Erkunden Sie die Lizenzierungsoptionen von IronPDF Pläne beginnen ab nur $749, was es erschwinglich macht, Inhalte für diejenigen mit begrenztem Budget zu extrahieren. Insgesamt ist IronPDF eine hervorragende Option für jeden Java-Entwickler, der mit PDFs in seiner Java-Anwendungsprogrammierung arbeiten möchte.
Jordi beherrscht vor allem Python, C# und C++. Wenn er seine Fähigkeiten bei Iron Software nicht einsetzt, programmiert er Spiele. Durch seine Mitverantwortung für Produkttests, Produktentwicklung und Forschung trägt Jordi wesentlich zur kontinuierlichen Produktverbesserung bei. Die vielseitigen Erfahrungen, die er sammelt, bieten ihm immer wieder neue Herausforderungen, und er sagt, dass dies einer seiner Lieblingsaspekte bei Iron Software ist. Jordi wuchs in Miami, Florida, auf und studierte Informatik und Statistik an der University of Florida.
< PREVIOUS Hinzufügen digitaler Signaturen zu PDFs in Java