Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
Dieser Artikel wird untersuchen, wie man einen PDF-Reader erstellt, um eine PDF-Datei in Ihrer Softwareanwendung programmgesteuert zu öffnen. IronPDF for Java ist eine solche Systembibliothek, die das Öffnen und Lesen von PDF-Dateien anhand des Dateinamens in Java-Programmen ermöglicht.
fromFile
methode zum Laden vorhandener PDF-DokumenteextractAllText
methode zum Extrahieren von eingebettetem Text in PDFsextractTextFromPage
methodeDieIronPDF - Java-Bibliothekbasiert auf dem bereits erfolgreichen .NET Framework. Dies macht IronPDF im Vergleich zu anderen Klassenbibliotheken wie Apache PDFBox zu einem vielseitigen Werkzeug für die Arbeit mit PDF-Dokumenten. Es bietet die Möglichkeit zuextrahieren und Parsen von Inhalten, Text laden, und Bilder laden. Es bietet auch Optionen an, um die PDF-Seiten anzupassen, wie zum BeispielSeitenlayoutRänderkopf- und Fußzeile, seitenausrichtungund vieles mehr.
Zusätzlich dazu unterstützt IronPDF auch die Konvertierung aus anderen Dateiformaten, das Schützen von PDFs mit einem Passwort, das digitale Signieren sowie das Zusammenführen und Aufteilen von PDF-Dokumenten.
Um IronPDF zu verwenden, um einen Java-PDF-Reader zu erstellen, müssen folgende Komponenten auf dem Computer installiert sein:
JDK - Java Development Kit ist für die Erstellung und Ausführung von Java-Programmen erforderlich. Falls es nicht installiert ist, laden Sie es herunter von der Oracle-Website.
IDE - Eine Integrierte Entwicklungsumgebung ist eine Software, die beim Schreiben, Bearbeiten und Debuggen eines Programms hilft. Laden Sie eine beliebige IDE für Java herunter, z.B. Eclipse, NetBeans, IntelliJ.
Maven - Maven ist ein Automatisierungswerkzeug, das beim Herunterladen von Bibliotheken aus dem Central Repository hilft. Laden Sie es von derApache Maven Website.
pom.xml
-Datei ein, wie im unten stehenden Beispiel gezeigt:<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>com.ironsoftware</artifactId>
<version>2025.2.8</version>
</dependency>
Fügen Sie zunächst den folgenden Code in die Java-Quelldatei ein, um alle erforderlichen Methoden von IronPDF zu referenzieren. Import org ist in diesem Beispiel optional.
import com.ironsoftware.ironpdf.*;
Als nächstes konfigurieren Sie IronPDF mit einem gültigen Lizenzschlüssel, um seine Methode zu verwenden. Rufen Sie die Methode setLicenseKey
in der Hauptmethode auf.
License.setLicenseKey("Your license key");
Hinweis: Sie können einen kostenlosen Testlizenzschlüssel erhalten, um PDFs zu erstellen, zu lesen und zu drucken.
AnpDF-Dateien lesenfür die Übersetzung müssen PDF-Dateien vorhanden sein oder es kann eine erstellt werden. Dieser Artikel verwendet eine bereits erstellte PDF-Datei. Der Code ist einfach und ein zweistufiger Prozess, um Text aus dem Dokument zu extrahieren.
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
Im obigen Code,vonDatei
öffnet ein PDF-Dokument. Die Methode Paths.get
erhält das Verzeichnis der Datei und ist bereit, Inhalte aus der Datei zu extrahieren. Dann,[extrahiereAllText
](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())liest den gesamten Text im Dokument.
Die Ausgabe ist unten zu sehen:
PDF-Textausgabe lesen
IronPDF kann auch den Inhalt einer bestimmten Seite in einer PDF-Datei lesen. Die Methode extractTextFromPage
verwendet ein PageSelection
-Objekt, um einen Bereich von Seiten zu akzeptieren(s) aus dem der Text vorgelesen wird.
Im folgenden Beispiel wird der Text aus der zweiten Seite des PDF-Dokuments extrahiert. pageSelection.singlePage" nimmt den Index der Seite, die extrahiert werden soll.
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
PDF-Textausgabe lesen
Weitere Methoden, die in der PageSelection
-Klasse verfügbar sind und zur Textextraktion aus verschiedenen Seiten verwendet werden können, umfassen:[ersteSeite](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#lastPage()), [letzteSeite](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#firstPage()), Seitenbereich
und[alleSeiten](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#allPages()).
Der Suchtext kann auch in einer neu erzeugten PDF-Datei entweder aus einer HTML-Datei oder einer URL durchgeführt werden. Der folgende Beispielcode generiert PDFs aus der URL und extrahiert den gesamten Text von der Website.
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
String text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
Aus einer neuen Datei lesen
IronPDF kann auch verwendet werden, umbilder extrahieren aus PDF-Dateien.
Der vollständige Code lautet wie folgt:
import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import com.ironsoftware.ironpdf.edit.PageSelection;
import java.io.IOException;
import java.nio.file.Paths;
public class Main {
public static void main(String[] args) throws IOException {
License.setLicenseKey("YOUR LICENSE KEY HERE");
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
}
}
Dieser Artikel erklärt, wie man PDFs in Java mit IronPDF öffnet und liest.
IronPDF hilft bei der einfachen Erstellung von PDFs aus HTML oder URL und bei der Konvertierung aus verschiedenen Dateiformaten. Auch PDF-Aufgaben lassen sich damit schnell und einfach erledigen.
Versuchen Sie IronPDF für30 Tage kostenlose Testversionund herausfinden, wie gut es für Sie in der Produktion funktioniert. Erkunden Sie die kommerziellen Lizenzierungsoptionen für IronPDF die nur von $749 ausgehen.
10 .NET API-Produkte für Ihre Bürodokumente