import com.ironsoftware.ironpdf.*; import java.io.IOException; import java.nio.file.Paths; // Apply your license key License.setLicenseKey("YOUR-LICENSE-KEY"); // Set a log path Settings.setLogPath(Paths.get("C:/tmp/IronPdfEngine.log")); // Render the HTML as a PDF. Stored in myPdf as type PdfDocument; PdfDocument myPdf = PdfDocument.renderHtmlAsPdf("<h1> ~Hello World~ </h1> Made with IronPDF!"); // Save the PdfDocument to a file myPdf.saveAs(Paths.get("html_saved.pdf"));

USO DE IRONPDF FOR JAVA

Cómo leer archivos PDF en Java

Name: IronPDF
Brand: Iron Software
Availability: InStock
Rating: 4.87 (307 reviews)

Darrius Serrant

19 de marzo, 2023

Actualizado 25 de agosto, 2024

Leer un documento PDF en Java puede ser una parte integral de cualquier proyecto, desde aplicaciones empresariales hasta análisis de datos. Con la biblioteca IronPDF, ahora es más fácil que nunca integrar funciones de procesamiento de PDF en sus proyectos Java.

Cómo leer archivos PDF en Java

Instalar IronPDF para Leer Archivos PDF en Java
Cargue un documento PDF existente usando el método fromFile
Crear un nuevo PDF a partir de una cadena HTML, un archivo o una URL web
Utilice el método extractAllText para leer texto del PDF abierto
Imprimir texto extraído de PDF en la consola o guardar en Java

IronPDF: Importar biblioteca PDF Java

Descripción general de la biblioteca IrotPDF Java PDF es la solución perfecta para los desarrolladores de software que necesitan producir PDFs de alta calidad, listos para captura rápidamente a partir de HTML. La biblioteca también proporciona potentes herramientas de manipulación de documentos que permiten un control dinámico sobre el diseño y formato de página en IronPDF, el contenido y el formato.

Veamos cómo leer un archivo PDF almacenado en una ruta en un programa Java utilizando la biblioteca IronPDF.

Leer PDF con IronPDF

El primer paso es instalar IronPDF usando Maven, se pueden encontrar más detalles en la Guía de Instalación de IronPDF.

Instalar IronPDF en Maven

Estos son los pasos para instalar IronPDF en un proyecto Maven:

Abra su proyecto Maven en su IDE preferido.
En el archivo pom.xml, añade la dependencia de la biblioteca IronPDF en la sección dependencies.

    :ProductInstall

Guarda el archivo pom.xml y deja que Maven descargue e instale la biblioteca IronPDF.
Una vez completada la instalación, debería poder importar y utilizar las siguientes clases de IronPDF y los analizadores Apache Tika en su proyecto.

Código Java para leer documentos PDF

Aquí está el código que puede utilizar para leer el nuevo archivo con o sin límites tabulares utilizando la biblioteca IronPDF.

import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;

public class Test {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));  
        String text = pdf.extractAllText();
        System.out.println(text);
    }
}

import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;

public class Test {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));  
        String text = pdf.extractAllText();
        System.out.println(text);
    }
}

JAVA

En este programa, la clase PdfDocument en IronPDF se utiliza para leer el contenido de un archivo PDF. La primera línea del programa importa las clases necesarias de la biblioteca IronPDF. La segunda línea importa la clase IOException de la biblioteca estándar de Java.

El programa define una clase pública llamada Test. Dentro de la clase, hay un método public static llamado main que toma un array de cadenas como argumento.

El método main utiliza el método fromFile de PdfDocument en IronPDF de la clase PdfDocument para cargar un archivo PDF ubicado en "C:\sample.pdf". Este método devuelve un objeto PdfDocument que representa el archivo PDF.

Una vez que se carga el archivo PDF, el programa llama al [método extractAllText de PdfDocument en IronPDF](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText()) del capítulo PdfDocument para extraer todo el texto del archivo PDF. Este método devuelve un String que contiene todo el texto en el archivo PDF.

El texto extraído se almacena luego en una variable String llamada "text". Esta variable puede utilizarse para procesar o mostrar el contenido del archivo PDF.

Finalmente, el programa imprime el texto extraído en la consola utilizando el método System.out.println.

Cómo Leer un Archivo PDF en Java, Figura 1: Resultado del Programa

Salida del programa

Conclusión

IronPDF es una gran solución para leer archivos PDF dentro de la misma ruta o de varias rutas diferentes en Java, ya que ofrece un alto rendimiento y muchas funciones que facilitan el desarrollo de PDF. Su sintaxis es sencilla y fácil de usar. Su API permite a los desarrolladores crear rápidamente el código que necesitan para sus proyectos.

Explore las opciones de licencia de IronPDF los planes comienzan desde solo $749, lo que lo hace accesible para extraer contenido para aquellos con un presupuesto limitado. En general, IronPDF constituye una excelente opción para cualquier desarrollador Java que desee trabajar con archivos PDF en la programación de sus aplicaciones Java.

Darrius Serrant

Chatea con el equipo de ingeniería ahora

Ingeniero de Software Full Stack (WebOps)

Darrius Serrant tiene una licenciatura en Informática de la Universidad de Miami y trabaja como Ingeniero de Marketing WebOps Full Stack en Iron Software. Atraído por la programación desde una edad temprana, veía la computación como algo misterioso y accesible, lo que la convertía en el medio perfecto para la creatividad y la resolución de problemas.

En Iron Software, Darrius disfruta creando cosas nuevas y simplificando conceptos complejos para hacerlos más comprensibles. Como uno de nuestros desarrolladores residentes, también se ha ofrecido como voluntario para enseñar a los estudiantes, compartiendo su experiencia con la próxima generación.

Para Darrius, su trabajo es gratificante porque es valorado y tiene un impacto real.

< ANTERIOR
Cómo añadir firmas digitales a los PDF en Java

SIGUIENTE >
Cómo rotar un archivo PDF en Java

Instalar con Maven

Versión:2025.4.4

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2025.4.4</version>
</dependency>

Informar un Problema

Únete a nuestro Bug Bounty para Iron Swag

¿Listo para empezar? Versión: 2025.4 acaba de salir

Ver licencias >

Cómo leer archivos PDF en Java

Cómo leer archivos PDF en Java

IronPDF: Importar biblioteca PDF Java

Leer PDF con IronPDF

Instalar IronPDF en Maven

Código Java para leer documentos PDF

Conclusión

En esta página

Informar un Problema

¿Listo para empezar? Versión: 2025.4 acaba de salir

Siguiente paso: Comienza la prueba gratuita de 30 días

Siguiente paso: Comienza la prueba gratuita de 30 días

Más de 2 millones de ingenieros de todo el mundo confían en nosotros

IronPDF forma parte de IRONSUITE