PDFから画像を抽出する

try {
    List<BufferedImage> images = pdf.extractAllImages();
    System.out.println("Number of images extracted from the website: " + images.size());

    int i = 0;
    for (BufferedImage image : images) {
        ImageIO.write(image, "PNG", Files.newOutputStream(Path.of("assets/extracted_" + ++i + ".png")));
    }
} catch(Exception exception) {
    System.out.println("Failed to extract images from the website");
    exception.printStackTrace();
}

PDFから画像を抽出する

IronPDFのPDF作成・編集機能の広範なコレクションの一部として、IronPDFはコンテンツ抽出メソッドによりPDFドキュメントのコンテンツのきめ細かな処理を促進します。

extractAllImages は、PDF ドキュメントに埋め込まれたすべての画像をコレクションとして返し、それぞれが BufferedImage オブジェクトとしてフォーマットされています。

最も一般的なビジネスユースケースは、PDF画像を別々のファイルに保存することです。上記のコード例は、extractAllImages メソッドと Java の ImageIO クラスを使用してこれを達成する方法を示しています。

IronPDFはPDFから生のバイト形式で画像を抽出することもできます。これには、代わりに extractAllRawImages メソッドを使用してください。

PDFページのサブセットから画像を抽出することも可能です(全文書に対してというよりも). 以下の簡単なコードスニペットは、extractAllImagesFromPagesメソッドを使用して、サンプルドキュメントのページ3および7から画像を抽出します。

PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));

PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));

JAVA