PDFから画像を抽出する
IronPDFのPDF作成・編集機能の広範なコレクションの一部として、IronPDFはコンテンツ抽出メソッドによりPDFドキュメントのコンテンツのきめ細かな処理を促進します。
extractAllImages
は、PDF ドキュメントに埋め込まれたすべての画像をコレクションとして返し、それぞれが BufferedImage
オブジェクトとしてフォーマットされています。
最も一般的なビジネスユースケースは、PDF画像を別々のファイルに保存することです。 上記のコード例は、extractAllImages
メソッドと Java の ImageIO
クラスを使用してこれを達成する方法を示しています。
IronPDFはPDFから生のバイト形式で画像を抽出することもできます。 これには、代わりに extractAllRawImages
メソッドを使用してください。
PDFページのサブセットから画像を抽出することも可能です(全文書に対してというよりも). 以下の簡単なコードスニペットは、extractAllImagesFromPages
メソッドを使用して、サンプルドキュメントのページ3および7から画像を抽出します。
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
JavaでPDFから画像を抽出する方法
- IronPDF Javaライブラリのインストール
- PDFから画像を抽出するには、`extractAllImages`メソッドを使用します。
- 画像コレクションオブジェクト内の各画像を反復処理する
- 抽出された画像を Java の `write` メソッドでエクスポートします。
- 元のPDFに影響を与えずに抽出を行う