すべてのPDF DOMオブジェクトにアクセスする方法

This article was translated from English: Does it need improvement?
Translated
View the article in English

によって チャクニット・ビン

PDFのDOMオブジェクトにアクセスするということは、ウェブページのDOMを操作するのと同様に、PDFファイルの構造とやり取りすることを指します。(文書オブジェクトモデル). PDFの文脈において、DOMは文書の内部構造を表しており、開発者がテキスト、画像、注釈、メタデータなどの異なる要素にプログラム経由でアクセスし操作することを可能にします。

今日から無料トライアルでIronPDFをあなたのプロジェクトで使い始めましょう。

最初のステップ:
green arrow pointer

DOMオブジェクトへのアクセス例

ObjectModelPdfPageオブジェクトからアクセスできます。 まず、対象のPDFをインポートし、そのPagesプロパティにアクセスします。 そこから任意のページを選択すると、ObjectModel プロパティにアクセスできます。

警告
この機能はまだ実験段階です。 DOMからテキストオブジェクトにアクセスするとメモリリークが発生します。

:path=/static-assets/pdf/content-code-examples/how-to/access-pdf-dom-object.cs
using IronPdf;
using System.Linq;

// Instantiate Renderer
ChromePdfRenderer renderer = new ChromePdfRenderer();

// Create a PDF from a URL
PdfDocument pdf = renderer.RenderUrlAsPdf("https://ironpdf.com/");

// Access DOM Objects
var objects = pdf.Pages.First().ObjectModel;
Imports IronPdf
Imports System.Linq

' Instantiate Renderer
Private renderer As New ChromePdfRenderer()

' Create a PDF from a URL
Private pdf As PdfDocument = renderer.RenderUrlAsPdf("https://ironpdf.com/")

' Access DOM Objects
Private objects = pdf.Pages.First().ObjectModel
VB   C#
デバッグ

ObjectModelプロパティは現在、ImageObjectPathObject、およびTextObjectで構成されています。 各オブジェクトには、それがあるページインデックス、境界ボックス、スケール、および変換に関する情報が含まれています。 この情報も変更可能です。

ImageObject:

  • 高さ: 画像の高さ。
  • 幅: 画像の幅。
  • ExportBytesAsJpg: JPG形式のバイト配列として画像をエクスポートするメソッド。

    PathObject:

  • フィルカラー: パスの塗りつぶし色。
  • StrokeColor: パスのストロークの色。
  • ポイント: パスを定義する点の集合。

    テキストオブジェクト

  • 色: テキストの色。
  • コンテンツ: 実際のテキストコンテンツ。
Chaknith related to DOMオブジェクトへのアクセス例

チャクニット・ビン

ソフトウェアエンジニア

チャクニットは開発者のシャーロック・ホームズです。彼がソフトウェアエンジニアリングの将来性に気付いたのは、楽しみでコーディングチャレンジをしていたときでした。彼のフォーカスはIronXLとIronBarcodeにありますが、すべての製品でお客様を助けることに誇りを持っています。チャクニットは顧客と直接話すことで得た知識を活用して、製品自体のさらなる改善に貢献しています。彼の逸話的なフィードバックは、単なるJiraチケットを超えて、製品開発、ドキュメントおよびマーケティングをサポートし、顧客の全体的な体験を向上させます。オフィスにいないときは、機械学習やコーディングについて学んだり、ハイキングを楽しんだりしています。