如何访问所有 PDF DOM 对象
访问PDF DOM对象是指以类似于操作网页的DOM(文档对象模型)的方式与PDF文件的结构进行交互。 在 PDF 的上下文中,DOM 是文档内部结构的表示,允许开发人员以编程方式访问和操作不同的元素,如文本、图像、注释和元数据。
如何访问所有 PDF DOM 对象
- 下载 C# 库以访问 PDF DOM 对象
- 导入或渲染目标 PDF 文档
- 访问 PDF 的页面集合并选择所需的页面
- 使用ObjectModel属性查看和与DOM对象进行交互
- 保存或导出修改后的 PDF 文档
立即在您的项目中开始使用IronPDF,并享受免费试用。
访问 DOM 对象示例
ObjectModel 可以从 PdfPage 对象访问。 首先,导入目标PDF并访问其Pages属性。 从那里选择任意页面,您将可以访问ObjectModel属性。
[{e:(此功能仍处于实验阶段。 从 DOM 访问文本对象时会泄漏内存。
:path=/static-assets/pdf/content-code-examples/how-to/access-pdf-dom-object.cs
using IronPdf;
using System.Linq;
// Instantiate Renderer
ChromePdfRenderer renderer = new ChromePdfRenderer();
// Create a PDF from a URL
PdfDocument pdf = renderer.RenderUrlAsPdf("https://ironpdf.com/");
// Access DOM Objects
var objects = pdf.Pages.First().ObjectModel;
Imports IronPdf
Imports System.Linq
' Instantiate Renderer
Private renderer As New ChromePdfRenderer()
' Create a PDF from a URL
Private pdf As PdfDocument = renderer.RenderUrlAsPdf("https://ironpdf.com/")
' Access DOM Objects
Private objects = pdf.Pages.First().ObjectModel

ObjectModel 属性当前由 ImageObject、PathObject 和 TextObject 组成。 每个对象都包含其所在页面索引、边界框、比例和翻译等信息。 这些信息也可以修改。
ImageObject:
- 高度:图片高度。
- 宽度:图片宽度。
ExportBytesAsJpg:将图像导出为 JPG 格式字节数组的方法。
PathObject:
- FillColor:路径的填充颜色。
- StrokeColor:路径的描边颜色。
点:定义路径的点的集合。
TextObject:
- 颜色:文本的颜色。
- 内容:实际文本内容。