如何压缩 PDF

Chaknith related to 如何压缩 PDF
查克尼特·宾
2023年十月26日
更新 2024年十二月10日
分享:
This article was translated from English: Does it need improvement?
Translated
View the article in English

PDF压缩是指减少PDF(便携式文档格式)文档的文件大小的过程。 此压缩用于使 PDF 文件更便于存储、分享和传输,尤其是在处理大型或图像丰富的文档时。

图像通常占据PDF文件大小的很大一部分,因为与文本和其他内容相比,图像的尺寸通常较大。 IronPdf 提供 PDF 压缩功能,可压缩嵌入的图像并减少 PDF 中经常伴随表格数据的树形结构。

开始使用IronPDF

立即在您的项目中开始使用IronPDF,并享受免费试用。

第一步:
green arrow pointer



压缩图片示例

调整JPEG图片的大小时,100%的质量几乎没有损失,而1%的质量则是非常低的输出图像。

  • 90% 及以上:被认为是高质量的
  • 80%-90%:被认为是中等质量
  • 70%-80%:被认为是低质量的

    请随意探索各种值以了解质量与文件大小之间的权衡。需要注意的是,质量降低将根据输入图像的类型而有所不同,某些图像可能比其他图像更明显地感受到清晰度的降低。

:path=/static-assets/pdf/content-code-examples/how-to/pdf-compression-image.cs
using IronPdf;

ChromePdfRenderer renderer = new ChromePdfRenderer();

PdfDocument pdf = renderer.RenderUrlAsPdf("https://en.wikipedia.org/wiki/Main_Page");

// Compress images in the PDF
pdf.CompressImages(40);

pdf.SaveAs("compressed.pdf");
Imports IronPdf

Private renderer As New ChromePdfRenderer()

Private pdf As PdfDocument = renderer.RenderUrlAsPdf("https://en.wikipedia.org/wiki/Main_Page")

' Compress images in the PDF
pdf.CompressImages(40)

pdf.SaveAs("compressed.pdf")
$vbLabelText   $csharpLabel

压缩图片 - 尺寸对比

降低了39.24%!!

压缩图像 - 大小对比

了解图像压缩选项

让我们深入了解我们的图像压缩选项的细节:

ShrinkImage:此功能根据图像在PDF文档中的可见尺寸降低其分辨率。 通过这样做,它显著减小了图像的大小和质量,优化它们以便于高效存储和传输。

HighQualitySubsampling:此设置决定用于图像压缩的色度子采样方法。 选择“True”会使用4:4:4色度抽样,确保图像质量更高,颜色细节完整。 相反,选择“False”会使用4:1:1色度二次采样,这牺牲了一些颜色细节以进一步减小图像大小。

色度二次采样是数字图像压缩中的一种关键技术,旨在减少表示图像所需的数据量,同时保持其视觉质量。 它通过选择性地降低色彩信息(色度)的分辨率,同时保持亮度信息(亮度)的全分辨率来实现这一点。

在“4:4:4”色度二次采样中,每个像素保留其自身的颜色信息,因此不会丢失颜色细节。 相反,在“4:1:1”色度二次采样中,颜色信息以较低的分辨率进行采样,减少了颜色细节,但也减小了文件大小。


压缩树结构示例

此功能用于通过最小化Chrome引擎创建的树结构来减少PDF的大小。它适用于由Chrome引擎从包含大量表格数据的HTML生成的PDF。 一些PDF渲染引擎可能输出没有这种树结构的PDF,使该功能无效。

删除所有这些树状结构的缺点是,对于某些PDF文件,高亮显示文本或提取可能无法有效工作。

让我们使用带有表格数据的PDF来测试CompressStructTree方法

:path=/static-assets/pdf/content-code-examples/how-to/pdf-compression-tree-structure.cs
using IronPdf;

PdfDocument pdf = PdfDocument.FromFile("table.pdf");

// Compress tree structure in PDF
pdf.CompressStructTree();

pdf.SaveAs("compressedTable.pdf");
Imports IronPdf

Private pdf As PdfDocument = PdfDocument.FromFile("table.pdf")

' Compress tree structure in PDF
pdf.CompressStructTree()

pdf.SaveAs("compressedTable.pdf")
$vbLabelText   $csharpLabel

压缩树结构 - 尺寸比较

减少67.90%!! 如果表格 PDF 较大,这一比例还会增加。

压缩树结构 - 尺寸对比

高级压缩方法

IronPdf 还具有一个Compress方法,可用于配置图像压缩和树结构压缩,使文档压缩比以往更简单。

:path=/static-assets/pdf/content-code-examples/how-to/pdf-compression-compress.cs
using IronPdf;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

CompressionOptions compressionOptions = new CompressionOptions();

// Configure image compression
compressionOptions.CompressImages = true;
compressionOptions.JpegQuality = 80;
compressionOptions.HighQualityImageSubsampling = true;
compressionOptions.ShrinkImages = true;

// Configure tree structure compression
compressionOptions.RemoveStructureTree = true;

pdf.Compress(compressionOptions);

pdf.SaveAs("compressed.pdf");
Imports IronPdf

Private pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")

Private compressionOptions As New CompressionOptions()

' Configure image compression
compressionOptions.CompressImages = True
compressionOptions.JpegQuality = 80
compressionOptions.HighQualityImageSubsampling = True
compressionOptions.ShrinkImages = True

' Configure tree structure compression
compressionOptions.RemoveStructureTree = True

pdf.Compress(compressionOptions)

pdf.SaveAs("compressed.pdf")
$vbLabelText   $csharpLabel

探索可用选项

  • CompressImages:控制文档中的现有图像是否使用 JPG 编码进行压缩。 它默认为 false。
  • RemoveStructureTree:移除结构树可以显著减少文档使用的磁盘空间。 然而,这可能会对文本选择产生负面影响,尤其是在复杂的文档中。
  • JpegQuality:指定图像压缩过程中使用的JPEG质量(范围从1到100)。 它默认为42。
  • HighQualityImageSubsampling:此属性决定是否使用444色度抽样以提高图像质量(true),或使用411色度抽样以进一步减少图像大小(false)。
  • ShrinkImages:缩小图像分辨率可以大大减少文档中图像的大小和质量。
Chaknith related to 探索可用选项
软件工程师
Chaknith 是开发者中的福尔摩斯。他第一次意识到自己可能在软件工程方面有前途,是在他出于乐趣做代码挑战的时候。他的重点是 IronXL 和 IronBarcode,但他为能帮助客户解决每一款产品的问题而感到自豪。Chaknith 利用他从直接与客户交谈中获得的知识,帮助进一步改进产品。他的轶事反馈不仅仅局限于 Jira 票据,还支持产品开发、文档编写和市场营销,从而提升客户的整体体验。当他不在办公室时,他可能会在学习机器学习、编程或徒步旅行。