学习Qoppa jPDFOptimizer的科学实践(八)

Qoppa
placeholder image
admin 发布于:2025-06-12 10:33:46
阅读:loading

Qoppa Software是一家专注于PDF处理和数字文档解决方案的公司,提供丰富的Java、.NET和Web平台的组件。其产品广泛应用于企业、ZF*、金融、医疗等行业,旨在简化PDF和数字文档的处理、管理和集成。特别说明:只为单纯的学习摸索与自我突破,商业软件请勿直接使用于生产环境(购买商业授权)

1.基本介绍

jPDFOptimizer 是一个 Java 库,用于优化和减少 PDF 文档大小的 Java 库。

jPDFOptimizer 可以移除 PDF 文档中不必要的对象,检测并合并重复的图像和字体,并修改图像分辨率、压缩率和色彩空间以减小文件大小。该库提供了强大而简单的 API,让调用应用程序可以微调文档的优化方式。

jPDFOptimizer 基于 Qoppa Software 丰富的 PDF 技术构建,无需任何第三方软件或驱动程序。该库完全由 Java 编写,可在任何支持标准 Java 实现的操作系统上运行,例如 Windows、Linux、Unix、Solaris 等。

2.组件介绍

  • 修改图像分辨率、压缩和色彩空间

  • 使用 JPEG、JPEG 2000 和 JBIG2 压缩图像

  • 压缩数据流

  • 删除未使用的对象

  • 删除并合并重复的图像和字体

  • 灵活的优化选项

  • 线性化 PDF 以便快速网页查看

  • 支持最新的 PDF 格式

  • 支持JDK1.6及以上版本

  • 适用于 Windows、Linux、Unix、Mac OS X(100% Java)

  • 无需第三方软件或驱动程序

3.代码示例

public class SampleOptimizer {

    public static void main(String[] args) throws Exception {
        QoppaRegister.registerJPDFOptimizer();

        PDFOptimizer document = null;
        try {
            document = new PDFOptimizer(new File("resources/input/hello.pdf").getPath(), null);
            document.optimize(new OptSettings() , "resources/output/jPDFOptimizer_HelloWorld.pdf");
        } finally {
            if (document != null) {
                document.close();
            }
        }
    }

}

image.png

(输出文件有水印)

image.png

(输出文件无水印)

4.示例说明

(1)示例使用了jPDFOptimizer操作PDF文档的示例;

(2)示例中演示了未科学使用时输出PDF文件就有文档水印;

(3)示例中演示了科学使用后设输出PDF文档没有文档水印;

(4)示例执行后会生成的文档大小为:1.37MB(1,441,066 字节),原始文档大小为:1.46 MB (1,538,704 字节);

(5)二者文档内容上未知具体存在什么差异,并未掌握这个组件是做什么的,这个示例有什么具体意义,重点在于科学实践;

5.其它说明

(1)Qoppa Software推出了15款Java集成开发组件库,,除此之外的其它组件在生成/转换为PDF文档时,应该需要处理文档属性中的“制作工具”

(2)更多的组件需要使用License注册,使用试用版本将会有对应的试用提示信息,比如插入文字水印、图片中被插入水印、内容中被插入DEMO字样的文本,所以科学使用的目的在于单纯使用对应的工具库,不需额外关注License,又不改动Jar文件中的class,同时又恰好没有水印和文本混乱的限制。特别说明:只为单纯的学习摸索与自我突破,商业软件请勿直接使用于生产环境(购买商业授权)

(3)官网提供了对应各个组件的示例代码和组件库的Jar文件下载,未找到有试用Maven库管理组件的形式,需要自行下载相关的组件;

(4)官网的某些页面资料中也有说明还包含上述产品组件范围之外的其它组件,如:OCR等,没有找到详细的示例使用介绍,不作为本次学习摸索的重点;

(5)官网提供的试用组件的Jar文件中的class有经过加密混淆,从class部分入门则难道比较高,本次对于系列组件的摸索在于科学使用方面,对于组件提供的功能广度与深度应用不作过多的摸索;

(6)对各个组件学习摸索的时间并不算太多,发现这么多组件应该不能同时作用于同一个项目中,因为它们不同的组件Jar中提供的class类文件路径存在同名或同类的,存在互相冲突的场景,不知道是否有说明白,以jPDFWriter与jPDFWeb两个组件Jar的截图如下: 

image

(7)相关示例输出文件下载:《jPDFOptimizer.zip》;


 点赞


 发表评论

当前回复:作者

 评论列表


留言区