学习Qoppa jPDFWeb的科学实践(三)
Qoppa
admin 发布于:2025-06-10 09:42:30
阅读:loading
Qoppa Software是一家专注于PDF处理和数字文档解决方案的公司,提供丰富的Java、.NET和Web平台的组件。其产品广泛应用于企业、ZF*、金融、医疗等行业,旨在简化PDF和数字文档的处理、管理和集成。特别说明:只为单纯的学习摸索与自我突破,商业软件请勿直接使用于生产环境(购买商业授权)
jPDFWeb – Java PDF HTML5 转换库。在一些常规需求应用开发中也常会遇到对PDF文件进行操作,对应的开发库也是比较多的,本期跟大家分享的是“Qoppa Software”推出的Java开发库,可用于PDF文档的Web格式转换的应用场景。
(1)PDFWeb 是一个用于将 PDF 文档转换为 SVG/HTML5 的 Java 库。该库可以将 PDF 文档保存到本地文件系统或输出流,以便在 J2EE 服务器中工作时将文档直接提供给客户端浏览器;
(2)jPDFWeb 基于 Qoppa 专有的 PDF 技术构建,因此您无需安装任何第三方软件或驱动程序。由于它采用 Java 编写,因此您的应用程序能够独立于平台运行,可在 Windows、Linux、Unix(Solaris、HP UX、IBM AIX)、Mac OS X 以及任何其他支持 Java 运行时环境的平台上运行;
将 PDF 文档转换为 HTML5 / SVG
将 Microsoft Word 和 Excel 文档转换为 HTML5(与jOfficeConvert结合使用)
转换文本
(1)输出可搜索文本;
(2)保留原始 PDF 中的字体;
转换图像
(1)保留原始 PDF 中的图像分辨率;
(2)彩色图像转换为 JPEG;
(3)黑白图像或具有透明度的图像将转换为 PNG;
转换矢量图形
转换注释、链接和表单字段数据
转换数字签名验证状态
导出页面缩略图
支持 CJK 字体
支持最新的 PDF 格式
保存到文件系统或 Java 输出流
适用于 Windows、Linux、Unix 和 Mac OS X(100% Java)
在 JDK 1.6.37 及以上版本上测试
public class SampleWeb {
public static void main(String[] args) throws Exception {
QoppaRegister.registerJPDFWeb();
PDFWeb document = new PDFWeb(new File("resources/input/hello.pdf").toURI().toURL() , null);
//PDF转Svg
document.saveDocumentAsSVG(new File("resources/output/jPDFWeb_HelloWorld.svg").getPath());
//PDF转HTML
try (PrintWriter out = new PrintWriter("resources/output/jPDFWeb_HelloWorld.html")) {
out.println("<html><head><title>PDF2HTML</title></head><body>");
final int pageCount = document.getPageCount();
for (int i = 0; i < pageCount; i++) {
document.savePageAsSVG(i , out);
}
out.println("</body></html>");
}
}
}
(PDF转换SVG)
(PDF转换HTML)
(1)示例使用了jPDFWeb转换输出PDF文档;
(2)示例中演示将PDF转换为SVG格式文件;
(3)示例中演示将PDF转换为HTML格式文件;
(4)如果未能科学的使用,转换后的文档是有限制的,比如图片有水印和文本内容有被替换,参考如下图所示:
(1)Qoppa Software推出了15款Java集成开发组件库,其中jPDFWriter属于免费可商用的组件,除此之外的其它组件在生成/转换为PDF文档时,应该需要处理文档属性中的“制作工具”;
(2)更多的组件需要使用License注册,使用试用版本将会有对应的试用提示信息,比如插入文字水印、图片中被插入水印、内容中被插入DEMO字样的文本,所以科学使用的目的在于单纯使用对应的工具库,不需额外关注License,又不改动Jar文件中的class,同时又恰好没有水印和文本混乱的限制。特别说明:只为单纯的学习摸索与自我突破,商业软件请勿直接使用于生产环境(购买商业授权);
(3)官网提供了对应各个组件的示例代码和组件库的Jar文件下载,未找到有试用Maven库管理组件的形式,需要自行下载相关的组件;
(4)官网的某些页面资料中也有说明还包含上述产品组件范围之外的其它组件,如:OCR等,没有找到详细的示例使用介绍,不作为本次学习摸索的重点;
(5)官网提供的试用组件的Jar文件中的class有经过加密混淆,从class部分入门则难道比较高,本次对于系列组件的摸索在于科学使用方面,对于组件提供的功能广度与深度应用不作过多的摸索;
(6)对各个组件学习摸索的时间并不算太多,发现这么多组件应该不能同时作用于同一个项目中,因为它们不同的组件Jar中提供的class类文件路径存在同名或同类的,存在互相冲突的场景,不知道是否有说明白,以jPDFWriter与jPDFWeb两个组件Jar的截图如下:
(7)相关示例输出文件下载:《jPDFWeb.zip》;
点赞
发表评论
评论列表
留言区
- 学习Qoppa Software整体介绍(一)
- 学习Qoppa jPDFWriter的科学实践(二)
- 学习Qoppa jPDFText的科学实践(四)
- 学习Qoppa jPDFSecure的科学实践(五)
- 学习Qoppa jPDFPrint的科学实践(六)
- 学习Qoppa jPDFPreflight的科学实践(七)
- 学习Qoppa jPDFOptimizer的科学实践(八)
- 学习Qoppa jPDFImages的科学实践(九)
- 学习Qoppa jPDFFields的科学实践(十)
- 学习Qoppa jPDFAssemble的科学实践(十一)
- 学习Qoppa jPDFProcess的科学实践(十二)
- 学习Qoppa jOfficeConvert的科学实践(十三)
- 学习Qoppa jPDFViewer的科学实践(十四)
- 学习Qoppa jPDFNotes的科学实践(十五)
- 学习Qoppa jPDFEditor的科学实践(十六)