【日常杂耍】PDF相关

 

故事开始于昨天早上,接收到一条短信,告诉我有一个小项目可以接,接着我联系了一天,都没有确定是要做什么,没有明确的需求,大概知道了会和PDF相关信息的检索有关,随后我就开始自己先琢磨一下了,今天又快过完了,还是没得需求,十月底要弄出来,真的想说,“赚钱不容易呀”。

pdfboxNet库

PDFBox是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具,pdfboxNet也就是pdfbox的.Net实现了。

主要特性包括:从PDF提取文本、合并PDF文档、PDF文档加密与解密、与Lucene搜索引擎的集成、填充PDF/XFDF表单数据、从文本文件创建PDF文档、从PDF页面创建图片、打印PDF文档等等。

大概参考了一下这篇文章,C#读取PDF ——PDFBox使用,其中不需要和文章中说的一样取下载库文件,在VS集成开发环境中,使用NnGet直接搜索安装就好了。

文章有点古老了,技术我也不知道是不是被淘汰了,其实我只是想验证我的想法,打开PDF提取相关信息,这里就以及验证了可以提取信息,虽然后来通过进一步的交流发现,那边又整理好的EXCEL表格,可能是检索EXCEL吧,还是步完全清楚需求,罢了罢了,继续玩一玩PDF相关的东西吧。

PDF winform控件

一想,玩一下PDF相关的Winform控件吧,随后就开始找了。

Adobe提供的ActiveX控件

Adobe提供的ActiveX控件,这里没有具体尝试,需要在安装adobe acrobat。

相关链接

【C# 基础】— 解决 “winForm 引用 Adobe PDF Reader控件不显示pdf 文件” 问题 CSDN问题:C# winform Acrobat Reader 显示pdf如何获取当前页数,提到了Free Spire.PDFViewer、devexpress pdf的控件

DevExpress的PDF控件

听说比较好用,有点跃跃欲试的感觉,但是一个license需要18k+,果断放弃了,不过网上有破解版,之后有时间再尝试一下。

相关链接

PDF Viewer文档

基于DevExpress实现对PDF、Word、Excel文档的预览及操作处理

DevExpress控件使用详细说明

DevExpress 编译成功的 dll

DevExpress 18 源代码编译方法

2014年DevExpress使用教程合集

DevExpressSources151

devexpress 使用安装、破解注册和汉化包进行汉化的步骤

DevExpress安装文件、源码、注册破解下载

没有尝试的收费的PDF控件

ComponentOne-PDF for WinForm

Free Spire.PDFViewer for .NET 收费,但是也有免费版,免费版有功能上的限制,比如只能显示10页。

开源的PDF控件

PDF Viewer Control Without Acrobat Reader Installed 很老的开源项目了,09年的。

The PDFView4NET toolkit 免费的,并且持续更新,有时间再尝试一下。相关链接

PdfiumViewer

一个免费的.NET的PDF控件库。PdfiumViewer GitHub库 PdfiumBuild GitHub库

PdfiumBuild库的下载,对应在NuGet下载PdfiumViewer.Native.x86_64.v8-xfa库和PdfiumViewer.Native.x86.v8-xfa库就好了,而PdfiumViewer库在NuGet对应的搜索下载就好了。

其中我下载了PdfiumViewer Github上的源码,跑了PdfiumViewer的Demo项目,除了页面老了点,其他是极好的。

写在最后

PDF相关的库就大概接触了一下上面这些了,不多说了,PDF相关的东西,以后有用得到再翻一翻看一看吧。