jPDFText是一个从PDF文档中提取文本的Java库。使用jPDFText,可以处理PDF文档以提取文本内容以进行存档,存储,搜索或索引。 jPDFText建立在Qoppas专有PDF技术之上,因此您无需安装任何第三方软件或驱动程序。由于它是用Java编写的,因此它允许您的应用程序保持独立于平台,并在Windows,Linux,Unix(Solaris,HP UX,IBM AIX),Mac OS X以及支持Java运行时环境的任何其他平台上运行。
主要特点:
从文件,网络驱动器,URL或输入流加载PDF文档。
以逻辑阅读顺序提取文本。
提取单词作为字符串的向量。
适用于Windows,Linux,Unix和Mac OS X(100%Java)。
部署时无需安装或配置其他驱动程序或软件。
在JDK 1.4.2及更高版本上测试过。
评论没有发现