PDFMiner

PDFMiner 20140328

PDFMiner通过首先考虑的PDF文件的内容,并把它转换为如HTML一个更有延展性的格式。从那里,文本和数据被提取和分析,并基于分离并呈现给用户,或传送到其它更强大的数据分析工具的预定义的规则。如果文本分析是不是你打算做什么,你可以轻松地配置PDFMiner简单地提取或者只是将PDF转换数据为好。它的功能可相互独立工作,并允许更广泛的使用范围全靠它 功能: 100%的Python代码,没有C或C ++ 解析PDF文件分析PDF文件...

阅读更多