PdfMasher

PdfMasher 0.7.4

PdfMasher是一个工具,转换就绪换电子书HT​​ML文件包含文本的PDF文件。 PdfMasher询问每一段文字的角色的用户,并执行它以有效的方式。您的PDF有每一页上一个头,你不希望他们的垃圾文字。排序文本元素通过Y位置(这样可以把它们放在一起),却将选择的元素,它们标记为忽略。他们将不会出现在最终的HTML。如果你的PDF有脚注许多网页,排序你的元素通过文本内容(这样可以把与一个号开始一起文本中的所有元素),并标记它们作为脚注。他们将被移动到文件末尾,而PdfMasher将尝试创建超链接脚注引用...