PdfMasher是一个工具,转换的准备用于电子书HTML文件包含文本的PDF文件。大多数电子书阅读器支持PDF文件本身,但它往往是一个真正的痛苦来读取这些文件,因为我们没有字体大小控制文档就像我们与本地电子书。在很多情况下,我们必须使用变焦功能,它只是一种痛苦。上的电子书阅读器PDF的另一个缺点是,不支持的注解。
点击看
目前已经有工具来转换PDF文件到喜欢的Calibre电子书,但他们做的是,他们试图猜测每一段文字,在PDF中的作用(如果你是幸运的)。我认为,在所有,但最简单的情况下,这是一个错误的认为,任何短期的AI都可以做这种猜测。
点击看
进入PdfMasher。 PdfMasher询问每一段文字的角色的用户,并执行它以有效的方式。您的PDF有每一页上一个头,你不希望他们的垃圾文字?排序文本元素通过Y位置(这样可以把它们放在一起),变速选择的元素和它们标记为忽略。他们将不会出现在最终的HTML。您的PDF具有许多页脚注?排序的元素通过文本内容(这样可以把与一个号开始一起文本中的所有元素),并标记它们作为脚注。他们将被移动到文件末尾,而PdfMasher将尝试创建超链接脚注引用
什么在此版本中是新的:
删除fairware对话框(更多信息)。
评论没有发现