Norconex HTTP收集器是一个网络蜘蛛或爬虫,旨在帮助您浏览互联网,并提取您需要为您的项目信息。它是一种可以用在命令行模式或作为一个Java库以加载某一结构的便携式工具。使用HTTP...

Norconex进口商是一个Java库和命令行应用程序旨在分析和提取出内容的计算机文件为纯文本的,不管它的格式(HTML,PDF和Word)。该软件允许你使用命令行工具来指定要解析的文件和内容。此外,它可以让你输入或在您自己的服务或应用程序在使用它之前执行对所提取的文本的任何操作。...

Norconex提交者负责提交,或将文件提取或转换到目标数据源的结果的Java库。该库是用Java开发的,并允许程序员来实施其项目这一功能。它使用了Norconex HTTP收集,处理文件成功抓取 要求:...

Norconex JEF首先是一个Java API库。这是为了方便开发商和集成商谁必须建立任何形式的维护任务的服务器上的生活。 Norconex JEF让您建立这些工作,你通常会使用Java。然后,JEF Norconex努力,使其更容易通过提供一组出的现成的功能,否则将繁琐和昂贵,有时从头开始做。这些功能包括更好的错误处理和报告,故障恢复(恢复他们失败的作业),链各个岗位,并集中处理记录 要求: < P>...