拱门就是Apache的Nutch(一种流行的,高度可扩展的通用搜索引擎)的内部网搜索一个开源的扩展。不满意自己的企业搜索引擎?这并不令人惊讶,很少有人。据我们所知,有没有内联网引擎工作,以及在谷歌的全球网络搜索一样。有这个一个根本原因:全球网络(或类似)上使用由谷歌的算法不上内部网的统计数据缺乏工作几乎一样好。凯旋门(最终!)解决了这个问题。它采用一种新的方法能够提供高精度的搜索结果中的伟大工程。不相信吗?盲测评估工具都包括在内。您可以部署拱门和它的性能比较采用盲测方法,当前的搜索引擎和/或谷歌(在您的网站的公共部分)。
除了优秀的搜索质量,拱门有企业环境至关重要的许多功能:
- 文档级的安全性。用户只能找到他们有权查看的文档。
- 经济指标的更新。拱能够保持指数最新和避免常规完整的网站重新进行抓取。
- 24/7库存状况。总是存在可用的一个工作指数,即使抓取失败。- 同时进行索引和搜索的多个网站,以搜索和管理分开任何站点,如果需要能力的支持。动态添加和去除的网站是容易的。
- 自动生成的站点目录。
- 低成本的支持一旦部署。
- 易于部署和定制的双界面(PHP和Java)。
- 面搜索“开箱即用”。
- 广泛的和可扩展的一套解析器解析各种文件格式:HTML,PHP,PDF,微软Office,开放式办公,等等。
- 模块化的,基于插件的架构,可以轻松定制和扩展。
- 源代码包含。
- 高性能和可扩展性。拱门可以在计算机集群索引非常大的数据集运行
什么是此版本的新:
版本1.9.2:改进文档解析,移植于1.9 Nutch的
什么是新的在1.7版本:
添加安全扫描,移植在Nutch的1.7
要求:
的Java 1.7,Cygwin的
评论没有发现