Apache Nutch 2.3
阿帕奇Nutch的是建立在顶部的的Apache Lucene的,一个强大的Java搜索引擎。Nutch的开发人员修改了Lucene的代码库,转换数据无关的代码库的Lucene成专门用于搜索网络上的数据专门项目。这种技术可以用于搜索自己的Web页面作为一个内置的搜索服务器,或爬行网页寻找数据解析和刮除到数据库。Nutch的可以在一台机器上运行,但效果更好的的Hadoop 集群。各种插件可用于扩大其使用范围 什么是此版本中的新: ...
阿帕奇Nutch的是建立在顶部的的Apache Lucene的,一个强大的Java搜索引擎。Nutch的开发人员修改了Lucene的代码库,转换数据无关的代码库的Lucene成专门用于搜索网络上的数据专门项目。这种技术可以用于搜索自己的Web页面作为一个内置的搜索服务器,或爬行网页寻找数据解析和刮除到数据库。Nutch的可以在一台机器上运行,但效果更好的的Hadoop 集群。各种插件可用于扩大其使用范围 什么是此版本中的新: ...
阿帕奇模糊被设计为大的基于文本的搜索查询,针对高容量目标数据。模糊的设计采用的Hadoop 工作,并能实现类似谷歌的索引和查询速度。与模糊使用的其他Apache的技术是 Lucene的 节俭和动物园管理员 特点: 在亚秒级的响应时间在数据库般的查询功能在处理数百个并发查询在调节以适应你的数据的大小在幸存的多节点故障W / O型的数据丢失 什么在此版本中是新的: 在支持GIS数据类型在创建的索引快照。在增加存储的字段类型。在添加有启动脚本等安全模式退出的能力。在创建请求和响应日志文件。...
的Apache Lucene的适用于需要进行全文搜索支持的任何应用程序,同时保持服务器的资源消耗下降,生产快速和高精度的结果。 Lucene的被广泛认为是各地最好的搜索引擎之一,是在许多其他搜索工具的最核心,最有名的是 Apache Solr实现 Lucene是完全用Java编写的,自被释放由Apache基金会,它已经被移植到许多其他语言及各种绑定和包装存在的第三方开发的软件。 什么是此版本的新: 在所有文件的访问,现在使用Java的NIO.2...
Apache Solr实现是最广泛的开放搜索周围的技术之一。在建的非常成功的顶部和赞赏的 Lucene的引擎,Solr的可用于搜索各类各类环境和平台的数据。使用全文搜索功能,Solr的是高容量的流量优化,使得非常适合任何类型的项目,它可能是网络或基于桌面的。的Solr还提供了绑定到XML / HTTP,红宝石,JSON和Python,与其他各种Web技术的集成。 什么是新的在此版本中: ...