福尔摩斯是一个普遍的搜索引擎,用于收集文本数据和索引系统(文本文件,网页等),本地和网络上。
功能:
- 在通过HTTP或从本地文件收集文件
- 解析使用外部解析器(如MS Word和PostScript)文本文件,HTML,PDF等多种格式。
- 在整个系统是模块化的,所以添加您自己的数据源或解析器物质只是被插入正确的模块(当然,平时也写它)。
- 在混合字符集环境中工作良好。
- 在考虑同一个文件(即使有微小的变化)有多个URL的单个文件多次出现。
- 一切都是高度可配置的。你可以在一个特殊的语言,它允许根据文档被处理来调整配置变量写过滤规则。
- 单词,短语和布尔表达式搜索。在搜索文件名和链接文本。
- 近似搜索和搜索常规加权附近。
- 识别语言,易于集成和词干同义字典。
- 基于在索引数据中观察到词频,暗示他的查询可能拼错的用户拼写检查器。
- 在搜索结果中包含上下文中的每个文件。
- 秤以及数千万在普通PC硬件的文件。
- 用户界面(前端)被完全从系统的其余部分分离,因此很容易修改和也嵌入在搜索引擎中的现有应用程序。
- 在下载的文件和索引压缩以节省空间。
评论没有发现