Apache Hadoop 2.7.0 更新
的Apache Hadoop是一个开源和免费软件库,设计为一个框架,允许大型数据集整个计算机集群的分布,仅仅使用简单的编程模型。阿帕奇Hadoop的设计,因为它可以从单服务器计算机扩展至数千个的机器,每个提供本地存储和计算的方式。该软件包括以下模块:Hadoop的通用,Hadoop分布式文件系统(HDFS),Hadoop的纱,和Hadoop...
的Apache Hadoop是一个开源和免费软件库,设计为一个框架,允许大型数据集整个计算机集群的分布,仅仅使用简单的编程模型。阿帕奇Hadoop的设计,因为它可以从单服务器计算机扩展至数千个的机器,每个提供本地存储和计算的方式。该软件包括以下模块:Hadoop的通用,Hadoop分布式文件系统(HDFS),Hadoop的纱,和Hadoop...
Apache的配置单元是一个开源并且完全免费的软件设计,以提供一个数据仓库系统特别适用于Apache Hadoop项目的设计。Apache的配置单元能够方便即席查询,对大型数据集存储在Hadoop的兼容文件系统的分析,以及简单的数据汇总。该软件提供了一个查询使用类似于SQL的语言,被称为HiveQ,它可以让传统的减少/图程序员在他们的自定义减速和映射器堵塞时,它的效率低下,不便表达这种逻辑HiveQL数据的机制。Apache的配置单元的分布,通过Apache软件基金会的一个独立的应用程序 ...
阿帕奇ManifoldCF是一个开源项目,提供用于连接EMC一样的Documentum和Microsoft SharePoint源内容库的框架。 阿帕奇ManifoldCF设计目标索引或资料库,如打开搜索服务器ElasticSearch,QBase(原MetaCarta)GTS和Apache Solr的,以及库,使他们能够制裁源库的安全策略。目前,该项目包括以下连接器支持: 的FileNet...
的Apache提卡是一个开源工具包旨在检测并提取元数据,以及结构化的文本内容来自几个文件,只用现有的解析器库。阿帕奇蒂卡支持以下文件格式:超文本标记语言(HTTP),XML和派生格式,微软Office文档格式,开放文档格式(ODF),可移植文档格式(PDF),电子出版物格式(EPF),富文本格式(RTF ),压缩和封装格式,文本/音频/图片/视频格式的mbox格式,和Java类文件和档案。此前,阿帕奇提卡是在Apache...
Apache可移植运行时(APR)项目的使命是创造和维护的软件库提供了一个可预测的和一致的界面,底层平台的具体实现。的主要目标是提供一个API来,软件开发人员可以编码和放心的预测,如果不论在其上的软件是建立在平台的不相同的行为,减轻的需要进行编码的特殊情况下的条件,以解决或把它们利用平台特定的缺陷或功能。以下是“阿帕奇便携式运行”一些主要特点:...
阿帕奇Chukwa是一种开源和完全免费的软件专门设计来充当数据收集溶液,其可用于监测大型分布式系统。阿帕奇Chukwa是建立在HDFS(Hadoop分布式文件系统)和地图顶部/ Reduce框架。它继承了Apache的Hadoop项目&rsquo的;健壮性和可扩展性。此Apache软件包括一个强大而灵活的工具包,用于监视,分析和显示效果,为了使收集的数据的充分利用。它分布通过Apache软件基金会独立的应用程序 什么是此版本中的新: ...
的Apache...