Apache Flink

Apache Flink 1.0.0 更新

阿帕奇弗林克的开发与Apache Hadoop的工作和来自Java和Scala绑定。弗林克是一个强大的平台,它允许你管理服务器集群,并利用它们以有效和快速的方法来处理和分析大量的数据。弗林克本身是由三个主要部分组成:一分布式运行时,程序优化,并且该API 开发可以在两个主要的Hadoop分支,1.x和2.x纱(Hadoop的调度程序)运行弗林克,并在一起。 什么是新的在此版本中: 增加了对POJO对象的支持 在什么版本0.9.0新是: 增加了对POJO对象的支持 ...

Apache Flume

Apache Flume 1.6.0 更新

阿帕奇水槽被开发作为中介系统,该系统从一个应用程序收集的日志,并将其传递到另一个。它应与大多数Java应用程序和开发人员的工作应该放心,水槽被保护,防止数据丢失和服务失败。日志数据通过容错系统的许多故障转移和恢复机制支持流媒体实时。由于水槽从一个中央位置运行,开发人员可以轻松地管理它,并挖掘其资源进行统计和分析的目的。水槽的一个隐藏的功能是它的实际的“数据不可知”的系统。这意味着你可以很容易地从一个日志切换输出数据流的来源,别的并使用水槽从各种类型的服务安全汇总信息。这些可以是电子邮件,社交媒体流,网络流量...

Apache Geronimo的需要一些在开源Java社区中最好的企业工具和网格在一起成一个单一的服务器运行时,随时可以部署在生产环境中。Geronimo提供与Eclipse的集成,是的Apache Tomcat 和的Apache Axis2的友好,支持所有主流操作系统。它还支持白羊座的编程模型和Karaf shell命令。至于它的下载,就可以得到该框架的源或二进制软件包,并建立自己的定制的企业级Java服务器运行时,或者你可以三个现成的运行时间(最小,Java的EE6 Web...

Giraph是Apache的回应开发商市场对社交图谱数据分析工具的需求。阿帕奇Giraph能够以相互关联的社交数据和运行各种数据分析和处理上的操作,而无需庞大的服务器基础设施,这样做。在现有结构更好地结合起来,Giraph是来自Apache著名的数据处理工具兼容,例如的Hadoop 和动物园管理员 是什么在此版本中是新的: ...

Apache Gora

Apache Gora 0.6.1 更新

阿帕奇强罗的目的是提供在其上开发人员可以创建工具,可以处理大量的信息,而不管它们的底层存储单元的共同点。戈拉是用Java编写和创建作为替代其他Java奥姆斯时需要处理的数据从不同的存储模型和在非常大的,定量&NBSP未来那些被认为不足;流。的戈拉ORM帮助开发人员建立一个共同的数据表示和数据持久性模型上,他们可以创建可以用来访问工具,索引,分析,并与在一个共同的,统一的方式对数据进行工作。这将允许开发人员从一个数据存储单元切换到另一个而无需对应用程序的代码突破性的变化。 什么的,这是新的发布: ...

Apache Hadoop

Apache Hadoop 2.7.2 更新

的Apache Hadoop的最初由雅虎开发,该项目是以前的Apache Hadoop的核心和Apache Hadoop的通用回购之间的组合。的Hadoop项目已经在实施了多服务器的分布式计算系统来处理大量的数据,获得了很多恶名感谢其巨大的成果。该项目本身实际上是由四部分组成。一个是Hadoop的常见,即所谓的核心,允许所有其他模块的工作,二是它自己的文件系统 - HDFS(Hadoop分布式文件系统),第三是Hadoop的YARN调度框架,终于有在Hadoop...

Apache HBase

Apache HBase 1.2.0 更新

的Apache HBase的在此前谷歌内部的BigTable数据库系统建模和建上盖的著名的的Apache Hadoop的数据处理架构和分布式计算引擎。由于它是建立在Hadoop上,它的一些很酷的功能也被继承了HBase的,拥有像一个可扩展的架构,硬件故障容差,模块性和实时性,并行计算的支持。在此之上,HBase的代码库也与表分片支持促进,为客户一个简单的Java API来连接,缓存,查询过滤器,以及许多其他更多的。...

Apache Helix

Apache Helix 0.7.1

Apache的螺旋,可用于管理大型计算资源,托管在云基础架构或计算集群。它是建立在另一个顶级Apache项目中,动物园管理员,并提供了与大量节点和资源管理集群的通用接口。与来自Apache类似的项目,螺旋不关心数据和指标的物理资源操纵数据流(服务器本身)。其目的是为使用在服务器创建资源使用和管理的计划,控制资源如何被用来,何时以及如何将数据从一台服务器转移到另一 特点: 在自动资源分配自动分区分配在故障检测在故障恢复在可以处理实时增加新的资源和节点负载均衡在加载节流在可插拔的基础设施 ...

Apache Hive

Apache Hive 1.2.1 更新

Apache的配置单元首先被开发为一个的Apache Hadoop的子项目提供的Hadoop管理员提供了易于使用的,熟练的查询语言,他们的数据。正因为如此,蜂巢从一开始开发的每个查询大量的信息工作,是完全适合于大规模的数据库和商业环境。工具包括可方便地装载,提取和转换数据,而自定义的数据结构可以在一系列广泛的数据格式被强迫。因为它是一个Hadoop的相关项目的HDFS和...