Apache Crunch

Apache Crunch 0.13.0 更新

一个管道是操作的级联执行特定任务,布置成使得每个元件的输出是下一个的输入。Apache的紧缩提供了处理的Apache Hadoop的的MapReduce管道的一个更简单的方法。紧缩通过提供大量的现成方法和函数可用于装配并操作以各种形式的MapReduce管线简化了这一过程。该项目包括一个原生的Java API,以及Scala的一(名为碾碎)。支持额外包括处理的Avro 记录和...