Apache的猪已经从的Apache Hadoop的项目启动,并是其模块,负责提供一种方法来进行分析处理和存储数据的其中一个。
猪使用自定义的查询语言被称为“猪拉丁文”这是令人难以置信的简单易学,同时支持关系型和功能性的风格。
这意味着你可以使用它作为一个经典的SQL语言受益于数据连接和过滤器,也可以使用它的MapReduce功能,数据映射器和减速器。
默认情况下阿帕奇猪本来是Hadoop的设施内使用,但新版本允许它通过一个单独的JVM单独运行
什么是此版本的新:
- 在可插拔的执行引擎(允许在未来的非的MapReduce引擎猪跑)
- 在自动本地模式(用较小的输入数据的大小在进程运行的作业)
- 在取优化(提高咕噜互动性)
- 固定柜台本地模式
- 支持用户级别的jar缓存
- 支持黑名单白名单和猪的命令
- 在一些性能修正和调试性功能
- 在一些非向后兼容的界面修改已经在此版本中引入,使非的MapReduce引擎的猪的工作
什么的0.14.0版本是新的:
- 在可插拔的执行引擎(让猪在非运行在未来-mapreduce引擎)
- 在自动本地模式(用较小的输入数据的大小在进程运行的作业)
- 在取优化(提高咕噜互动性)
- 固定柜台本地模式
- 支持用户级别的jar缓存
- 支持黑名单白名单和猪的命令
- 在一些性能修正和调试性功能
- 在一些非向后兼容的界面修改已经在此版本中引入,使非的MapReduce引擎的猪的工作
什么是0.11.0版本,新的:
- 在此版本包括DateType数据类型,等级,CUBE和汇总运算符,Groovy的UDF的,定制的减速估计,基于模式的元组和HCatalog DDL集成。
什么是0.9.1版本,新的:
- 在这个版本与Hadoop的0.20 李>
什么版本0.6是新的:
- 在新增斑马为的contrib项目。见http://wiki.apache.org/pig/zebra
- 新增UDFContext,给人的UDF的方式,从正面的信息传递到后端,并给出UDFS访问JobConf在后端。
- 新增左外连接的片段重复加入。
- 新增能力,从猪拉丁语设置作业优先级。
- 增强的多查询一起工作联接在某些情况下。
- 在返工内存管理器来显著减少堆失败GC开销和输出。
- 新增蓄能器接口的UDF。
- 在超过100个bug修正和改进。
要求:
- 在Java的1.6.x版或更高版本
- 的Apache的Hadoop 0.20.x或更高
评论没有发现