的Apache Hadoop的最初由雅虎开发,该项目是以前的Apache Hadoop的核心和Apache Hadoop的通用回购之间的组合。
的Hadoop项目已经在实施了多服务器的分布式计算系统来处理大量的数据,获得了很多恶名感谢其巨大的成果。
该项目本身实际上是由四部分组成。一个是Hadoop的常见,即所谓的核心,允许所有其他模块的工作,二是它自己的文件系统 - HDFS(Hadoop分布式文件系统),第三是Hadoop的YARN调度框架,终于有在Hadoop MapReduce的系统支持并行计算。
使用这些突破性的系统中,Apache已经成功地创造出许多彼岸项目,如:
- 阿帕奇Ambari
- 阿帕奇的Avro
- 阿帕奇卡桑德拉
- Apache的HBase的
- Apache的配置单元
- 阿帕奇亨利马乌
- 阿帕奇猪
- 阿帕奇星火
- 阿帕奇TEZ
- 阿帕奇的ZooKeeper
所有这些依赖于Hadoop的强大的数据处理引擎或它的分布式计算的特点,在其核心的一种方式或其他整合其模块之一。
什么是新的在此版本中:
- 的档案存储支持
- 在静态加密,透明的数据(测试版)
- 操作安全的DataNode,无需root访问权限
- 热插拔驱动器:支持增加/删除数据节点卷,而无需重新启动数据节点(测试版)
- 更快的电线AES加密支持
- 在纱线长时间运行的服务的支持
- 计划 在支持节点标签
- 在容量调度基于时间的资源预留支持(测试版)
- 全局,应用文物共享缓存(测试版)
- 本机在泊坞窗的应用程序支持运行容器(阿尔法)
什么是新的在2.7.1版本:
- 的档案存储支持
- 在静态加密,透明的数据(测试版)
- 操作安全的DataNode,无需root访问权限
- 热插拔驱动器:支持增加/删除数据节点卷,而无需重新启动数据节点(测试版)
- 更快的电线AES加密支持
- 在纱线长时间运行的服务的支持
- 计划 在支持节点标签
- 在容量调度基于时间的资源预留支持(测试版)
- 全局,应用文物共享缓存(测试版)
- 本机在泊坞窗的应用程序支持运行容器(阿尔法)
什么是新的在2.7.0版本:
- 的档案存储支持
- 在静态加密,透明的数据(测试版)
- 操作安全的DataNode,无需root访问权限
- 热插拔驱动器:支持增加/删除数据节点卷,而无需重新启动数据节点(测试版)
- 更快的电线AES加密支持
- 在纱线长时间运行的服务的支持
- 计划 在支持节点标签
- 在容量调度基于时间的资源预留支持(测试版)
- 全局,应用文物共享缓存(测试版)
- 本机在泊坞窗的应用程序支持运行容器(阿尔法)
什么是新的在2.6.0版本:
- 的档案存储支持
- 在静态加密,透明的数据(测试版)
- 操作安全的DataNode,无需root访问权限
- 热插拔驱动器:支持增加/删除数据节点卷,而无需重新启动数据节点(测试版)
- 更快的电线AES加密支持
- 在纱线长时间运行的服务的支持
- 计划 在支持节点标签
- 在容量调度基于时间的资源预留支持(测试版)
- 全局,应用文物共享缓存(测试版)
- 本机在泊坞窗的应用程序支持运行容器(阿尔法)
在什么版本2.5.0新是:
- 使用HTTP代理服务器时,验证改进
- 新的Hadoop度量接收器,允许直接写入石墨。
- 规范的Hadoop兼容的文件系统的努力。
- 为POSIX式文件系统的扩展属性的支持。
- OfflineImageViewer浏览通过WebHDFS API的的FsImage。
- 支持性改进和bug修复到NFS网关。
- 现代化的网页界面(HTML5和Javascript)为HDFS守护进程。
- 纱线的REST API的支持提交和杀戮的应用程序。
- 的Kerberos集成纱的时间轴店。
在什么版本2.4.0新是:
- 支持访问控制列表在HDFS
- 滚动升级HDFS中的原生支持
- 协议缓冲区为HDFS的FsImage平稳运行升级的用法
- 在HDFS完全支持HTTPS
- 对于纱线的ResourceManager的自动故障切换支持
- 增强与应用历史服务器和应用服务器时间表 在纱线新的应用程序支持
- 通过抢占的在纱线CapacityScheduler强烈的SLA支持
在什么版本2.3.0新是:
- 在HDFS异构存储层次支持
- 在内存中缓存与集中式管理HDFS数据。
- 通过HDFS纱线分布式缓存MapReduce的二进制代码的简化分配。
什么是新的在2.2.0版本:
- 纱线 - 通用资源管理的Hadoop系统允许MapReduce和以外的其他数据处理框架和服务
- 对于HDFS高可用性
- HDFS联邦
- HDFS快照
- NFSv3的访问数据HDFS
什么版本2.1.0-β为新的:
- HDFS快照
- 在Microsoft Windows上运行Hadoop的支持
- 纱线API稳定
什么版本2.0.3-alpha是新的:
- QJM为HDFS医管局的NameNode
- 多资源调度纱线(CPU和内存)
- 纱线的ResourceManager重新启动
- 在规模稳定的重大纱线(超过30,000节点和14万个应用,到目前为止,在发布时间)
在什么版本1.0.0是新的:
- 更好的安全性
- HBase的(附加/水平同步/ hflush和安全)。
- webhdfs(与安全性完全支持)。
- 性能增强本地文件的访问为HBase的。
- 其它性能提升,bug修复和功能。
什么是新的在0.20.2版本:
- RPC服务器发送缓冲区保留最大响应有史以来规模发送。
- C ++库不建立在Debian Lenny的。
- 一些C ++脚本不是蚂蚁执行前chmodded。
- 流:过程中提供了状态信息每10 seoncds覆盖
- 当CombineFileInputFormat作为工作的InputFormat IllegalArgumentException异常。
- 多错误瓦特/ Hadoop的档案。
- 允许文件系统实例缓存在每个实例的基础上禁用。
- 失踪Configuration.addResource为defaultResources同步。
- GzipCodec应该不能代表BuiltInZlibInflater为decompressorType。
- 的NameNode的HttpServer的不能实例化的InetSocketAddress:则抛出 。
- 的HttpServer睡负值。
- 的Namenode了内存的运行,由于IPC服务器内存泄漏。
- IPC客户端的错误可能会导致RPC调用挂起。
- 失败测试防止测试目标,其余的执行。
- 的Contrib测试失败Clover'ed建设。
- 测试不上0.20的分支运行。
- TestStreamingStatus未能在0.20分支。
评论没有发现