Apache Spark

软件截图:
Apache Spark
软件详细信息:
版本: 1.3.1 更新
上传日期: 12 May 15
许可: 免费
人气: 45

Rating: 5.0/5 (Total Votes: 1)

火花的目的是要改善的处理速度进行数据分析和处理的程序。
这是写在Java和Scala和提供其它系统所没有的功能,主要是因为他们不是主流,也不是适用于非数据处理应用。

什么是新的在此版本中:

  • 在核心API现在支持多级汇聚树,有助于加快昂贵降低运营
  • 改进的错误报告增加了对某些疑难杂症的操作。
  • 在星火的码头依赖现在的阴影,以帮助避免与用户程序发生冲突。
  • 星火现在支持SSL加密一些通信端点。
  • 实时GC度量和记录计数已被添加到用户界面。

什么是1.3.0版本的新

  • 在核心API现在支持多级汇聚树有助于加快降低成本的操作。
  • 改进的错误报告增加了对某些疑难杂症的操作。
  • 在星火的码头依赖现在的阴影,以帮助避免与用户程序发生冲突。
  • 星火现在支持SSL加密一些通信端点。
  • 实时GC度量和记录计数已被添加到用户界面。

什么是1.2.1版本的新

  • 在PySpark的排序运算符现在支持外部溢出的大型数据集。
  • PySpark现在支持大于2GB广播变量和各种期间进行的外部溢出。
  • 星火增加了作业级进度页面星火UI,报告进度稳定的API,输出指标的动态更新的作业完成。
  • 星火现在能够读取二进制文件的图像和其他二进制格式的支持。

什么是在1.0.0版本新

  • 在此版本扩展了星火的标准库,引入一个新的SQL包(星火SQL),允许用户整合SQL查询到现有的工作流程星火
  • MLlib,星火的机器学习库,扩大与稀疏矢量支持和一些新的算法。

什么是0.9.1版本,新的

  • 在外部溢出固定哈希冲突错误
  • 与星火的log4j的为依托,其他采伐后端用户固定冲突
  • 修正Graphx从星火组装罐子失踪的Maven构建
  • 修正了沉默由于映射输出状态超过阿卡帧大小故障
  • 在ASM移除星火的不必要的直接依赖
  • 删除指标,神经节从默认的构建由于LGPL许可证冲突
  • 在发行tar包修正了不含有火花组装罐

什么是0.8.0版本,新的

  • 在开发已经转移到了Apache基金会Sowftware作为孵化器项目。

什么是在0.7.3版本新

  • 在Python的性能:星火的机制产卵Python的虚拟机有经过改进,这样做的时候速度更快的虚拟机有一个大的堆大小,加快了Python API。
  • Mesos修复:添加到您的工作的JAR现在在Mesos反序列化任务的结果时,在classpath
  • 错误报告:非序列化的异常和过大的任务结果更好的错误报告
  • 例子:增加状态流处理的例子有updateStateByKey
  • 生成:星火流不再依赖于Twitter4J回购,应该允许它在中国建立
  • 在foldByKey Bug修复,流计数,统计方法,文档和网页用户界面。

什么是0.7.2版本,新的

  • 在斯卡拉版更新至2.9.3
  • 若干改进,百吉饼,包括性能修复和可配置的存储级别。
  • 在新的API方法:subtractByKey,foldByKey,mapWith,filterWith,foreachPartition,以及其他
  • 在一个新的度量报告界面,SparkListener,收集有关每个运算阶段的信息:任务长度字节洗牌,等
  • 使用Java API,包括K-手段和计算圆周率的若干新的例子。

在什么版本0.7.0新是

  • 在星火0.7增加了一个Python API叫做PySpark <。 / LI>
  • 星火作业现在推出的Web仪表盘监控程序中的每个分布式数据集(RDD)的内存使用情况。
  • 星火现在可以在除SBT使用Maven构建。

在什么版本0.6.1新是

  • 在固定咄咄逼人的消息超时,可能会导致工人从集群中断开。
  • 修正了独立部署方式的错误,不暴露主机名来调度,影响当地HDFS。
  • 在洗牌改进连接复用,这可以大大加快小洗牌。
  • 在块管理修正了一些潜在的死锁。
  • 修正了来自Mesos得到失败的主机标识。
  • 若干EC2脚本的改进,比如更好的操控现货实例。
  • 提出,星火结合定制的本地IP地址。
  • 支持Hadoop的2分布。
  • 支持Debian的发行定位斯卡拉。

在什么版本0.6.0新是

  • 在简单部署
  • 在星火的文档已扩大一个新的快速入门指南,额外的部署说明,配置指南,指导调整和改进Scaladoc API文档。
  • 在使用异步的Java NIO一个新的通信管理器可以让重排操作运行速度更快,特别是当发送大量数据或工作时,有许多任务。
  • 在一个新的存储管理器支持每个数据集存储级别设置(例如是否保留在内存中的数据集,反序列化,磁盘等,甚至是跨节点复制)。
  • 增强的调试。

类似的软件

nginx-conf
nginx-conf

18 Apr 16

Prometheus
Prometheus

28 Feb 15

royweb
royweb

10 Dec 15

SOAPpy
SOAPpy

12 May 15

意见 Apache Spark

评论没有发现
添加评论
打开图片!