DataFu在LinkedIn开发,完全用Java编写的。
DataFu包括函数/库一起工作:
- 统计
- 估计
- 取样
- 会话
- 链接分析
- 设置操作
- 手袋
DataFu是完美的数据挖掘和在Hadoop或猪数据库之上的工作统计应用。
这些功能使开发人员能够利用内部存储的所有数据的完全优势的的Hadoop 或猪数据库,而不必为了做到这一点,以应对庞大的系统要求。
本发行版是新的:
- 配对的UDF与更换简单随机抽样
- 更依赖现在打包在DataFu必需的,以便减少依赖的JAR。
- SetDifference UDF计算差集(例如,A-B或A-B-C)。
什么是1.2.0版本,新的:
- 的UDF与更换简单随机抽样的一对。
- 更依赖现在打包在DataFu必需的,以便减少依赖的JAR。
- SetDifference UDF计算差集(例如,A-B或A-B-C)。
什么是新的在1.1.0版本:
- 新增SHA哈希码UDF
- InUDF和AssertUDF增加了猪0.12兼容性。这些是相同的。在与断言。
- SimpleRandomSample,它实现了一个可扩展的简单随机抽样算法。
评论没有发现