DataFu 1.2.0 / 1.3.0-rc1

DataFu在LinkedIn开发,完全用Java编写的。 DataFu包括函数/库一起工作: - 统计 - 估计 - 取样 - 会话 - 链接分析 - 设置操作 - 手袋 DataFu是完美的数据挖掘和在Hadoop或猪数据库之上的工作统计应用。这些功能使开发人员能够利用内部存储的所有数据的完全优势的的Hadoop 或猪数据库,而不必为了做到这一点,以应对庞大的系统要求。 本发行版是新的: 配对的UDF与更换简单随机抽样更依赖现在打包在DataFu必需的,以便减少依赖的JAR。...