这基本上是一个Python库的MapReduce写在用Cython
功能:
- 在类似的接口作为Hadoop的API (设计模式的Python / Java接口的使用)
- 在与小飞象一般的兼容性,让用户来回切换
- 在可用的Hadoop集群没有Python或管理员权限
- 快速转换和处理
- 留小,并有据可查
- 要透明,这是怎么回事
- 在复杂的.so的,ctypes的和扩展手柄节目
- 为下锅的能力编写的代码
- 在简单HDFS访问(例如,阅读,写作,LS)
- 支持(而不是复制)更大的Hadoop生态系统(如,Oozie的,呼呼)
- 在自动并行化的工作“自动Oozie的”在hadoopy流量工程可(保持了分支)
- 在本地执行的MapReduce未修改的工作与launch_local
- TypedBytes直接到HDFS从蟒蛇读/写序列文件(readtb,writetb)
- 允许印刷输出和错误Hadoop中的任务,而不会引起问题(使用'管跳频“技术,无论是在任务的标准错误提供)
- 在集群工作没有任何额外的安装,Python或任何Python库(使用Pyinstaller包含在这个源代码树)
- 在OS X工程
- 在关键路径是在用Cython
- 在简单HDFS接入(readtb和ls)里面的Python,甚至在正在运行的任务
- 在单元测试接口
- 报告使用状态和计数器(和打印报表!不需要在Hadoopy害怕他们的)
- 支持在林代尔和书籍设计模式
- Typedbytes支持(非常快)
- Oozie的支持
要求:
- 在用Cython 0.13或更高
评论没有发现