最好的 集群和分布式网络 为 David Marin
mrjob是一个Python模块,可以帮助你编写和运行Hadoop的流工作。mrjob完全支持亚马逊弹性MapReduce(EMR)服务,让您买的时候Hadoop集群上以小时为单位。它也可以用自己的Hadoop集群。安装:蟒蛇setup.py安装设置EMR亚马逊  *创建一个Amazon Web Services账户:http://aws.amazon.com/  *注册弹性MapReduce:http://aws.amazon.com/elasticmapreduce/ ...