发布于 2016-05-09 12:05:09 | 137 次阅读 | 评论: 0 | 来源: 网友投递

这里有新鲜出炉的Hadoop教程,程序狗速度看过来!

Hadoop分布式系统

一个分布式系统基础架构,由Apache基金会所开发。 用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。


Linux环境:CentOs6.4

Hadoop版本:Hadoop-1.1.2

master: 192.168.1.241      NameNode    JobTracker   DataNode   TaskTracker

slave:192.168.1.242    DataNode   TaskTracker

内容:想hadoop文件系统中上传一个大文件,验证文件分别分布在192.168.1.241节点和192.168.1.242节点上。

第一步: 前期工作:搭建Hadoop集群,

在hdfs-site.xml中的配置为2.


复制代码
代码如下:

<property>
<name>dfs.replication</name>
<value>2</value>
</property>

运行执行start-all.sh命令,运行结果如图所示:

查看9000和9001的信息

9000是HDFS的入口9001是MapReduce的JobTracker的入口

从以上图中可以确定Ip地址为192.168.1.241.

第二步:通过网页查看节点的个数。在浏览器中输入http://localhost:50070

以上看到LiveNodes的个数为2,说明启动成功。

第三步:上传大文件。具体步骤如图所示:

通过网页查看运行状况:

大文件已经上传成功.文件的大小是244.91MBlock的大小是64M。所以每个节点能够有4个Block。

Replication为2,表明每个Block有2个备份。

查看节点的使用情况:

从图中可以看出,此文件分成了4个Block。(TotalNumberofblocks:4)。

每个Block在两个节点上进行了备份,分别是192.168.1.241192.168.1.242

hadoop集群至此测试结束。测试成功。



最新网友评论  共有(0)条评论 发布评论 返回顶部

Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务