hadoop安装指南

VMware配置

把自己的虚拟机实例网卡设置为NAT方式上网，不要选择桥接自动。
打开vmware。点击“编辑”菜单，选择网络编辑啥的。然后选择net8，也就是NAT。去掉DHCP那个checkbox, 并记下子网ip
点击NAT设置，记下网关
打开虚拟机编辑网络连接选择手动填写ip 要和子网在一个网段内。网关是NAT设置里的网关。DNS是自己电脑的DNS就可以了。
关闭防火墙 chkconfig iptables off

hostname和hosts的配置

通过vi /etc/sysconfig/network修改hostname
通过vi /etc/hosts，添加 Master、Slave1、Slave2的IP地址

添加hadoop用户和用户组

创建Hadoop用户组：groupadd hadoop
创建Hadoop用户：useradd hadoop -g hadoop
设置Hadoop用户密码：passwd 密码
给hadoop账户增加sudo权限： vim /etc/sudoers ，增加内容：hadoop ALL=(ALL) ALL

无密码登录ssh

切换到Hadoop 用户下：su hadoop cd /home/hadoop/
生成公钥和私钥：ssh-keygen -q -t rsa -N "" -f /home/hadoop/.ssh/id_rsa
查看密钥内容：cd /home/hadoop/.ssh cat id_rsa.pub
复制id rsa.pub公钥到 authorized keys 文件：cat id_rsa.pub > authorized_keys
修改Master公钥权限：chmod 644 /home/hadoop/.ssh/authorized_keys
把 Master 机器上的 authorized_keys 文件 copy 到 Slave1 节点上：scp /home/hadoop/.ssh/authorized_keys Slave1.Hadoop:/home/hadoop/.ssh/,如果Slave1/Slave2机器上没有.ssh目录，则创建，并chmod 700 /home/hadoop/.ssh

note: Exception：Agent admitted failure to sign using the key. Solution： ssh-agent bash --login -i和 ssh-add ~/.ssh/id_rsa

安装hadoop

转到 home/hadoop目录：cd /home/hadoop
下载hadoop：wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.6.1/hadoop-2.6.1.tar.gz
解压hadoop并放到计划安装位置：tar zxvf hadoop-2.6.1.tar.gz
创建文件目录：mkdir -p /home/hadoop/hadoop-2.6.1/dfs/name /home/hadoop/hadoop-2.6.1/dfs/data /home/hadoop/hadoop-2.6.1/tmp
修改7个配置文件，文件位置：/home/hadoop/hadoop-2.6.1/etc/hadoop/，文件名称：hadoop-env.sh、yarn-env.sh、mapred-env.sh、slaves、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml
scp到对应的slave机器上 scp -r /home/hadoop/hadoop-2.6.1 Slave1.Hadoop:~/ scp -r /home/hadoop/hadoop-2.6.1 Slave2.Hadoop:~/

#hadoop-env.sh
export JAVA_HOME=/usr/java/jdk1.7.0_79

#mapred-env.sh
export JAVA_HOME=/usr/java/jdk1.7.0_79

#yarn-env.sh
export JAVA_HOME=/usr/java/jdk1.7.0_79

#slaves
Slave1.Hadoop
Slave2.Hadoop

#core-site.xml
<property>
    <name>fs.defaultFS</name>
    <value>hdfs://192.168.109.10:9000</value>
</property>
<property>
    <name>hadoop.tmp.dir</name>
    <value>/home/hadoop/hadoop-2.6.1/tmp</value>
    <description>Abase for other temporary directories.</description>
</property>

#hdfs-site.xml
<property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>192.168.109.10:50090</value>
</property>
<property>
    <name>dfs.namenode.name.dir</name>
    <value>/home/hadoop/dfs/name</value>
</property>
<property>
    <name>dfs.datanode.data.dir</name>
    <value>/home/hadoop/dfs/data</value>
</property>
<property>
    <name>dfs.replication</name>
    <value>2</value>
</property>

#mapred-site.xml
<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>

#yarn-site.xml
<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>Master.Hadoop</value>
</property>
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>

启动Hadoop

切换到hadoop用户：su hadoop
进入安装目录： cd ~/hadoop-2.6.1/
格式化namenode：./bin/hdfs namenode –format
启动hdfs: ./sbin/start-dfs.sh
jps查看，此时master有进程：NameNode SecondaryNameNode，slave1/slave2上有进程：DataNode
启动yarn: ./sbin/start-yarn.sh
jps查看，此时master有进程：NameNode SecondaryNameNode ResourceManager，slave1/slave2上有进程：DataNode NodeManager
查看集群状态：./bin/hdfs dfsadmin -report
查看文件块组成： ./bin/hdfs fsck / -files -blocks
Web查看HDFS: Web查看HDFS
Web查看RM: Web查看RM

Just a Blog But a Life

Hadoop安装与配置

hadoop安装指南

VMware配置

hostname和hosts的配置

添加hadoop用户和用户组

无密码登录ssh

安装hadoop

启动Hadoop