Hadoop高可用环境搭建(QJM)

网友投稿 306 2022-11-26

Hadoop高可用环境搭建(QJM)

一、虚拟机配置

主机名NNDNZKZKFCJNNRMNM
node1*

***
node2*******
node3
**
*
*
node4
**


*

二、Hadoop 高可用(HA)实现(QJM)

1、node1主机上修改配置文件

修改core-site.xml

[root@node1 ~]# vi /opt/hadoop/etc/hadoop/core-site.xml#修改为如下:                        fs.defaultFS                hdfs://mycluster                                hadoop.tmp.dir                /hadoop-full/        

修改hdfs-site.xml

[root@node1 hadoop]# vi /opt/hadoop/etc/hadoop/hdfs-site.xml#修改内容为如下:                        dfs.nameservices                mycluster                                dfs.ha.namenodes.mycluster                nn1,nn2                                dfs.namenode.rpc-address.mycluster.nn1                node1:8020                                dfs.namenode.rpc-address.mycluster.nn2                node2:8020                                dfs.namenode.               node1:50070                                dfs.namenode.               node2:50070                                dfs.namenode.shared.edits.dir                qjournal://node1:8485;node2:8485;node3:8485/mycluster                                dfs.client.failover.proxy.provider.mycluster              org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider                                dfs.ha.fencing.methods                sshfence                                dfs.ha.fencing.ssh.private-key-files                /root/.ssh/id_rsa                                dfs.journalnode.edits.dir                /hadoop-full/journalnode                                dfs.replication                3                                dfs.permissions.enabled                false        

2、分发配置文件至node2,node3,node4

[root@node1 ~]#cd /opt/hadoop/etc/hadoop/[root@hadoop ~]# scp core-site.xml hdfs-site.xml node2:/`pwd`[root@hadoop ~]# scp core-site.xml hdfs-site.xml node3:/`pwd`[root@hadoop ~]# scp core-site.xml hdfs-site.xml node4:/`pwd`

3、启动journalnode

[root@node1 ~]# hadoop-daemon.sh start journalnode[root@node2 ~]# hadoop-daemon.sh start journalnode[root@node3 ~]# hadoop-daemon.sh start journalnode

4、HDFS Namenode数据同步

格式化(第一次配置情况下使用,已运行集群不能用)

[root@node1 ~]# hdfs namenode -format2020-01-27 11:09:37,394 INFO common.Storage: Storage directory /hadoop-full/dfs/name has been successfully formatted.[root@node1 ~]# hadoop-daemon.sh start namenode

共享日志文件初初始化(已运行的非HA集群使用)

[root@node1 ~]#hdfs namenode -initializeSharedEdits

启动node1上的namenode节点

[root@node1 ~]#hadoop-daemon.sh start namenode

node2节点同步镜像数据

[root@node2 ~]# hdfs namenode -bootstrapStandby

node2节点上启动namenode

[root@node2 ~]#hadoop-daemon.sh start namenode

5、启动datanode节点

[root@node2 ~]#hadoop-daemon.sh start datanode[root@node3 ~]# hadoop-daemon.sh start datanode[root@node4 ~]# hadoop-daemon.sh start datanode

6、提升namenode节点为active状态

hdfs haadmin -transitionToActive nn1

7、验证

命令行验证

[root@node1 ~]# jps2948 Jps1829 NameNode2013 JournalNode[root@node2 ~]# jps2029 Jps1455 NameNode1519 DataNode1599 JournalNode[root@node3 ~]# jps1335 Jps1195 DataNode1275 JournalNode[root@node4 ~]# jps997 Jps967 DataNode

网页查看

8、命令行操作HA集群

查看服务状态

[root@node1 ~]#hdfs haadmin -getServiceState nn1

设置namenode为active节点

设置namenode为active节点

设置namenode为Standby

[root@node1 ~]#hdfs haadmin -transitionToStandby nn1

手动故障切换

[root@node1 ~]#hdfs haadmin -failover nn1 nn2

三、Zookeeper安装配置

1、修改主机hosts文件

[root@node2 conf]# vi /etc/hosts#添加如下内容127.0.0.1       localhost

2、上传zookeeper安装包到node2上

3、解压安装包到指定目录

[root@node2 ~]# tar -zxvf zookeeper-3.4.6.tar.gz -C /opt/

4、重命名目录

[root@node2 ~]# mv /opt/zookeeper-3.4.6/ /opt/zookeeper

5、修改配置文件

重命名配置文件

[root@node2 ~]#cd /opt/zookeeper/conf/[root@node2 conf]#cp zoo_sample.cfg zoo.cfg

修改配置文件

[root@node2 conf]#vi zoo.cfg#12行修改为如下内容dataDir=/hadoop-full/zookeeper#文件末尾添加如下内容server.1=node2:2888:3888server.2=node3:2888:3888server.3=node4:2888:3888

5、添加环境变量

修改配置文件

[root@node2 ~]# vi /etc/profile.d/hadoop.sh#修改为如下内容export JAVA_HOME=/opt/jdkexport HADOOP_HOME=/opt/hadoopexport ZOOKEEPER_HOME=/opt/zookeeperexport PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$ZOOKEEPER_HOME/bin

重新编译文件

[root@node2 ~]# source /etc/profile

6、创建工作目录

[root@node2 ~]# mkdir -p /hadoop-full/zookeeper[root@node2 ~]# echo 1 >/hadoop-full/zookeeper/myid

7、分发文件

分发hosts文件

[root@node2 conf]# scp /etc/hosts node3:/etc/hosts[root@node2 conf]# scp /etc/hosts node4:/etc/hosts

分发环境变量

[root@node2 ~]# scp /etc/profile.d/hadoop.sh node3:/etc/profile.d/[root@node2 ~]# scp /etc/profile.d/hadoop.sh node4:/etc/profile.d/

编译profile文件

[root@node3 ~]# source /etc/profile[root@node4 ~]# source /etc/profile

分发zookeeper安装文件

[root@node2 ~]# scp -r /opt/zookeeper node3:/opt/[root@node2 ~]# scp -r /opt/zookeeper node4:/opt/

分发工作目录

[root@node2 ~]# scp -r /hadoop-full/zookeeper node3:/hadoop-full/[root@node2 ~]# scp -r /hadoop-full/zookeeper node4:/hadoop-full/

8、修改myid文件

[root@node3 ~]# echo 2 >/hadoop-full/zookeeper/myid[root@node4 ~]# echo 3 >/hadoop-full/zookeeper/myid

9、启动服务

[root@node2 ~]# zkServer.sh start[root@node3 ~]# zkServer.sh start[root@node4 ~]# zkServer.sh start

10、查看状态

[root@node2 opt]# zkServer.sh statusJMX enabled by defaultUsing config: /opt/zookeeper/bin/../conf/zoo.cfgMode: follower[root@node3 ~]# zkServer.sh statusJMX enabled by defaultUsing config: /opt/zookeeper/bin/../conf/zoo.cfgMode: leader[root@node4 ~]# zkServer.sh statusJMX enabled by defaultUsing config: /opt/zookeeper/bin/../conf/zoo.cfgMode: follower

五、Zookeeper实现Hadoop Namenode HA故障自动切换

1、node1主机上修改配置文件

修改core-site.xml

[root@node1 ~]# vi /opt/hadoop/etc/hadoop/core-site.xml#原有内容上添加为如下内容:                        ha.zookeeper.quorum                node2:2181,node3:2181,node4:2181        

修改hdfs-site.xml

[root@node1 hadoop]# vi /opt/hadoop/etc/hadoop/hdfs-site.xml#原有内容上添加为如下内容:                        dfs.ha.automatic-failover.enabled                true        

2、分发配置文件至node2,node3,node4

[root@node1 ~]#cd /opt/hadoop/etc/hadoop/[root@hadoop ~]# scp core-site.xml hdfs-site.xml node2:/`pwd`[root@hadoop ~]# scp core-site.xml hdfs-site.xml node3:/`pwd`[root@hadoop ~]# scp core-site.xml hdfs-site.xml node4:/`pwd`

3、zookeeper FailerController格式化

[root@node1 ~]# hdfs zkfc -formatZK2020-01-27 11:26:40,326 INFO ha.ActiveStandbyElector: Successfully created /hadoop-ha/mycluster in ZK

4、namenode节点安装psmisc(ZKFC主机)

[root@node1 ~]#yum install psmisc -y[root@node2 ~]#yum install psmisc -y

5、node2免密登录node2设置

[root@node2 ~]# ssh-keygen Generating public/private rsa key pair.Enter file in which to save the key (/root/.ssh/id_rsa): Enter passphrase (empty for no passphrase): Enter same passphrase again: Your identification has been saved in /root/.ssh/id_rsa.Your public key has been saved in /root/.ssh/id_rsa.pub.The key fingerprint is:SHA256:21X44T83NPr3k/FabLoSGZZDCoGck1ncNiowoLJGlr0 root@node2The key's randomart image is:+---[RSA 2048]----+|  .. . Boo       || .o o B o + ..   ||o+ . o . + +..o  ||+.  . . . . =+ . ||.. E   .S  ..+oo ||.        o .o o+.||        . .  o oX||            . .**||             .++=|+----[SHA256]-----+[root@node2 ~]# cd ~/.ssh/[root@node2 .ssh]# ssh-copy-id node1/usr/bin/ssh-copy-id: INFO: Source of key(s) to be installed: "/root/.ssh/id_rsa.pub"The authenticity of host 'node1 (192.168.30.11)' can't be established.ECDSA key fingerprint is SHA256:/V6z9w2ts2Ei8dgcKAlJCGozcmoeWNSNyctvHWjdoJk.ECDSA key fingerprint is MD5:09:41:c7:ad:2b:65:77:6f:eb:af:77:be:8f:e3:1f:15.Are you sure you want to continue connecting (yes/no)? yes/usr/bin/ssh-copy-id: INFO: attempting to log in with the new key(s), to filter out any that are already installed/usr/bin/ssh-copy-id: INFO: 1 key(s) remain to be installed -- if you are prompted now it is to install the new keysroot@node1's password: Number of key(s) added: 1Now try logging into the machine, with:   "ssh 'node1'"and check to make sure that only the key(s) you wanted were added.[root@node2 .ssh]# ssh node1

6、启动集群

[root@node1 hadoop]# start-dfs.sh

7、验证:

六、ResourceManager HA 配置

1、修改mapred-site.xml

[root@node1 hadoop]# vi /opt/hadoop/etc/hadoop/mapred-site.xml#修改为如下内容            mapreduce.framework.name        yarn    

2、修改yarn-site.xml

[root@node1 hadoop]# vi /opt/hadoop/etc/hadoop/yarn-site.xml#修改为如下内容                        yarn.nodemanager.aux-services                mapreduce_shuffle                                          yarn.log-aggregation-enable                true                                                      yarn.resourcemanager.ha.enabled                true                                                yarn.resourcemanager.cluster-id                cl uster1                                                yarn.resourcemanager.ha.rm-ids                rm1,rm2                                                yarn.resourcemanager.hostname.rm1                node1                                                yarn.resourcemanager.webapp.address.rm1                node1:8088                                                yarn.resourcemanager.hostname.rm2                node2                                                yarn.resourcemanager.webapp.address.rm2                node2:8088                                                yarn.resourcemanager.zk-address                node2:2181,node3:2181,node4:2181        

3、把修改得配置文件分发到node2,node3,node4主机中

[root@node1 hadoop]# cd /opt/hadoop/etc/hadoop/[root@node1 hadoop]# scp hadoop-env.sh mapred-site.xml yarn-site.xml node2:/`pwd`[root@node1 hadoop]# scp hadoop-env.sh mapred-site.xml yarn-site.xml node3:/`pwd`[root@node1 hadoop]# scp hadoop-env.sh mapred-site.xml yarn-site.xml node4:/`pwd`

4、启动服务

node1上执行

[root@node1 hadoop]# start-yarn.sh

node2上执行

[root@node2 ~]# yarn-daemon.sh start resourcemanager

测试

最后说明,因为本环境搭建考虑的每个人的技术基础,所以把每个环节拆开部署,让大家能看懂其中的原理,后期熟练掌握的话可以合并步骤进行配置,有问题也可以留言或者私信我都可以。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:springboot集成测试容器重启问题的处理
下一篇:AWT100无线通信终端助力无线数据采集
相关文章

 发表评论

暂时没有评论,来抢沙发吧~