Hadoop高可用环境搭建（QJM）-APISpace

Hadoop高可用环境搭建（QJM）

一、虚拟机配置

主机名	NN	DN	ZK	ZKFC	JNN	RM	NM
node1	*			*	*	*
node2	*	*	*	*	*	*	*
node3		*	*		*		*
node4		*	*				*

二、Hadoop 高可用（HA）实现(QJM)

1、node1主机上修改配置文件

修改core-site.xml

[root@node1 ~]# vi /opt/hadoop/etc/hadoop/core-site.xml#修改为如下： fs.defaultFS hdfs://mycluster hadoop.tmp.dir /hadoop-full/

修改hdfs-site.xml

[root@node1 hadoop]# vi /opt/hadoop/etc/hadoop/hdfs-site.xml#修改内容为如下： dfs.nameservices mycluster dfs.ha.namenodes.mycluster nn1,nn2 dfs.namenode.rpc-address.mycluster.nn1 node1:8020 dfs.namenode.rpc-address.mycluster.nn2 node2:8020 dfs.namenode. node1:50070 dfs.namenode. node2:50070 dfs.namenode.shared.edits.dir qjournal://node1:8485;node2:8485;node3:8485/mycluster dfs.client.failover.proxy.provider.mycluster org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider dfs.ha.fencing.methods sshfence dfs.ha.fencing.ssh.private-key-files /root/.ssh/id_rsa dfs.journalnode.edits.dir /hadoop-full/journalnode dfs.replication 3 dfs.permissions.enabled false

2、分发配置文件至node2，node3，node4

[root@node1 ~]#cd /opt/hadoop/etc/hadoop/[root@hadoop ~]# scp core-site.xml hdfs-site.xml node2:/`pwd`[root@hadoop ~]# scp core-site.xml hdfs-site.xml node3:/`pwd`[root@hadoop ~]# scp core-site.xml hdfs-site.xml node4:/`pwd`

3、启动journalnode

[root@node1 ~]# hadoop-daemon.sh start journalnode[root@node2 ~]# hadoop-daemon.sh start journalnode[root@node3 ~]# hadoop-daemon.sh start journalnode

4、HDFS Namenode数据同步

格式化(第一次配置情况下使用，已运行集群不能用)

[root@node1 ~]# hdfs namenode -format2020-01-27 11:09:37,394 INFO common.Storage: Storage directory /hadoop-full/dfs/name has been successfully formatted.[root@node1 ~]# hadoop-daemon.sh start namenode

共享日志文件初初始化（已运行的非HA集群使用）

[root@node1 ~]#hdfs namenode -initializeSharedEdits

启动node1上的namenode节点

[root@node1 ~]#hadoop-daemon.sh start namenode

node2节点同步镜像数据

[root@node2 ~]# hdfs namenode -bootstrapStandby

node2节点上启动namenode

[root@node2 ~]#hadoop-daemon.sh start namenode

5、启动datanode节点

[root@node2 ~]#hadoop-daemon.sh start datanode[root@node3 ~]# hadoop-daemon.sh start datanode[root@node4 ~]# hadoop-daemon.sh start datanode

6、提升namenode节点为active状态

hdfs haadmin -transitionToActive nn1

7、验证

命令行验证

[root@node1 ~]# jps2948 Jps1829 NameNode2013 JournalNode[root@node2 ~]# jps2029 Jps1455 NameNode1519 DataNode1599 JournalNode[root@node3 ~]# jps1335 Jps1195 DataNode1275 JournalNode[root@node4 ~]# jps997 Jps967 DataNode

网页查看

8、命令行操作HA集群

查看服务状态

[root@node1 ~]#hdfs haadmin -getServiceState nn1

设置namenode为active节点

设置namenode为Standby

[root@node1 ~]#hdfs haadmin -transitionToStandby nn1

手动故障切换

[root@node1 ~]#hdfs haadmin -failover nn1 nn2

三、Zookeeper安装配置

1、修改主机hosts文件

[root@node2 conf]# vi /etc/hosts#添加如下内容127.0.0.1 localhost

2、上传zookeeper安装包到node2上

3、解压安装包到指定目录

[root@node2 ~]# tar -zxvf zookeeper-3.4.6.tar.gz -C /opt/

4、重命名目录

[root@node2 ~]# mv /opt/zookeeper-3.4.6/ /opt/zookeeper

5、修改配置文件

重命名配置文件

[root@node2 ~]#cd /opt/zookeeper/conf/[root@node2 conf]#cp zoo_sample.cfg zoo.cfg

修改配置文件

[root@node2 conf]#vi zoo.cfg#12行修改为如下内容dataDir=/hadoop-full/zookeeper#文件末尾添加如下内容server.1=node2:2888:3888server.2=node3:2888:3888server.3=node4:2888:3888

5、添加环境变量

修改配置文件

[root@node2 ~]# vi /etc/profile.d/hadoop.sh#修改为如下内容export JAVA_HOME=/opt/jdkexport HADOOP_HOME=/opt/hadoopexport ZOOKEEPER_HOME=/opt/zookeeperexport PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$ZOOKEEPER_HOME/bin

重新编译文件

[root@node2 ~]# source /etc/profile

6、创建工作目录

[root@node2 ~]# mkdir -p /hadoop-full/zookeeper[root@node2 ~]# echo 1 >/hadoop-full/zookeeper/myid

7、分发文件

分发hosts文件

[root@node2 conf]# scp /etc/hosts node3:/etc/hosts[root@node2 conf]# scp /etc/hosts node4:/etc/hosts

分发环境变量

[root@node2 ~]# scp /etc/profile.d/hadoop.sh node3:/etc/profile.d/[root@node2 ~]# scp /etc/profile.d/hadoop.sh node4:/etc/profile.d/

编译profile文件

[root@node3 ~]# source /etc/profile[root@node4 ~]# source /etc/profile

分发zookeeper安装文件

[root@node2 ~]# scp -r /opt/zookeeper node3:/opt/[root@node2 ~]# scp -r /opt/zookeeper node4:/opt/

分发工作目录

[root@node2 ~]# scp -r /hadoop-full/zookeeper node3:/hadoop-full/[root@node2 ~]# scp -r /hadoop-full/zookeeper node4:/hadoop-full/

8、修改myid文件

[root@node3 ~]# echo 2 >/hadoop-full/zookeeper/myid[root@node4 ~]# echo 3 >/hadoop-full/zookeeper/myid

9、启动服务

[root@node2 ~]# zkServer.sh start[root@node3 ~]# zkServer.sh start[root@node4 ~]# zkServer.sh start

10、查看状态

[root@node2 opt]# zkServer.sh statusJMX enabled by defaultUsing config: /opt/zookeeper/bin/../conf/zoo.cfgMode: follower[root@node3 ~]# zkServer.sh statusJMX enabled by defaultUsing config: /opt/zookeeper/bin/../conf/zoo.cfgMode: leader[root@node4 ~]# zkServer.sh statusJMX enabled by defaultUsing config: /opt/zookeeper/bin/../conf/zoo.cfgMode: follower

五、Zookeeper实现Hadoop Namenode HA故障自动切换

1、node1主机上修改配置文件

修改core-site.xml

[root@node1 ~]# vi /opt/hadoop/etc/hadoop/core-site.xml#原有内容上添加为如下内容： ha.zookeeper.quorum node2:2181,node3:2181,node4:2181

修改hdfs-site.xml

[root@node1 hadoop]# vi /opt/hadoop/etc/hadoop/hdfs-site.xml#原有内容上添加为如下内容： dfs.ha.automatic-failover.enabled true

2、分发配置文件至node2，node3，node4

3、zookeeper FailerController格式化

[root@node1 ~]# hdfs zkfc -formatZK2020-01-27 11:26:40,326 INFO ha.ActiveStandbyElector: Successfully created /hadoop-ha/mycluster in ZK

4、namenode节点安装psmisc（ZKFC主机）

[root@node1 ~]#yum install psmisc -y[root@node2 ~]#yum install psmisc -y

5、node2免密登录node2设置

[root@node2 ~]# ssh-keygen Generating public/private rsa key pair.Enter file in which to save the key (/root/.ssh/id_rsa): Enter passphrase (empty for no passphrase): Enter same passphrase again: Your identification has been saved in /root/.ssh/id_rsa.Your public key has been saved in /root/.ssh/id_rsa.pub.The key fingerprint is:SHA256:21X44T83NPr3k/FabLoSGZZDCoGck1ncNiowoLJGlr0 root@node2The key's randomart image is:+---[RSA 2048]----+| .. . Boo || .o o B o + .. ||o+ . o . + +..o ||+. . . . . =+ . ||.. E .S ..+oo ||. o .o o+.|| . . o oX|| . .**|| .++=|+----[SHA256]-----+[root@node2 ~]# cd ~/.ssh/[root@node2 .ssh]# ssh-copy-id node1/usr/bin/ssh-copy-id: INFO: Source of key(s) to be installed: "/root/.ssh/id_rsa.pub"The authenticity of host 'node1 (192.168.30.11)' can't be established.ECDSA key fingerprint is SHA256:/V6z9w2ts2Ei8dgcKAlJCGozcmoeWNSNyctvHWjdoJk.ECDSA key fingerprint is MD5:09:41:c7:ad:2b:65:77:6f:eb:af:77:be:8f:e3:1f:15.Are you sure you want to continue connecting (yes/no)? yes/usr/bin/ssh-copy-id: INFO: attempting to log in with the new key(s), to filter out any that are already installed/usr/bin/ssh-copy-id: INFO: 1 key(s) remain to be installed -- if you are prompted now it is to install the new keysroot@node1's password: Number of key(s) added: 1Now try logging into the machine, with: "ssh 'node1'"and check to make sure that only the key(s) you wanted were added.[root@node2 .ssh]# ssh node1

6、启动集群

[root@node1 hadoop]# start-dfs.sh

7、验证：

六、ResourceManager HA 配置

1、修改mapred-site.xml

[root@node1 hadoop]# vi /opt/hadoop/etc/hadoop/mapred-site.xml#修改为如下内容 mapreduce.framework.name yarn

2、修改yarn-site.xml

[root@node1 hadoop]# vi /opt/hadoop/etc/hadoop/yarn-site.xml#修改为如下内容 yarn.nodemanager.aux-services mapreduce_shuffle yarn.log-aggregation-enable true yarn.resourcemanager.ha.enabled true yarn.resourcemanager.cluster-id cl uster1 yarn.resourcemanager.ha.rm-ids rm1,rm2 yarn.resourcemanager.hostname.rm1 node1 yarn.resourcemanager.webapp.address.rm1 node1:8088 yarn.resourcemanager.hostname.rm2 node2 yarn.resourcemanager.webapp.address.rm2 node2:8088 yarn.resourcemanager.zk-address node2:2181,node3:2181,node4:2181

3、把修改得配置文件分发到node2，node3，node4主机中

[root@node1 hadoop]# cd /opt/hadoop/etc/hadoop/[root@node1 hadoop]# scp hadoop-env.sh mapred-site.xml yarn-site.xml node2:/`pwd`[root@node1 hadoop]# scp hadoop-env.sh mapred-site.xml yarn-site.xml node3:/`pwd`[root@node1 hadoop]# scp hadoop-env.sh mapred-site.xml yarn-site.xml node4:/`pwd`

4、启动服务

node1上执行

[root@node1 hadoop]# start-yarn.sh

node2上执行

[root@node2 ~]# yarn-daemon.sh start resourcemanager

测试

最后说明，因为本环境搭建考虑的每个人的技术基础，所以把每个环节拆开部署，让大家能看懂其中的原理，后期熟练掌握的话可以合并步骤进行配置，有问题也可以留言或者私信我都可以。

c语言sscanf函数的用法是什么

328 2022-11-26

Hadoop高可用环境搭建（QJM）

c语言sscanf函数的用法是什么

linux怎么查看本机内存大小

php怎么获取input输入的值

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）