部署完全分布式高可用 Hadoop hdfs HA + yarn HA-APISpace

部署完全分布式高可用 Hadoop hdfs HA + yarn HA

标签（空格分隔）：大数据运维专栏

一：hadoop HDFS HA 与 yarn HA 的概述二：部署环境概述三：部署zookeeper 四：部署HDFS HA 与 yarn HA 五：关于 HA 的测试

一：hadoop HDFS HA 与 yarn HA 的概述

1.1 HA 的概述

HA概述 1）所谓HA（High Available），即高可用（7*24小时不中断服务）。 2）实现高可用最关键的策略是消除单点故障。HA严格来说应该分成各个组件的HA机制：HDFS的HA和YARN的HA。 3）Hadoop2.0之前，在HDFS集群中NameNode存在单点故障（SPOF）。 4）NameNode主要在以下两个方面影响HDFS集群： NameNode机器发生意外，如宕机，集群将无法使用，直到管理员重启。 NameNode机器需要升级，包括软件、硬件升级，此时集群也将无法使用。 HDFS HA功能通过配置Active/Standby两个NameNodes实现在集群中对NameNode的热备来解决上述问题。如果出现故障，如机器崩溃或机器需要升级维护，这时可通过此种方式将NameNode很快的切换到另外一台机器。

1.2 HDFS-HA 的工作机制

HDFS-HA工作机制通过双NameNode消除单点故障。 HDFS-HA工作要点 1、元数据管理方式需要改变内存中各自保存一份元数据； Edits日志只有Active状态的NameNode节点可以做写操作；两个NameNode都可以读取Edits；共享的Edits放在一个共享存储中管理（qjournal和NFS两个主流实现）。 2、需要一个状态管理功能模块实现了一个zkfailover，常驻在每一个namenode所在的节点，每一个zkfailover负责监控自己所在NameNode节点，利用zk进行状态标识，当需要进行状态切换时，由zkfailover来负责切换，切换时需要防止brain split（脑裂）现象的发生。 3、必须保证两个NameNode之间能够ssh无密码登录。 4、隔离（Fence），即同一时刻仅仅有一个NameNode对外提供服务。

1.3 HDFS-HA手动故障转移工作机制

1.4 HDFS-HA自动故障转移工作机制

二：部署环境概述

2.1：所需安装配置包

1. 系统：CentOS 7.5 X64 2. 软件：Hadoop-3.2.1.tar.gz apache-zookeeper-3.6.1-bin.tar.gz jdk-8u181-linux-x64.rpm 将所有软件安装上传到/software下面 3. 系统关闭SELINUX 与清空iptables 防火墙规则 4. 系统配置好时间同步服务器 ntp1.aliyun.com

三：部署zookeeper

fat01.flyfish.com 节点操作 tar -zxvf apache-zookeeper-3.6.1-bin.tar.gz mv apache-zookeeper-3.6.1-bin /opt/bigdata/zookeeper cd /opt/bigdata/zookeeper/conf cp -p zoo_sample.cfg zoo.cfg vim zoo.cfg ----- dataDir=/opt/bigdata/zookeeper/data/ server.1=fat01.flyfish.com:2888:3888 server.2=fat02.flyfish.com:2888:3888 server.3=fat03.flyfish.com:2888:3888 ---- mkdir -p /opt/bigdata/zookeeper/data/ echo "1" > /opt/bigdata/zookeeper/data/myid 打包zookeeper 目录 cd /opt/bigdata/ tar -zcvf zookeeper.tar.gz zookeeper scp zookeeper.tar.gz root@192.168.11.195:/opt/bigdata/ scp zookeeper.tar.gz root@192.168.11.197:/opt/bigdata/

fat02.flyfish.com 节点操作 cd /opt/bigdata/ tar -zxvf zookeeper.tar.gz echo 2 > /opt/bigdata/zookeeper/data/myid

fat03.flyfish.com 节点操作 cd /opt/bigdata/ tar -zxvf zookeeper.tar.gz echo 3 > /opt/bigdata/zookeeper/data/myid

启动所有节点的zookeeper cd /opt/bigdata/zookeeper/bin ./zkstart.sh

四：部署HDFS HA 与 yarn HA

4.1 部署解压Hadoop

tar –zxvf hadoop-3.2.1.tar.gz mv hadoop-3.2.1 /opt/bigdata/hadoop/

4.2 编辑Hadoop-env.sh 配置文件

vim hadoop-env.sh --- export JAVA_HOME=/usr/java/jdk1.8.0_181-amd64 export HADOOP_PID_DIR=/opt/bigdata/hadoop/data/tmp export HADOOP_SECURE_DN_PID_DIR=/opt/bigdata/hadoop/data/tmp export HDFS_NAMENODE_USER="root" export HDFS_DATANODE_USER="root" export HDFS_ZKFC_USER="root" export HDFS_JOURNALNODE_USER="root" ----

vim mapred-env.sh 增加jdk 的环境 export JAVA_HOME=/usr/java/jdk1.8.0_181-amd64 export HADOOP_MAPRED_PID_DIR=/opt/bigdata/hadoop/data/tmp ----- vim yarn-env.sh export JAVA_HOME=/usr/java/jdk1.8.0_181-amd64 export YARN_RESOURCEMANAGER_USER=root export YARN_NODEMANAGER_USER=root

4.3 编辑core-site.xml 文件

cd /opt/bigdata/hadoop/etc/hadoop vim core-site.xml --- fs.defaultFS hdfs://myNameService1 hadoop.tmp.dir file:/opt/bigdata/hadoop/data/tmp Abase for other temporary directories. ha.zookeeper.quorum fat01.flyfish.com:2181,fat02.flyfish.com:2181,fat03.flyfish.com:2181 ----

4.4 编辑 hdfs-site.xml

vim hdfs-site.xml ---- dfs.nameservices myNameService1 dfs.ha.namenodes.myNameService1 nn1,nn2 dfs.namenode.rpc-address.myNameService1.nn1 fat01.flyfish.com:9000 dfs.namenode.http-address.myNameService1.nn1 fat01.flyfish.com:50070 dfs.namenode.rpc-address.myNameService1.nn2 fat02.flyfish.com:9000 dfs.namenode.http-address.myNameService1.nn2 fat02.flyfish.com:50070 dfs.namenode.shared.edits.dir qjournal://fat01.flyfish.com:8485;fat02.flyfish.com:8485;fat03.flyfish.com:8485/myNameService1 dfs.journalnode.edits.dir /opt/bigdata/hadoop/data/jn dfs.ha.automatic-failover.enabled true dfs.client.failover.proxy.provider.myNameService1 org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider dfs.ha.fencing.methods sshfence shell(/bin/true) dfs.ha.fencing.ssh.private-key-files /root/.ssh/id_rsa dfs.ha.fencing.ssh.connect-timeout 30000 dfs.replication 2 dfs.namenode.name.dir file:/opt/bigdata/hadoop/data/tmp/dfs/name dfs.datanode.data.dir file:/opt/bigdata/hadoop/tmp/dfs/data dfs.permissions false -----

4.5 编辑 yarn-site.xml

vim yarn-site.xml ---- yarn.resourcemanager.ha.enabled true yarn.resourcemanager.cluster-id yrc yarn.resourcemanager.ha.rm-ids rm1,rm2 yarn.resourcemanager.hostname.rm1 fat01.flyfish.com yarn.resourcemanager.hostname.rm2 fat02.flyfish.com yarn.resourcemanager.webapp.address.rm1 fat01.flyfish.com:8088 yarn.resourcemanager.webapp.address.rm2 fat02.flyfish.com:8088 yarn.resourcemanager.zk-address fat01.flyfish.com:2181,fat02.flyfish.com:2181,fat03.flyfish.com:2181 yarn.nodemanager.aux-services mapreduce_shuffle yarn.application.classpath /opt/bigdata/hadoop/etc/hadoop:/opt/bigdata/hadoop/share/hadoop/common/lib/*:/opt/bigdata/hadoop/share/hadoop/common/*:/opt/bigdata/hadoop/share/hadoop/hdfs:/opt/bigdata/hadoop/share/hadoop/hdfs/lib/*:/opt/bigdata/hadoop/share/hadoop/hdfs/*:/opt/bigdata/hadoop/share/hadoop/mapreduce/lib/*:/opt/bigdata/hadoop/share/hadoop/mapreduce/*:/opt/bigdata/hadoop/share/hadoop/yarn:/opt/bigdata/hadoop/share/hadoop/yarn/lib/*:/opt/bigdata/hadoop/share/hadoop/yarn/* -----

4.5 编辑 mapred-site.xml

vim mapred-site.xml ----- mapreduce.framework.name yarn mapreduce.jobhistory.address fat01.flyfish.com:10020 mapreduce.jobhistory.webapp.address fat01.flyfish.com:19888 mapreduce.application.classpath /opt/bigdata/hadoop/share/hadoop/mapreduce/*,/opt/bigdata/hadoop/share/hadoop/mapreduce/lib/* -----

4.6 修改works 文件

fat01.flyfish.com fat02.flyfish.com fat03.flyfish.com

4.8 打包同步所有节点

fat01.flyfish.com 节点： cd /opt/bigdata/ tar -zcvf hadoop.tar.gz hadoop scp hadoop.tar.gz root@192.168.11.195:/opt/bigdata/ scp hadoop.tar.gz root@192.168.11.197:/opt/bigdata/

fat02.flyfish.com 节点： cd /opt/bigdata/ tar -zxvf hadoop.tar.gz fat03.flyfish.com 节点操作 cd /opt/bigdata/ tar -zxvf hadoop.tar.gz

4.9 启动所有节点的journalnode服务

cd /opt/bigdata/hadoop/ sbin/hadoop-daemon.sh start journalnode

4.10 启动namenode 节点的HDFS

格式化hdfs hdfs namenode -format

将fat01.flyfish.com上生成的data文件夹复制到fat02.flyfish.com的相同目录下 cd /opt/bigdata/hadoop/ scp -r data/ root@192.168.11.195:/opt/bigdata/hadoop/ 启动namenode hdfs --daemon start namenode

fat02.flyfish.com 执行备用节点： hdfs namenode -bootstrapStandby hdfs --daemon start namenode

4.11格式化ZK 在fat01.flyfish.com上面执行

cd /opt/bigdata/hadoop/bin ./hdfs zkfc –formatZK

4.12 停掉/启动 hdfs 的所有服务

cd /opt/bigdata/hadoop/sbin/ ./stop-dfs.sh ./start-dfs.sh

打开hdfs 的web页面

4.12 启动yarn

cd /opt/bigdata/hadoop/ sbin/start-yarn.sh 启动 yarn sbin/stop-yarn.sh 停掉 yarn

启动日志聚合功能： cd /opt/bigdata/hadoop/sbin/ ./mr-jobhistory-daemon.sh start historyserver

五:关于 HA 的测试

5.1 hdfs HA 测试

当前节点fat02.flyfish.com 的hdfs 是active 状态把 fat02.flyfish.com 的 NN 服务停掉 jps kill -9 94030 fat01.flyfish.com 上的 NN 节点立马变为 active 状态

然后启动fat02.flyfish.com 的NN 节点 hdfs --daemon start namenode fat02.flyfish.com 上面的NN 变为standby

5.2 yarn 的HA 测试

提交一个job hdfs dfs -mkdir /input hdfs dfs -put word.txt /input cd /opt/bigdata/hadoop/ bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.1.jar wordcount /input /output1

Linux中怎么用cat命令创建文件并写入数据

225 2022-11-24

部署完全分布式高可用 Hadoop hdfs HA + yarn HA

linux怎么查看本机内存大小

linux cpu占用率如何看

Linux中怎么用cat命令创建文件并写入数据

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）

部署 完全分布式高可用 Hadoop hdfs HA + yarn HA

推荐文章

最近发表

热评文章

部署完全分布式高可用 Hadoop hdfs HA + yarn HA