Hadoop分布式集群搭建-APISpace

Hadoop分布式集群搭建

介绍

Hadoop常用发行版及选型

Apache HadoopCDH : Cloudera Distributed HadoopHDP : Hortonworks Data Platform

一般使用CDH，下载地址

将链接改为如下形式即可下载/etc/sysconfig/networkNETWORKING=yesHOSTNAME=hadoop000

hostname和ip地址的设置

角色分配

hadoop000 NameNode/DataNode ResourceManager/NodeManagerhadoop001 DataNode NodeManagerhadoop002 DataNode NodeManager

前置安装 SSH免密登陆，在每台机器上运行

// 生成公钥和私钥对ssh-keygen -t rsa

生成的文件在~/.ssh下 id_rsa和id_rsa.pub

执行如下命令输入密码即可（就是把hadoop000的公钥放置在hadoop000，hadoop001和hadoop002上这样就直接通过ssh登陆）

或者自己手动吧hadoop000 ~/.ssh/id_rsa.pub的内容复制到hadoop000，hadoop001和hadoop002上的~/.ssh/authorized_keys即可

ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop000ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop001ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop002

公钥访问时，需要把用户的公钥放置在~/.ssh/authorized_keys文件中，上面的命令做的就是这个功能

将hadoop的tar包解压到app目录下

tar

配置用户级别的环境变量

// 打开文件vi ~/.bash_profile//加入如下命令export HADOOP_HOME=/data/qa/app/hadoop-2.6.0-cdh5.7.0export PATH=$HADOOP_HOME/bin:$PATH// 刷新一下source

取出JAVA_HOME的路径

echo $JAVA_HOME

配置~/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop下的hadoop-env.sh 设置JAVA_HOME

export JAVA_HOME=/data/lib/jdk8

配置~/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop下的core-site.xml

fs.default.name hdfs://mad01:8020

配置~/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop下的hdfs-site.xml

dfs.namenode.name.dir /data/qa/app/tmp/dfs/name dfs.datanode.data.dir /data/qa/app/tmp/dfs/data

配置~/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop下的yarn-site.xml

yarn.nodemanager.aux-services mapreduce_shuffle yarn.resourcemanager.hostname mad01

配置~/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop下的mapred-site.xml

cp mapred-site.xml.template mapred-site.xmlvi

mapreduce.framework.name yarn

配置~/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop下的slaves

// 将localhost改为如下hadoop000hadoop001hadoop002

分发安装包到hadoop001和hadoop002节点

scp -r ~/app hadoop@hadoop001:~/scp -r ~/app hadoop@hadoop002:~/## 分发环境变量scp ~/.bash_profile hadoop@hadoop001:~/scp ~/.bash_profile hadoop@hadoop002:~/## 生效source

启动

对HDFS NameNode做格式化：只要在hadoop000上执行即可

cd $HADOOP_HOME/bin./hdfs namenode -format

启动集群：只要在hadoop000上执行即可

cd $HADOOP_HOME/sbin./start-all.sh## 关闭集群

验证 jps

hadoop000

NameNodeSecondaryNameNodeResourceManagerDataNodeNodeManager

hadoop001，hadoop002

NodeManagerDataNode

webui start datanode 启动所有的数据节点hadoop-daemon.sh start datanode 只启动当前的数据节点

参考博客

ubuntu中怎么手动设置ip地址

252 2022-11-15

Hadoop分布式集群搭建

debian怎么配置静态ip地址

ubuntu中怎么手动设置ip地址

怎么用python获取ip地址

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）