(1)Hadoop 2.x基本配置及运行MapReduce案例在本地模式下-APISpace

(1)Hadoop 2.x基本配置及运行MapReduce案例在本地模式下

（1）下载hadoop安装包解压

tar -zxf hadoop-2.5.0-cdh5.3.6.tar.gz -C /opt/modules

（3）根据官方文档步骤进行配置

下

（4）修改 etc/hadoop/hadoop-env.sh

配置 export JAVA_HOME=${JAVA_HOME}

注：这里前提是已经配置了JAVA_HOME 可以在命令行用echo ${JAVA_HOME} 查看是否已经配置

配置：export HADOOP_PREFIX=/opt/modules/hadoop-2.5.0-cdh5.3.6

注：这是hadoop的安装目录也就是（2）步的解压目录 HADOOP_PREFIX选项可以不配置

（5）可以启动集群了

hadoop集群有三种模式：

1）独立模式（本地模式） standalone

2)伪分布模式 pseudodistributed

3)完全分布模式 fulldistributed

独立模式：MapReduce程序运行在本地启动JVM

例子：

hadoop-mapreduce-examples-2.5.2.jar这个jar包中有很多官方写的案例程序可以用来熟悉MapReduce的使用

a.进入解压目录cd /opt/modules/hadoop-2.5.0-cdh5.3.6

b.执行 mkdir input 创建input文件夹

c.执行 cp etc/hadoop/*.xml input 把 etc/hadoop/ 下的xml文件都复制到input文件下

这个操作没有什么目的只是为了让input文件夹下多几个内容用来统计使用

d.执行 bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0-cdh5.3.6.jar grep input output 'dfs[a-z.]+'

这是MapReduce自带的程序脚本都在bin目录下

input 是输入目录 output是输出目录 grep是执行的命令 'dfs[a-z.]+'是命令需要的参数

这个过程程序会去便利input下文件的内容然后统计dfs开头的单词

结果在output目录下 _SUCCES说明执行成功 part-r-00000是存放执行结果的地方

例子2：单词统计

创建输入目录 mkdir wcinput

进入目录局 cd wcinput

创建存放单词的文件 touch wc.input

进入文件编辑内容 vi wc.input

添加：

aaa bbb ccc ddd ddd eee sssssss

执行：

cd ../ 返回到/opt/modules/hadoop-2.5.0-cdh5.3.6

bin/hadoop/ jar share/hadoop/mapreduce/hadxxx.jar wordcount wcinput wcoutput

查看结果到wcoutput 文件夹下 cd wcoutput 查看part-r-00000

c语言sscanf函数的用法是什么

269 2022-11-25

(1)Hadoop 2.x基本配置及运行MapReduce案例在本地模式下

c语言sscanf函数的用法是什么

c语言一维数组怎么快速排列

linux怎么查看本机内存大小

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）