Hadoop大数据——mapreduce的Distributed cache-APISpace

Hadoop大数据——mapreduce的Distributed cache

应用场景：map side join 工作原理：通过mapreduce框架将一个文件（本地/HDFS）分发到每一个运行时的task(map task /reduce task)节点上（放到task进程所在的工作目录）获取的方式：在我们自己的mapper或者reducer的代码内，直接使用本地文件JAVA ----API 来访问这个文件示例程序：首先在 job对象中进行指定： job.addCacheFile(new URI("hdfs://hadoop-server01:9000/cachefile/b.txt")); //分发一个文件到task进程的工作目录 job.addCacheFile(new URI("hdfs://hadoop-server01:9000/cachefile/b.txt")); //分发一个归档文件到task进程的工作目录 //job.addArchiveToClassPath(archive); //分发jar包到task节点的classpath下 //job.addFileToClassPath(jarfile); 然后在mapper或者reducer中直接使用： in = new FileReader("b.txt"); reader =new BufferedReader(in); String line = reader.readLine()

c语言sscanf函数的用法是什么

253 2022-11-24

Hadoop大数据——mapreduce的Distributed cache

c语言sscanf函数的用法是什么

linux怎么查看本机内存大小

php怎么获取input输入的值

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）