大数据面试题之Hadoop系列(深入部分)

网友投稿 293 2022-11-24

大数据面试题之Hadoop系列(深入部分)

不分类系列30题 1.HDFS写流程 2.HDFS读流程 3.HDFS的体系结构 4.一个datanode宕机后的恢复流程 5.hadoop的namenode宕机后怎么解决 6.namenode对元数据的管理 7.元数据的checkpoint 8.yarn资源调度流程  9.hadoop中combiner和partition的作用 10.用mapreduce怎么处理数据倾斜问题? 11.shuffle 阶段,你怎么理解的 12.Mapreduce的map数量和reduce数量是由什么决定的,怎么配置 13.MapReduce优化经验 14.分别举例什么情况要使用combiner,什么情况不使用? 15.MR运行流程解析 16.简单描述一下HDFS的系统架构,怎么保证数据安全? 17.在通过客户端向HDFS中写数据的时候,如果某一台机器宕机了,会怎么处理 18.Hadoop优化有哪些方面 19.大量数据求topN(写出mapreduce的实现思路) 20.列出正常工作的hadoop集群中hadoop都分别启动哪些进程以及他们的作用 21.Hadoop总job和Tasks之间的区别是什么? 22.Hadoop高可用HA模式 23.简要描述安装配置一个hadoop集群的步骤 24.fsimage和edit的区别 25.yarn的三大调度策略 26.hadoop的shell命令用的多吗?说出一些常用的 27.用mr实现用户pv的top10? 28.一个文件只有一行,但是这行有100G大小,mr会不会切分,我们应该怎么解决 29.HDFS HA机制&

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Java 中的变量类型
下一篇:RS485转PROFIBUS模块如何实现通讯
相关文章

 发表评论

暂时没有评论,来抢沙发吧~