【AWS征文】[大数据][Hadoop] 使用EMR做大数据分析

网友投稿 245 2022-11-25

【AWS征文】[大数据][Hadoop] 使用EMR做大数据分析

还是先极简介绍一下EMR是什么,Amazon EMR 基于 Hadoop 的开源框架将您的数据分布在可重新调整大小的 Amazon EC2 实例集群中并进行处理。Amazon EMR 可用于各种应用程序中,包括日志分析、Web 索引、数据仓库、机器学习、财务分析、科学模拟和生物信息学。具体的功能特性可以直接到官网查阅。直接上实验:

实验包括:

1. 使用EMR创建Hadoop集群

2. 定义schema,创建示例表。

3. 通过HiveQL分析数据,并将分析结果保存到S3上

4. 下载已经分析结果数据。

Task1:创建一个S3 桶

Task2:创建EMR集群

Done!

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Hadoop和Yarn的配置文件
下一篇:MCP4661T-503E/ML数字电位器 QFN16
相关文章

 发表评论

暂时没有评论,来抢沙发吧~