c语言sscanf函数的用法是什么
293
2022-11-17
hadoop中常见的命令
今天学习了Hadoop中常用的一些命令,在这里就和大家分享一下:
tasktracker
概述
所有的hadoop命令均由bin/hadoop脚本引发。不指定参数运行hadoop脚本会打印所有命令的描述。
用法:hadoop [--config confdir] [COMMAND] [GENERIC_OPTIONS] [COMMAND_OPTIONS]
Hadoop有一个选项解析框架用于解析一般的选项和运行类。
命令选项 | 描述 |
--config confdir | 覆盖缺省配置目录。缺省是${HADOOP_HOME}/conf。 |
GENERIC_OPTIONS | 多个命令都支持的通用选项。 |
COMMAND 命令选项S |
常规选项
下面的选项被 dfsadmin, fs, fsck和 job支持。 应用程序要实现 Tool来支持 常规选项。
GENERIC_OPTION | 描述 |
-conf <configuration file> | 指定应用程序的配置文件。 |
-D <property=value> | 为指定property指定值value。 |
-fs <local|namenode:port> | 指定namenode。 |
-jt <local|jobtracker:port> | 指定job tracker。只适用于job。 |
-files <逗号分隔的文件列表> | 指定要拷贝到map reduce集群的文件的逗号分隔的列表。 只适用于job。 |
-libjars <逗号分隔的jar列表> | 指定要包含到classpath中的jar文件的逗号分隔的列表。 只适用于job。 |
-archives <逗号分隔的archive列表> | 指定要被解压到计算节点上的档案文件的逗号分割的列表。 只适用于job。 |
用户命令
hadoop集群用户的常用命令。
archive
创建一个hadoop档案文件。参考 Hadoop Archives.
用法:hadoop archive -archiveName NAME
命令选项 | 描述 |
-archiveName NAME | 要创建的档案的名字。 |
src | 文件系统的路径名,和通常含正则表达的一样。 |
dest | 保存档案文件的目标目录。 |
distcp
递归地拷贝文件或目录。参考DistCp指南以获取等多信息。
用法:hadoop distcp
命令选项 | 描述 |
srcurl | 源Url |
desturl | 目标Url |
fs
用法:hadoop fs [GENERIC_OPTIONS] [COMMAND_OPTIONS]
运行一个常规的文件系统客户端。
各种命令选项可以参考HDFS Shell指南。
fsck
运行HDFS文件系统检查工具。参考Fsck了解更多。
用法:hadoop fsck [GENERIC_OPTIONS]
命令选项 | 描述 |
<path> | 检查的起始目录。 |
-move | 移动受损文件到/lost+found |
-delete | 删除受损文件。 |
-openforwrite | 打印出写打开的文件。 |
-files | 打印出正被检查的文件。 |
-blocks | 打印出块信息报告。 |
-locations | 打印出每个块的位置信息。 |
-racks | 打印出data-node的网络拓扑结构。 |
jar
运行jar文件。用户可以把他们的Map Reduce代码捆绑到jar文件中,使用这个命令执行。
用法:hadoop jar
streaming作业是通过这个命令执行的。参考Streaming examples中的例子。
Word count例子也是通过jar命令运行的。参考Wordcount example。
job
用于和Map Reduce作业交互和命令。
用法:hadoop job [GENERIC_OPTIONS] [-submit
命令选项 | 描述 |
-submit <job-file> | 提交作业 |
-status <job-id> | 打印map和reduce完成百分比和所有计数器。 |
-counter <job-id> <group-name> <counter-name> | 打印计数器的值。 |
-kill <job-id> | 杀死指定作业。 |
-events <job-id> <from-event-#> <#-of-events> | 打印给定范围内jobtracker接收到的事件细节。 |
-history [all] <jobOutputDir> | -history <jobOutputDir> 打印作业的细节、失败及被杀死原因的细节。更多的关于一个作业的细节比如成功的任务,做过的任务尝试等信息可以通过指定[all]选项查看。 |
-list [all] | -list all显示所有作业。-list只显示将要完成的作业。 |
-kill-task <task-id> | 杀死任务。被杀死的任务不会不利于失败尝试。 |
-fail-task <task-id> | 使任务失败。被失败的任务会对失败尝试不利。 |
pipes
运行pipes作业。
用法:hadoop pipes [-conf
命令选项 | 描述 |
-conf <path> | 作业的配置 |
-jobconf <key=value>, <key=value>, ... | 增加/覆盖作业的配置项 |
-input <path> | 输入目录 |
-output <path> | 输出目录 |
-jar <jar file> | Jar文件名 |
-inputformat <class> | InputFormat类 |
-map <class> | Java Map类 |
-partitioner <class> | Java Partitioner |
-reduce <class> | Java Reduce类 |
-writer <class> | Java RecordWriter |
-program <executable> | 可执行程序的URI |
-reduces <num> | reduce个数 |
version
打印版本信息。
用法:hadoop version
CLASSNAME
hadoop脚本可用于调调用任何类。
用法:hadoop CLASSNAME
运行名字为CLASSNAME的类。
管理命令
hadoop集群管理员常用的命令。
balancer
运行集群平衡工具。管理员可以简单的按Ctrl-C来停止平衡过程。参考Rebalancer了解更多。
用法:hadoop balancer [-threshold
命令选项 | 描述 |
-threshold <threshold> | 磁盘容量的百分比。这会覆盖缺省的阀值。 |
daemonlog
获取或设置每个守护进程的日志级别。
用法:hadoop daemonlog -getlevel
命令选项 | 描述 | ||||||||||||||||||||||||||||||||||||||||||||
-getlevel <host:port> <name> | 打印运行在<host:port>的守护进程的日志级别。这个命令内部会连接data-id="t31e458f-Pg8s9Ihz" style="height: 30px;"> | -setlevel <host:port> <name> <level> | 设置运行在<host:port>的守护进程的日志级别。这个命令内部会连接datanode [-rollback]
dfsadmin 运行一个HDFS的dfsadmin客户端。 用法:hadoop dfsadmin [GENERIC_OPTIONS] [-report] [-safemode enter | leave | get | wait] [-refreshNodes] [-finalizeUpgrade] [-upgradeProgress status | details | force] [-metasave filename] [-setQuota
jobtracker 运行MapReduce job Tracker节点。 用法:hadoop jobtracker namenode 运行namenode。有关升级,回滚,升级终结的更多信息请参考升级和回滚。 用法:hadoop namenode [-format] | [-upgrade] | [-rollback] | [-finalize] | [-importCheckpoint]
secondarynamenode 运行HDFS的secondary namenode。参考Secondary Namenode了解更多。 用法:hadoop secondarynamenode [-checkpoint [force]] | [-geteditsize]
tasktracker 运行MapReduce的task Tracker节点。 用法:hadoop tasktracker 版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。 发表评论 |
暂时没有评论,来抢沙发吧~