监控ResourceManager状态

官方网址:https://hadoop.apache.org/docs/r2.8.4/hadoop-yarn/hadoop-yarn-site/ResourceManagerRest.html#Cluster_Information_API
官方API如下:
在这里插入图片描述
例如,我这里可以通过http://node04:8088/ws/v1/cluster可以访问到ResourceManager的状态信息(node04是我配置hadoop服务的主机名,你们要根据自己的配置主机进行修改,8088是yarn资源调度器中的RM的访问端口)
具体访问内容如下:
在这里插入图片描述
官方API给每个元素的解释如下:

元素含义
id集群 ID
startedOn集群启动的时间(以毫秒为单位)
stateResourceManager 状态 - 有效值为:NOTINITED、INITED、STARTED、STOPPED
haStateResourceManager HA 状态 - 有效值为:INITIALIZING、ACTIVE、STANDBY、STOPPED
resourceManagerVersion资源管理器的版本
resourceManagerBuildVersionResourceManager 构建字符串,包含构建版本、用户和校验和
resourceManagerVersionBuiltOnResourceManager 构建时的时间戳(自纪元以来的毫秒数)
hadoopVersionhadoop常用版本
hadoopBuildVersion具有构建版本、用户和校验和的 Hadoop 通用构建字符串
hadoopVersionBuiltOn构建hadoop common时的时间戳(自纪元以来的毫秒数)

通过jmx监控ResourceManager

访问路径:http://node04:8088/jmx?qry=Hadoop:service=ResourceManager,name=ClusterMetrics
获取内容如下:
在这里插入图片描述

监控yarn集群的指标

官方网址:https://hadoop.apache.org/docs/r2.8.4/hadoop-yarn/hadoop-yarn-site/ResourceManagerRest.html#Cluster_Metrics_API
官方API如下:
在这里插入图片描述
例如,我这里可以通过http://node04:8088/ws/v1/cluster可以访问到ResourceManager的集群指标(node04是我配置hadoop服务的主机名,你们要根据自己的配置主机进行修改,8088是yarn资源调度器中的RM的访问端口)
具体访问内容如下:
在这里插入图片描述
官方对每个元素的解释如下:

元素解释
appsSubmitted提交的申请数量
appsCompleted已完成的申请数量
appsPending待处理的申请数量
appsRunning运行的应用程序数量
appsFailed申请失败次数
appsKilled被杀死的应用程序数量
reservedMB保留的内存量(以 MB 为单位)
availableMB可用内存量(以 MB 为单位)
allocatedMB以 MB 为单位分配的内存量
totalMB以 MB 为单位的总内存量
reservedVirtualCores保留的虚拟核心数
availableVirtualCores可用虚拟核心数
allocatedVirtualCores分配的虚拟核心数
totalVirtualCores虚拟核心总数
containersAllocated分配的容器数量
containersReserved保留的容器数量
containersPending待处理的容器数
totalNodes节点总数
activeNodes活跃节点数
lostNodes丢失节点数
unhealthyNodes不健康节点数
decommissionedNodes退役节点数
rebootedNodes重启的节点数
Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐