Skip to main content

集群/产品概览

通过"运维中心-概览”功能页,掌握产品运行状况,包含CPU使用率、内存使用率、磁盘使用率、网络IO、主机概览等,产品运行情况,快速定位异常服务、异常告警信息。

image.png

组件-服务概览

概览页面左上角展示该产品下(可在第二层导航左上角切换产品)各个组件及服务的运行状态和健康检查状态。 分为两层,第一层是组件层,系统会将异常的组件显示在上方,正常的组件的显示在下方。异常组件的icon为红色、正常组件的icon为绿色。可查看异常组件下的异常服务,运行异常或未通过健康检查的组件会显示出来,从而可快速定位异常组件下的异常服务,掌握集群运行情况。 异常的服务可点击,点击跳转至具体的服务页面,可查看具体的服务实例,运行日志,进行服务运维。

告警信息概览

展示该产品异常的告警信息,查看某个服务因为什么原因在什么时间发出告警,及时运维。此处的告警信息来自于在仪表盘中配置的Alert规则。

集群指标概览

页面右侧由轮播仪表盘构建,展示可展示集群重要运行指标的仪表盘,帮助运维人员快速掌握集群资源情况,包含一下指标。

Dashboard指标
Cluster_Overview集群总内存
集群内存使用率
集群网络I/O
集群总CPU使用率
集群磁盘I/O
HDFS I/O
Host_Overview各主机部署服务
进程数
进程状态