集群/产品概览
通过"运维中心-概览
”功能页,掌握产品运行状况,包含CPU使用率、内存使用率、磁盘使用率、网络IO、主机概览等,产品运行情况,快速定位异常服务、异常告警信息。
组件-服务概览
概览页面左上角展示该产品下(可在第二层导航左上角切换产品)各个组件及服务的运行状态和健康检查状态。 分为两层,第一层是组件层,系统会将异常的组件显示在上方,正常的组件的显示在下方。异常组件的icon为红色、正常组件的icon为绿色。可查看异常组件下的异常服务,运行异常或未通过健康检查的组件会显示出来,从而可快速定位异常组件下的异常服务,掌握集群运行情况。 异常的服务可点击,点击跳转至具体的服务页面,可查看具体的服务实例,运行日志,进行服务运维。
告警信息概览
展示该产品异常的告警信息,查看某个服务因为什么原因在什么时间发出告警,及时运维。此处的告警信息来自于在仪表盘中配置的Alert规则。
集群指标概览
页面右侧由轮播仪表盘构建,展示可展示集群重要运行指标的仪表盘,帮助运维人员快速掌握集群资源情况,包含一下指标。
Dashboard | 指标 |
---|---|
Cluster_Overview | 集群总内存 |
集群内存使用率 | |
集群网络I/O | |
集群总CPU使用率 | |
集群磁盘I/O | |
HDFS I/O | |
Host_Overview | 各主机部署服务 |
进程数 | |
进程状态 |