集群概览
概述
集群概览页是大数据引擎平台中的重要功能模块,用户可以全面了解集群的健康状况、节点运行状态、资源利用率以及正在执行的任务,从而确保集群的高效稳定运行。
功能介绍
总览
集群概览页分为「服务」、「概览」两部分。其中「服务」模块部分展示了集群中各产品线下部署的组件服务及服务状态,可集中了解集群服务的整体健康状态;右侧「概览」模块展示了集群的关键性能指标,包括 CPU 使用率、磁盘 IO 使用率、磁盘使用率、内存使用率、网络发送量和网络接收量等,这些指标帮助用户全面了解集群的健康状况和性能表现。
监控指标
CPU 使用率
- 图表: cpu_metrics
- 描述: 显示集群中 CPU 的使用情况,通过监控 CPU 使用率,可以发现是否存在 CPU 资源紧张或使用过低的问题。
磁盘 IO 使用率
- 图表: disklo_metrics
- 描述: 显示磁盘输入输出操作的使用情况,帮助用户了解磁盘的读写压力。
磁盘使用率
- 图表: disk_metrics
- 描述: 显示磁盘的总体使用情况,帮助用户监控磁盘空间的使用率,避免磁盘空间不足导致的运行问题。
内存使用率
- 图表: memory_metrics
- 描述: 显示内存的使用情况,通过监控内存使用率,可以发现内存是否存在瓶颈,是否需要进行内存优化或扩容。
网络发送量
- 图表: networkSendIo_metrics
- 描述: 显示网络发送数据的量,帮助用户了解集群中网络发送数据的情况。
网络接收量
- 图表: networkReceiveIo_metrics
- 描述: 显示网络接收数据的量,帮助用户了解集群中网络接收数据的情况。
操作指南
进入集群概览页
1、登录大数据运维管理平台,进入【集群概览】页;
2、导航栏中选择“集群”,点击「集群概览」进入【集群概览】页;
查看集群指标
1、进入集群概览页后,您将看到各项监控指标的图表;
2、每个图表展示了相应资源的使用情况,您可以通过图表直观了解当前和历史的资源使用状态;
3、将鼠标悬停在图表上可以查看具体时间点的数值。
切换时间范围
1、在集群概览页的右上角,有时间范围切换选项;
2、您可以选择查看过去 30 分钟、1 小时、2 小时、6 小时、12 小时、1 天、7 天、30 天的数据;
3、点击相应时间范围选项,图表将会刷新并显示选定时间范围内的数据。