Skip to main content

服务管理

概述

【服务管理】模块主要用于管理和监控大数据平台中的各个组件服务,并对集群服务进行一系列集群运维。这个模块展示了每个服务的运行状态、基本信息、各项性能指标、集群实例管理、配置管理等功能,帮助运维人员及时发现并解决问题,确保集群的平稳运行。

核心功能

1、概览

  • 提供系统的整体运行状态和基本信息,包括 agent 状态、版本号和节点数量等。
  • 显示各服务的运行状态,便于快速了解系统健康状况。

2、实例

  • 列出当前集群中所有服务实例的信息。
  • 包括实例名称、状态、版本、节点等详细信息,方便管理和监控各实例。

3、实例组

  • 将相关的服务实例分组管理,便于对相关实例进行统一操作。
  • 提供对实例组的创建、修改和删除功能。

4、配置

  • 提供对各服务的配置管理功能。
  • 支持查看和修改服务的配置参数,以适应不同的运行需求。

功能详情

进入服务管理模块

img_1.png

服务概览

img_2.png 登录平台,进入“集群-组件服务”模块。 选择“概览”标签页,可以查看: 系统的基本信息:agent 状态、版本号、节点数量等。 各个组件服务的运行状态,健康状况通过不同颜色标识(绿色正常,红色异常)。 查看系统运行时间、总内存、可用内存、总 CPU 核心数、可用磁盘空间等。 通过性能图表,监控系统负载、CPU 使用率等指标的历史变化情况。 使用性能图表:

选择需要查看的时间范围(如最近1小时、24小时等),查看详细的性能数据。 及时发现和处理潜在问题,确保系统平稳运行。

管理服务实例

服务【实例】模块主要用于管理和监控大数据集群中的各个角色实例。通过该模块,用户可以查看集群中所有角色实例的状态、配置、运行信息等,便于及时发现和处理问题,保证系统的正常运行。

img_3.png

角色启停:支持同时选择多个角色实例实现一键实例启动与停止;

配置:点击配置可查看角色实例的配置参数;

日志:点击日志跳转至【运维-日志查看】模块,查看角色实例下服务的日志详情;

实例详情:点击角色名称,可查看该实例角色监控仪表盘,了解服务运行的详细指标;

img_1.png

生成Keytab:在使用Kerberos进行身份验证的Hadoop集群环境中,页面选择实例节点可以手动生成keytab加密服务凭据。keytab文件允许无密码地验证服务,增强了安全性。

生成Dump文件:对于偶发性出现服务崩溃或需要调试的Java应用实例角色,支持页面手动生成Dump文件,获取服务进程的内存映像。Dump文件中包含了服务在特定时间点的状态信息,可以用于后续的分析以确定问题原因。点击生成Dump文件按钮后可通过【系统-任务管理】查看对应的Dump文件生成状态。

服务实例组

【集群-服务实例组】模块用于管理和监控大数据平台中的各个角色实例组。用户可以查看和管理不同实例组中的服务运行状态、配置情况以及日志信息,确保集群中各个服务的正常运行和高效运维。同时支持不同实例组间进行差异化配置提升集群资源利用率。

img_4.png 服务部署完成后,每个服务角色生成默认的Default实例组,同一实例组中配置保持一致。 实例组创建 img_1.png

  • 点击左侧实例组列表"➕"号创建角色实例组;
  • 填写实例组名称,例如:hadoop-pkg-test;
  • 选择将要复制的实例组配置;
  • 点击"确定"完成实例组创建;

配置修改

img_1.png 进入hadoop-pkg-test实例组,切换至[配置]模块; 选择需要修改的配置参数,点击"编辑"icon进行修改,支持多个参数修改完成后进行统一保存; 实例组变更

img_2.png 选择将要迁出实例节点,点击实例组变更; 选择目标实例组; 点击确认完成实例组变更;

note

实例组变更后,完成配置下发、重启服务配置才会更新;

配置修改

服务配置

【服务配置】模块是该服务配置总览,其运行配置为Default实例组配置参数,支持进行配置编辑修改,查看与其他实例组之间的差异化配置。 img_5.png

  • 运行配置:用于管理和调整服务的运行参数,这些参数直接影响服务的性能和行为。在运行配置中,可以修改服务的环境变量、性能参数等,支持页面添加自定义参数。
  • 运维配置:用于管理服务的运维相关参数,如启动配置、日志设置、端口设置能等。
  • 差异化配置:用于管理不同实例组间的配置差异。