服务管理
概述
【服务管理】模块主要用于管理和监控大数据平台中的各个组件服务,并对集群服务进行一系列集群运维。这个模块展示了每个服务的运行状态、基本信息、各项性能指标、集群实例管理、配置管理等功能,帮助运维人员及时发现并解决问题,确保集群的平稳运行。
核心功能
1、概览
- 提供系统的整体运行状态和基本信息,包括 agent 状态、版本号和节点数量等。
- 显示各服务的运行状态,便于快速了解系统健康状况。
2、实例
- 列出当前集群中所有服务实例的信息。
- 包括实例名称、状态、版本、节点等详细信息,方便管理和监控各实例。
3、实例组
- 将相关的服务实例分组管理,便于对相关实例进行统一操作。
- 提供对实例组的创建、修改和删除功能。
4、配置
- 提供对各服务的配置管理功能。
- 支持查看和修改服务的配置参数,以适应不同的运行需求。
功能详情
进入服务管理模块
服务概览
登录平台,进入“集群-组件服务”模块。
选择“概览”标签页,可以查看:
系统的基本信息:agent 状态、版本号、节点数量等。
各个组件服务的运行状态,健康状况通过不同颜色标识(绿色正常,红色异常)。
查看系统运行时间、总内存、可用内存、总 CPU 核心数、可用磁盘空间等。
通过性能图表,监控系统负载、CPU 使用率等指标的历史变化情况。
使用性能图表:
选择需要查看的时间范围(如最近1小时、24小时等),查看详细的性能数据。 及时发现和处理潜在问题,确保系统平稳运行。
管理服务实例
服务【实例】模块主要用于管理和监控大数据集群中的各个角色实例。通过该模块,用户可以查看集群中所有角色实例的状态、配置、运行信息等,便于及时发现和处理问题,保证系统的正常运行。
角色启停:支持同时选择多个角色实例实现一键实例启动与停止;
配置:点击配置可查看角色实例的配置参数;
日志:点击日志跳转至【运维-日志查看】模块,查看角色实例下服务的日志详情;
实例详情:点击角色名称,可查看该实例角色监控仪表盘,了解服务运行的详细指标;
生成Keytab:在使用Kerberos进行身份验证的Hadoop集群环境中,页面选择实例节点可以手动生成keytab加密服务凭据。keytab文件允许无密码地验证服务,增强了安全性。
生成Dump文件:对于偶发性出现服务崩溃或需要调试的Java应用实例角色,支持页面手动生成Dump文件,获取服务进程的内存映像。Dump文件中包含了服务在特定时间点的状态信息,可以用于后续的分析以确定问题原因。点击生成Dump文件按钮后可通过【系统-任务管理】查看对应的Dump文件生成状态。
服务实例组
【集群-服务实例组】模块用于管理和监控大数据平台中的各个角色实例组。用户可以查看和管理不同实例组中的服务运行状态、配置情况以及日志信息,确保集群中各个服务的正常运行和高效运维。同时支持不同实例组间进行差异化配置提升集群资源利用率。
服务部署完成后,每个服务角色生成默认的Default实例组,同一实例组中配置保持一致。
实例组创建
- 点击左侧实例组列表"➕"号创建角色实例组;
- 填写实例组名称,例如:hadoop-pkg-test;
- 选择将要复制的实例组配置;
- 点击"确定"完成实例组创建;
配置修改
进入hadoop-pkg-test实例组,切换至[配置]模块;
选择需要修改的配置参数,点击"编辑"icon进行修改,支持多个参数修改完成后进行统一保存;
实例组变更
选择将要迁出实例节点,点击实例组变更;
选择目标实例组;
点击确认完成实例组变更;
实例组变更后,完成配置下发、重启服务配置才会更新;
配置修改
服务配置
【服务配置】模块是该服务配置总览,其运行配置为Default实例组配置参数,支持进行配置编辑修改,查看与其他实例组之间的差异化配置。
- 运行配置:用于管理和调整服务的运行参数,这些参数直接影响服务的性能和行为。在运行配置中,可以修改服务的环境变量、性能参数等,支持页面添加自定义参数。
- 运维配置:用于管理服务的运维相关参数,如启动配置、日志设置、端口设置能等。
- 差异化配置:用于管理不同实例组间的配置差异。