元数据同步
概述
实现逻辑:通过数据源连接,利用预置的元数据查询SQL,从数据源获取元数据信息,并通过DataSourceX插件,将查询到的元数据同步至资产平台。常见Q&A如下:
- Q1:同步性能怎么样,对源库有没有压力?
- A1:元数据采集的数据量和数据采集相比是非常小的,因此性能压力方面不存在瓶颈问题。
- Q2:为什么有些数据源需要开通所有表的查询权限才能采集元数据?
- A2:部分元数据信息无法直接在元数据表中直接获取,需要遍历每张表。
- Q3:元数据采集到底采集了哪些东西?
- A3:每个数据源均有所差异,具体可查看各个数据源的「数据地图-基本信息」的技术属性和表结构信息。
周期同步
新增周期同步任务:配置同步内容和调度配置,包括数据源信息、过滤信息、同步规则和告警通知。系统定期自动同步该数据源中所有库表的元数据信息。
过滤数据:当用户不希望在资产平台展示一些系统表、临时表或者需要保密的表时,可以在此处配置需要过滤的数据库/表。在元数据同步任务执行时,会自动过滤掉该部分表,不做采集。
同步规则:目前支持天、周、月的调度周期。
临时同步:临时同步的任务只执行一次且不可再次编辑。
同步实例
每次同步均会生成一条同步实例,记录同步时间、同步状态等信息,对于同步失败的表,用户可通过查询日志定位问题。
实时同步
info
该功能仅旗舰版支持。
实时同步:开启实时同步后,当源库发生DDL操作时,资产平台会实时同步发生变更的表。
tip实时同步目前只支持“Hive2.x、SparkThrift2.x”数据源,并且对应的数据源连接信息需要在高可用配置中维护上hive.metastore.uris参数
告警通知
当元数据同步发生异常状态时,可以对相应的用户发出告警。
tip告警通知触发机制:
①在无人为停止同步的情况下,周期同步实例运行未完成,会触发告警通知
②在实时同步开启状态下,检测到实时任务异常时,会触发告警通知
如果租户在「控制台-告警通道」中配置了自定义通道,告警通知配置需要显示「自定义告警通道」选项,否则不显示