Skip to main content

Trino数据源介绍

一、需求背景

  • 基于各数据源JDBC执行的质量校验任务,运行速度慢,需要加入OLAP引擎支持。Trino支持适用于交互式分析查询,用来专门进行高速、实时的数据分析。引入Trino数据源,达到提升运行速度,提高计算效率的目的。
  • 无法跨源校验对比多表的数据质量,Trino支持异构数据源互通。引入Trino,解决跨源多表比对场景需求。

二、功能介绍

Trino数据源连接

  • 数据源连接:

    1. 可在“数据源中心”配置Trino数据源,支持连接平台自带的Trino数据源,也支持链接外部Trino数据源。
    2. 在质量平台选择已连接的Trino数据源。
  • 数据源说明:connector支持几种常见的且官方已支持的数据源类型:Hive、MySQL、Oracle、PostgreSQL、SQLServer、Inceptor、tdsql。

    • 自带的Trino数据源:支持新增connector管理,不支持同步现有的connector。

    meta数据源connector列表

    meta数据源添加connector

    • 外部Trino数据源:不支持新增connector管理,支持同步现有的connector。

    外部数据源链接信息

Trino数据源单表校验

  • 基本流程与其他「单表校验规则」相同,参数有略微不同,需要填写catalog和Schema。

单表校验

只有connector是Hive/inceptor的Trino数据源才会出现分区配置项。其他connector无该配置项。

Trino数据源跨源多表校验

  • 基本流程与其他「多表校验规则」相同,参数有略微不同,需要填写左表和右表的catalog、Schema。

多表 左侧表

多表 右侧表