Skip to main content

概述

为用户打完标签或根据标签圈选出目标群组,还未达到运营活动的闭环,还需要把相关内容推送至目标人群。智能标签系统可以与上层的营销系统进行数据互通,营销系统拿到目标人群列表,并针对这些用户进行内容推送,智能标签便通过RestfulAPI的方式对外提供数据服务。

使用场景

智能标签支持配置2种类型的API:标签API、群组API

两种API的使用场景不同:

  • 标签API:为用户打完标签后,用户的标签数据都存储在大宽表中,建标签API,可以向外提供大宽表中所有用户的数据。
  • 群组API:圈选出部分目标用户后(群组),建群组API,可以向外提供这部分目标用户的数据。

实现逻辑

标签系统将通过数据同步任务周期性的把存储在Hive中的标签大宽表、群组表同步至Hbase数据库,并接入API网关。通过API网关查询Hbase中的数据,以此来满足高并发快查询的数据调用场景。

5 11 2021 16 32 22 PM

数据同步任务及Hbase中的表名称拼接规则可参考:数据同步

数据同步任务把Hive中标签大宽表和群组表每个周期实例产生的分区同步到Hbase中,且每个周期分区存为一张Hbase表,通过业务日期进行区分。

不同API查询的hbase表不同:

  • 标签API:查询Hbase标签大宽表
  • 群组API
    • 动态群组API:查询Hbase动态群组表
    • 静态群组API:查询Hbase静态群组表
    • 实时群组API:查询Hbase大宽表

如何调用手动分区的数据?

同步任务把hive的周期分区同步至hbase供API调用。用户在界面上手动更新标签或重跑相关任务后,hive将产生手动分区(即最新的秒级分区),在下次周期调度数据同步任务之前,hbase中供API调用的还是当前周期分区(不是最新的数据),需要手动重跑对应的数据同步任务,把最新数据同步至hbase。