Skip to main content

标签导入

自定义标签创建并发布完成后,需要导入具体的标签值,系统将根据导入的数据为实例打上标签。自定义标签只有导入数据后才能用来建组合标签、标签圈群等后续操作,否则是个空标签,没有任何价值。

导入标签

根据“实体主键”与“实例对应的标签值”文件,匹配实例的标签数据,并打上标签。目前只支持自定义标签导入数据。

入口: 进入“标签中心-标签配置”页面,点击右上角的导入标签按钮,进入如下页面

img

  • 选择标签:从已发布的自定义标签中选择,最多可以选5个标签同时导入
  • 匹配维度:标签数据导入时与标签库的维度进行匹配的标签,从已经发布且更新成功的标签中选择,最多可选3个标签
  • 导入方式:支持上传CSV文件、从Hive表导入2种方式
    • 上传本地文件:根据系统提供的模板,上传CSV文件
    • 从Hive表导入:从当前项目对接的Hive库中,选一张表导入标签数据,表中必须包含上方选的匹配维度、待导入的自定义标签,且须保持与标签英文名称一致(标签顺序无所谓)
tip

系统对本地文件或hive表的要求:

  1. 不能为空,且必须包含实体主键和已选标签的英文名;
  2. 匹配维度的数据类型必须与大宽表存储的数据格式一致,且不能重复;
  • 同时更新下游依赖标签:不管是否勾选,导入标签后系统将自动跑一次标签任务和大宽表任务,把导入的数据更新到大宽表的最新分区中。 若勾选后,系统将同时跑下游依赖的标签任务。
tip

自定义标签在每次导数据的时候加工标签临时表,其本身不参与周期调度,而任务实例中产生的自定义标签任务是一个空节点,用于调起下游的大宽表任务。

  • 预览数据:支持预览csv文件或hive表的前100条数据

4 12 2021 16 26 54 PM

示例,假设需要为“黑白名单”的自定义标签导数据,首先导入文件,如上图所示,文件内容至少包含2列数据:实体主键、实例对应的标签值;导入后,系统将根据实体主键从大宽表匹配相关用户,并为匹配到的用户打上标签。

tip
  1. 标签导入并为匹配的实例打上标签,是一个异步处理的过程;所以在导入标签后并不意味着打标签成功,需要在导入记录tab页查看标签的导入情况;
  2. 由于计算资源的限制,当某个自定义标签正在导入时,用户无法再次进行导标签的操作,此时导入标签tab页的确定按钮将不可用。

导入记录

如下图所示,系统支持查看导入标签的操作记录,且可以根据日志排查失败原因。

4 12 2021 16 28 02 PM