标签导入
自定义标签创建并发布完成后,需要导入具体的标签值,系统将根据导入的数据为实例打上标签。自定义标签只有导入数据后才能用来建组合标签、标签圈群等后续操作,否则是个空标签,没有任何价值。
导入标签
根据“实体主键”与“实例对应的标签值”文件,匹配实例的标签数据,并打上标签。目前只支持自定义标签导入数据。
入口: 进入“标签中心-标签配置”页面,点击右上角的导入标签按钮,进入如下页面
- 选择标签:从已发布的自定义标签中选择,最多可以选5个标签同时导入
- 匹配维度:标签数据导入时与标签库的维度进行匹配的标签,从已经发布且更新成功的标签中选择,最多可选3个标签
- 导入方式:支持上传CSV文件、从Hive表导入2种方式
- 上传本地文件:根据系统提供的模板,上传CSV文件
- 从Hive表导入:从当前项目对接的Hive库中,选一张表导入标签数据,表中必须包含上方选的匹配维度、待导入的自定义标签,且须保持与标签英文名称一致(标签顺序无所谓)
tip
系统对本地文件或hive表的要求:
- 不能为空,且必须包含实体主键和已选标签的英文名;
- 匹配维度的数据类型必须与大宽表存储的数据格式一致,且不能重复;
- 同时更新下游依赖标签:不管是否勾选,导入标签后系统将自动跑一次标签任务和大宽表任务,把导入的数据更新到大宽表的最新分区中。 若勾选后,系统将同时跑下游依赖的标签任务。
tip
自定义标签在每次导数据的时候加工标签临时表,其本身不参与周期调度,而任务实例中产生的自定义标签任务是一个空节点,用于调起下游的大宽表任务。
- 预览数据:支持预览csv文件或hive表的前100条数据
示例,假设需要为“黑白名单”的自定义标签导数据,首先导入文件,如上图所示,文件内容至少包含2列数据:实体主键、实例对应的标签值;导入后,系统将根据实体主键从大宽表匹配相关用户,并为匹配到的用户打上标签。
tip
- 标签导入并为匹配的实例打上标签,是一个异步处理的过程;所以在导入标签后并不意味着打标签成功,需要在导入记录tab页查看标签的导入情况;
- 由于计算资源的限制,当某个自定义标签正在导入时,用户无法再次进行导标签的操作,此时导入标签tab页的确定按钮将不可用。
导入记录
如下图所示,系统支持查看导入标签的操作记录,且可以根据日志排查失败原因。