StreamWorks 6.0.1更新日志

发布时间：2023-03-03

背景：之前实时平台的运维都是针对单任务的，缺乏全局性的运维统计和分析能力。并且缺乏对运行中任务的监控分析，因为实时任务一旦运行失败，就会立即对线上数据服务产生影响，我们希望能在任务失败之前，就能发现各种潜在风险。
功能：新增【运维总览】菜单，支持统计项目任务总数、状态分布、类型分布；通过健康分模型，对每个运行中的任务进行健康评分。

背景：之前实时平台的FlinkSQL任务开发，对于Kafka Topic的映射操作非常麻烦，需要用户查询JSON中的每个KEY，配置成Flink表的字段，如果需要做上百个字段的映射，也需要人肉操作。开发往往选择在应用外想办法完成批量映射，再粘贴到平台内，交互比较差。
功能：Kafka Format新增OGG-JSON，支持对这类JSON数据实现一键映射：
- 一键采集线上样例数据，自动完成映射
- 手动输入样例数据，一键完成映射
note
要实现自动映射，前提是后端需要根据固定的模版解析JSON格式。而每类采集工具的JSON格式都有差异，所以需要新增不同的Format去实现该功能。后续我们会陆续新增其他采集工具的JSON格式。

背景：之前实时任务的Checkpoint恢复语义是放在环境参数中配置的（和开源Flink相同），但实际并不生效。因为我们Flink的实现是基于开源改造过的，状态恢复语义需要在任务的结果表中进行semantic参数配置。
功能：调整环境参数中的状态恢复语义提示文案，引导开发至结果表参数中配置。FlinkSQL任务默认为at-least-once（保障实时性）、数据还原任务默认为exactly-once（保障准确性）