(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211053556.8
(22)申请日 2022.08.31
(71)申请人 兴业银行股份有限公司
地址 350014 福建省福州市台江区江滨中
大道398号兴业银行 大厦
申请人 兴业数字金融服 务(上海)股份有限
公司
(72)发明人 罗俊 王锋 周飞 罗煜辉 鲍玲
王良杰
(74)专利代理 机构 上海段和段律师事务所
31334
专利代理师 李源
(51)Int.Cl.
G06F 16/2458(2019.01)
(54)发明名称
基于数据血缘的数据任务分析方法、 系统及
介质
(57)摘要
本发明提供一种基于数据血缘的数据任务
分析方法、 系统及介质, 包括: 初始化执行数据任
务时, 任务 分析模块分析数据任务中的数据血缘
关系, 建立数据任务血缘映射关系并保存到数据
任务血缘映射库中; 映射关系展示模块查询数据
任务, 显示数据任务图中关联的数据库、 表、 字
段, 并标记任务与血缘之间的映射情况; 当元数
据信息变更, 执行数据任务时, 任务分析模块比
对当前任务的数据任务血缘映射关系, 并对变更
的内容进行任务血缘变更标记; 再同步变更相关
的数据任务信息, 进行任务血缘变更标记; 映射
关系展示模块展示数据任务信息, 在同一个数据
任务流图中对受到影响的作业进行高亮展示。 本
发明能够解决数据任务在数据血缘变更时需人
工解析影响的问题。
权利要求书3页 说明书6页 附图3页
CN 115470263 A
2022.12.13
CN 115470263 A
1.一种基于数据血缘的数据任务分析 方法, 其特 征在于, 包括:
步骤S1: 初始化执行数据任务 时, 任务分析模块分析数据任务中的数据血缘关系, 同时
建立数据任务血缘映射关系并保存到数据任务血缘映射库中;
步骤S2: 映射关系展示模块从数据任务血缘映射库查询数据任务, 通过数据任务血缘
映射关系显示数据任务图中所有关联的数据库、 表、 字段, 并根据数据任务血缘映射关系标
记任务与血缘之间的映射情况;
步骤S3: 当元数据信息变更, 执行数据任务 时, 任务分析模块在数据任务血缘映射库中
比对当前任务的数据任务血缘映射关系, 并对变更 的内容进行任务血缘变更标记; 再根据
数据血缘关系与数据任务血缘映射关系同步变更相关的数据任务信息, 并进 行任务血缘变
更标记;
步骤S4: 映射关系展示模块根据任务血缘变更标记分类展示数据任务信息, 在同一个
数据任务 流图中对受到影响的作业进行高亮展示。
2.根据权利要求1所述的基于数据血缘的数据任务分析方法, 其特征在于, 所述步骤S1
包括:
输入: 数据任务信息Ti;
输出: 数据任务Ti的血缘映射关系Ri, 数据任务Ti的任务血缘变更 标记;
步骤S1.1: 任务分析模块通过数据任务信息Ti读取任务中包含的所有数据操作集合
Tq;
步骤S1.2: 针对Tq中每一个数据操作, 获取数据血缘关系, 对所有数据操作源端标记
Ts, 数据操作目标端标记Td, 得到数据操作源的库Tsd、 表Tst、 字段Tsc集合Ts={Tsd,Tst,
Tsc}以及数据目标端的库Td d、 表Tdt、 字段Tdc集 合Ts={Td d,Tdt,Tdc};
步骤S1.3: 通过数据任务信息Ti获取数据任务编号Td,将Ts、 Td关联, 得到临时映射关
系Rt={Td,Ts,Td}; 将对数据库D、 表T、 字段C定义标识常量S={D,T,C}展开后结合数据任
务编号Td建立数据任务Ti的血缘映射关系Ri ={S,Ti,Td,Ts};
步骤S1.4: 任务分析模块将血缘映射关系Ri保存到数据任务血缘映射库中。
3.根据权利要求1所述的基于数据血缘的数据任务分析方法, 其特征在于, 所述步骤S3
包括:
输入: 数据任务信息Ti;
输出:
数据任务Ti的血缘映射关系Ri;
数据任务Ti的任务血缘变更 标记集合Rc;
步骤S3.1: 任务分析模块通过数据任务信息Ti获取建立数据任务Ti的血缘映射关系Rn
={S,Ti,Tnd,Tns}, 并从数据任务血缘映射库中获取已存在的数据任务血缘映射关系Ri=
{S,Ti,Tid,Tis};
步骤S3.2: 针对Rn中的每一个源端和目的端进行遍历, 并依照判断加入任务血缘变更
标记集合Rc;
步骤S3.3: 将得到的加入 任务血缘变更 标记集合Rc保存到数据任务血缘映射库中。
4.根据权利要求3所述的基于数据血缘的数据任务分析方法, 其特征在于, 所述步骤
S3.2具体包括:权 利 要 求 书 1/3 页
2
CN 115470263 A
2步骤S3.2.1: 针对Rn中的每一个源端和目的端进行遍历, 若Tnd=Tid, 则判断Tns是否
存在于Ri中, 若不存在, 则定义目的端变更CS并新建任务血缘变更标记项Ri={S,Ti,Tn d,
Tns,CS}, 加入 任务血缘变更 标记集合Rc, 若存在则继续;
步骤S3.2.2: 若Tns=Tis, 则判断Tnd是否存在于Ri中, 若不存在, 则定义源端变更CD新
建任务血缘变更标记项Ri={S,Ti,Tnd,Tns,CD}, 加入任务血缘变更标记集合Rc, 若存在则
继续;
步骤S3.2.3: 若Tnd! =Tid并且Tns! =Tis, 则定义新增数据任务血缘映射关系CN, 新建
任务血缘变更 标记项Ri ={S,Ti,Tnd,Tns,CN}, 加入 任务血缘变更 标记集合Rc。
5.一种基于数据血缘的数据任务分析系统, 其特 征在于, 包括:
模块M1: 初始化执行数据任务 时, 任务分析模块分析数据任务中的数据血缘关系, 同时
建立数据任务血缘映射关系并保存到数据任务血缘映射库中;
模块M2: 映射关系展示模块从数据任务血缘映射库查询数据任务, 通过数据任务血缘
映射关系显示数据任务图中所有关联的数据库、 表、 字段, 并根据数据任务血缘映射关系标
记任务与血缘之间的映射情况;
模块M3: 当元数据信息变更, 执行数据任务 时, 任务分析模块在数据任务血缘映射库中
比对当前任务的数据任务血缘映射关系, 并对变更 的内容进行任务血缘变更标记; 再根据
数据血缘关系与数据任务血缘映射关系同步变更相关的数据任务信息, 并进 行任务血缘变
更标记;
模块M4: 映射关系展示模块根据任务血缘变更标记分类展示数据任务信息, 在同一个
数据任务 流图中对受到影响的作业进行高亮展示。
6.根据权利要求5所述的基于数据血缘的数据任务分析系统, 其特征在于, 所述模块M1
包括:
输入: 数据任务信息Ti;
输出: 数据任务Ti的血缘映射关系Ri, 数据任务Ti的任务血缘变更 标记;
模块M1.1: 任务分析模块通过数据任务信息Ti读取任务中包含的所有数据操作集合
Tq;
模块M1.2: 针对Tq中每一个数据操作, 获取数据血缘关系, 对所有数据操作源端标记
Ts, 数据操作目标端标记Td, 得到数据操作源的库Tsd、 表Tst、 字段Tsc集合Ts={Tsd,Tst,
Tsc}以及数据目标端的库Td d、 表Tdt、 字段Tdc集 合Ts={Td d,Tdt,Tdc};
模块M1.3: 通过数据任务信息Ti获取数据任务编号Td,将Ts、 Td关联, 得到临时映射关
系Rt={Td,Ts,Td}; 将对数据库D、 表T、 字段C定义标识常量S={D,T,C}展开后结合数据任
务编号Td建立数据任务Ti的血缘映射关系Ri ={S,Ti,Td,Ts};
模块M1.4: 任务分析模块将血缘映射关系Ri保存到数据任务血缘映射库中。
7.根据权利要求5所述的基于数据血缘的数据任务分析系统, 其特征在于, 所述模块M3
包括:
输入: 数据任务信息Ti;
输出:
数据任务Ti的血缘映射关系Ri;
数据任务Ti的任务血缘变更 标记集合Rc;权 利 要 求 书 2/3 页
3
CN 115470263 A
3
专利 基于数据血缘的数据任务分析方法、系统及介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:17上传分享