说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211203541.5 (22)申请日 2022.09.29 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 余宇航 张彬 刘映楷 张志群 (74)专利代理 机构 北京三友知识产权代理有限 公司 11127 专利代理师 王首峰 (51)Int.Cl. G06F 16/2458(2019.01) G06F 16/248(2019.01) (54)发明名称 数据血缘关系的获取方法和装置 (57)摘要 本发明提供了一种数据血缘关系的获取方 法和装置, 涉及大数据技术领域, 方法包括: 获取 设定时间范围内数据录入端由用户录入的数据 增量信息; 获取设定时间范围内由监管报表报送 端报送的监管报表的报表增量信息; 根据数据增 量信息和报表增量信息计算得到数据录入端和 监管报表报送端之间的数据亲密度; 根据数据亲 密度判断录入数据和报送数据是否存在数据血 缘关系; 将数据血缘关系与扫描后台加工处理端 加工代码得到的血缘关系结果进行整合后形成 完整的数据血缘图示。 本申请通过在数据录入端 和监管报表报送端获取数据并分析血缘关系, 可 以突破通过扫描代码方式的壁垒, 能够获取到跨 系统的数据血缘, 可以补充通过代码扫描无法获 取的数据血缘关系。 权利要求书2页 说明书8页 附图4页 CN 115525694 A 2022.12.27 CN 115525694 A 1.一种数据血缘关系的获取 方法, 其特 征在于, 所述方法包括: 获取设定时间范围内数据录入端由用户录入的数据增量信息; 获取所述设定时间范围内由监管报表报送端报送的监管报表的报表增量信息; 根据所述数据增量信息和所述报表增量信息计算得到数据录入端和监管报表报送端 之间的数据亲密度; 根据所述数据亲密度判断数据录入端的录入数据和监管报表报送端的报送数据是否 存在数据血缘关系; 将所述数据血缘关系与扫描后台加工处理端加工代码得到的血缘关系结果进行整合 后形成完整的数据血缘图示。 2.如权利要求1所述的数据血缘关系的获取方法, 其特征在于, 所述获取设定时间范围 内数据录入端由用户录入的数据增量信息包括: 设定指定扫描的数据录入端的录入数据表参数, 所述录入数据表参数包括表名、 时间 戳字段以及扫描周期; 根据设定的所述录入数据表参数扫描设定时间范围内数据录入端数据表中的数据; 获得设定时间范围内数据录入端由用户录入的数据增量信息 。 3.如权利要求1所述的数据血缘关系的获取方法, 其特征在于, 所述获取所述设定时间 范围内由监管报表报送端报送的监管报表的报表增量信息包括: 设定指定扫描的监管报表报送端的报送数据表参数, 所述报送数据表参数包括表名、 报送日期、 报送时间 间隔和统计方式; 根据所述报送数据表参数扫描设定时间范围内本期监管报表数据及上期监管报表数 据; 将所述本期监管报表数据与所述上期监管报表数据的差值作为监管报表的报表增量 信息。 4.如权利要求1所述的数据血缘关系的获取方法, 其特征在于, 根据所述数据增量信 息 和所述报表增量信息计算得到数据录入端和监管报表报送端之间的数据亲密度包括: 根据评分规则对所述数据增量信息和所述报表增量信息进行评分; 根据评分结果得到数据录入端和监管报表报送端之间的数据亲密度。 5.如权利要求4所述的数据血缘关系的获取方法, 其特征在于, 根据所述数据 亲密度判 断数据录入端的录入数据和监管报表报送端的报送数据是否存在数据血缘关系包括: 利用 数据血缘关系模型及所述评分结果判断数据录入端的录入数据和 监管报表报送端的报送 数据是否存在数据血缘关系, 所述数据血缘关系模型是通过历史数据的事实血缘关系建立 的评分与实际数据血缘关系的模型。 6.如权利要求5所述的数据血缘关系的获取方法, 其特征在于, 所述利用数据 血缘关系 模型及所述评分结果判断数据录入端的录入数据和 监管报表报送端的报送数据是否存在 数据血缘关系包括: 根据代码扫描确定的明确有数据血缘关系的历史数据字段, 计算所述历史数据字段的 分数期望值及方差得到数据血缘关系评分的置信区间; 通过置信区间得到样本平均值和期望值; 通过期望值判断数据录入端的录入数据和监管报表报送端的报送数据存在数据血缘权 利 要 求 书 1/2 页 2 CN 115525694 A 2关系的概 率。 7.一种数据血缘关系的获取装置, 其特 征在于, 所述装置包括: 录入数据获取单元, 用于获取设定时间范围内数据录入端由用户录入的数据增量信 息; 报送数据获取单元, 用于获取所述设定时间范围内由监管报表报送端报送的监管报表 的报表增量信息; 亲密度计算单元, 用于根据 所述数据增量信 息和所述报表增量信 息计算得到数据录入 端和监管报表报送端之间的数据亲密度; 血缘关系判断单元, 用于根据 所述数据亲密度判断数据录入端的录入数据和监管报表 报送端的报送数据是否存在数据血缘关系; 整合展示单元, 用于将所述数据血缘关系与扫描后台加工处理端加工代码得到的血缘 关系结果进行整合后形成完整的数据血缘图示。 8.一种电子设备, 包括存储器、 处理器以及存储在所述存储器上并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至6任 一项所述方法的步骤。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被 处理器执行时实现权利要求1至 6任一项所述方法的步骤。 10.一种计算机程序产品, 包括计算机程序/指令, 其特征在于, 所述计算机程序/指令 被处理器执行时实现权利要求1至 6任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 115525694 A 3
专利 数据血缘关系的获取方法和装置
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:34:08
上传分享
举报
下载
原文档
(748.3 KB)
分享
友情链接
SN-T 4764-2017 煤中碳、氢、氮、硫含量的测定 元素分析仪法.pdf
T-ZAII 008—2018 环保渣土车管理终端.pdf
GM-T 0108-2021 诱骗态BB84量子密钥分配产品技术规范.pdf
MZ-T 158-2020 固定在座便器上的助力扶手.pdf
GB-T 5153-2016 变形镁及镁合金牌号和化学成分.pdf
华为液冷超充解决方案及专家交流纪要-2023-10-新能源.pdf
GB-T 9359-2016 水文仪器基本环境试验条件及方法.pdf
GB-T 2386-2014 染料及染料中间体 水分的测定.pdf
DB14-T 281-2021 水泵装置节能技术导则 山西省.pdf
T-ZZB 1671—2020 竹木纤维装饰板.pdf
CY-T 121-2015 学术出版规范 注释.pdf
GB-T 36572-2018电力监控系统网络安全防护导则.pdf
GB-T 43806-2024 资产管理系统通用技术要求.pdf
奇安信 中国实战化白帽人才能力白皮书.pdf
GB-T 479-2016 烟煤胶质层指数测定方法.pdf
2022攻防演练木马专项分析报告-微步在线.pdf
5-02-01-02 造林更新工.pdf
NB-T 10205-2019 风电功率预测技术规定.pdf
山石网科《岩谈》第五期-2022年4月(数据安全专刊).pdf
GB-T 20011-2005 信息安全技术 路由器安全评估准则.pdf
交流群
-->
1
/
15
评价文档
赞助2元 点击下载(748.3 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。