说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211146160.8 (22)申请日 2022.09.20 (71)申请人 中国建设银行股份有限公司 地址 100033 北京市西城区金融大街25号 申请人 建信金融科技有限责任公司 (72)发明人 刘恒宇  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 贺迎辉 (51)Int.Cl. G06F 16/2458(2019.01) G06Q 40/06(2012.01) (54)发明名称 一种数据处理的方法、 装置、 存储介质及计 算机程序 产品 (57)摘要 本发明公开了一种数据处理的方法、 装置、 存储介质及计算机程序产品, 涉及机器学习技术 领域, 该方法包括: 获取每个投资理财产品中与 投资集中度相关的关联数据集; 对关联数据集进 行归一化处理, 并用每个投资理财产品中每个业 务所属业务品种上次使用的预测模 型, 根据对应 投资理财产品归一化处理后的关联数据集预测 当前对应投资理财产品中各业务投资集中度的 第一预警阈值; 预设模型是基于集成学习投票算 法训练得到的; 根据每个投资理财产品中所有业 务的第一预警阈值及资产管理机构中不同投资 层级对应的权重, 构建资产管 理体系的多层投资 预警体系; 用多层投资预警体系, 对不同层级对 应的投资集中度进行 预警。 权利要求书3页 说明书14页 附图3页 CN 115481171 A 2022.12.16 CN 115481171 A 1.一种数据处 理的方法, 其特 征在于, 包括: 获取资产管理机构管理的每 个投资理财产品中与投资集中度相关的关联 数据集; 对所述关联数据集进行归一化处理, 并用每个投资理财产品中每个业务所属业务品种 上次使用的预测模型, 根据对应投资理财产品归一化处理后的关联数据集预测当前对应投 资理财产品中各业务投资集中度的第一预警阈值; 其中, 预设模型是基于集成学习投票算 法训练得到的; 根据每个投资理财产品中所有业务的第一预警阈值及所述资产管理机构中不同投资 层级对应的权重, 构建所述资产管理体系的多层投资预警体系; 其中, 所述第一预警 阈值对 应所述多层投资预警体系的底层预警; 用所述多层投资预警体系, 对所述资产管理机构中不同层级对应的投资集中度进行预 警。 2.如权利要求1所述的方法, 其特征在于, 获取资产 管理机构管理 的每个投资理财产品 中与投资集中度相关的关联 数据集, 包括: 采集所述资产 管理机构中每个投资理财产品对应的投资交易流水数据; 并按所述业务 品种, 从所述投资交易 流水数据中提取每 个业务品种对应的投资交易特 征数据; 采集每个投资理财产品的产品基础信息; 采集所述每 个投资理财产品中单一 业务品种的集中度占比数据; 采集每个业务品种的监管 条款数据; 采集同业发布的资产比例数据; 将所述投资交易特征数据、 所述监管条款数据、 所述产品基础信 息、 所述集中度占比数 据、 所述同业发布的资产比例数据, 构建为所述关联 数据集。 3.如权利要求2所述的方法, 其特 征在于, 对所述关联 数据集进行归一 化处理, 包括: 按所述业务品种 包含的投资交易特征, 构建成由所述业务品种 包含的所有投资交易特 征的数据组成的一维数组, 并作为第一数据集; 将所述每 个投资理财产品的各业 务品种的资产估值占比构建为第二数据集; 将所述每个投资理财产品的产品类型与对应的监管数据构建为由二维数组组成的第 三数据集; 将所述每个投资理财产品对应的同业发布的资产占比数据, 作为对应投资理财产品的 预测模型的参 考影响因子, 构建为第四数据集; 对所述第 一数据集、 所述第 二数据集、 所述第 三数据集、 所述第四数据集分别进行归一 化处理; 将归一化后的第 一数据集、 归一化后的第二数据集、 归一化后的第三数据集、 归一化后 的第四数据集分别与对应的预设参考权重进行积运算, 得到归一化处理后的第一数据集、 归一化处理后的第二数据集、 归一 化处理后的第三数据集、 归一 化处理后的第四数据集。 4.如权利要求1所述的方法, 其特 征在于, 所述预测模型的获得 方式, 包括: 获取所述业务品种的历史关联 数据集; 对所述历史关联 数据集进行归一 化处理; 将归一化处理后的历史关联 数据集, 按预设比例分为训练集和验证集; 用训练集对由集成学习投票算法构建的分类业务预警模型进行训练, 并用验证集对训权 利 要 求 书 1/3 页 2 CN 115481171 A 2练后的分类业务预警模型进行验证, 直至训练后的分类业务预警模型预测对应业务品种的 集中度预警阈值的准确率达 到设定值, 获得 所述业务品种的训练好的预测模型。 5.如权利要求1 ‑4任一项所述的方法, 其特征在于, 根据所有业务品种的第 一预警阈值 及所述资产管理机构中不同投资层级对应的权重, 构建所述资产管理体系的多层投资预警 体系, 包括: 根据所述每个投资理财产品中各业务的第一预警阈值及每个投资理财产品中每个业 务品种的频率权 重, 确定每 个投资理财产品的投资集中度的第二预警阈值; 根据所述每个投资理财产品的第二预警阈值及资产管理机构中各投资理财产品的规 模权重, 确定所述资产管理机构的投资集中度的第三预警阈值; 根据所述第一预警阈值、 第二预警阈值、 第三预警阈值, 构建所述多层投资预警体系。 6.如权利要求5所述的方法, 其特征在于, 用所述多层投资预警体系, 对所述资产管理 机构中不同层级对应的投资集中度进行 预警之后, 还 包括: 获取使用所述多层预警体系期间产生的关联 数据集; 对使用所述多层预警体系后产生的关联数据集进行关联性分析, 获得与所述多层预警 体系触发告警的告警关联 数据集正相关且未触发告警的未告警关联 数据集; 用所述已告警关联数据集, 及所述未触告警关联数据集, 对所述上次使用的预测模型 进行迭代训练, 获得迭代后的预测模型, 并更新第一预警阈值、 第二预警阈值、 第三预警阈 值。 7.如权利要求6所述的方法, 其特征在于, 对使用所述多层预警体系期间产生的关联数 据集进行关联性分析, 获取与所述多层预警体系触发告警的告警关联数据集正相关且未触 发告警的未告警关联 数据集, 包括: 将使用所述多层预警体系期间产生的关联数据集为已告警关联数据集和未告警数据 集; 计算所述已告警数据集中已告警关联数据与所述未告警数据集中未告警关联数据之 间的余弦相似度; 将余弦相似度大于设定阈值对应的未告警关联数据作为对应已告警关联数据的正相 关数据; 将所有正相关数据组成的集 合确定为所述未告警关联 数据集。 8.一种数据处 理的装置, 其特 征在于, 包括: 获取单元, 用于获取资产管理机构管理的每个投资理财产品中与投资集中度相关的关 联数据集; 处理单元, 用于对所述关联数据集进行归一化处理, 并用每个投资理财产品中每个业 务所属业务品种上次使用的预测模型, 根据对应投资理财产品归一化处理后的关联数据集 预测当前对应投资理财产品中各业务投资集中度的第一预警阈值; 其中, 预设模型是基于 集成学习投票 算法训练得到的; 构建单元, 用于根据每个投资理财产品中所有业务的第 一预警阈值及所述资产 管理机 构中不同投资层级对应的权重, 构建所述资产管 理体系的多层投资预警体系; 其中, 所述第 一预警阈值对应所述多层投资预警体系的底层预警; 预警单元, 用于用所述多层投资预警体系, 对所述资产管理机构中不同层级对应的投权 利 要 求 书 2/3 页 3 CN 115481171 A 3

PDF文档 专利 一种数据处理的方法、装置、存储介质及计算机程序产品

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据处理的方法、装置、存储介质及计算机程序产品 第 1 页 专利 一种数据处理的方法、装置、存储介质及计算机程序产品 第 2 页 专利 一种数据处理的方法、装置、存储介质及计算机程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:11上传分享
交流群
  • //public.wenku.github5.com/wodemyapi/22.png
-->
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。