说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211177944.7 (22)申请日 2022.09.26 (71)申请人 贵州医科 大学 地址 550025 贵州省贵阳市花溪区花溪大 学城栋青路2号 (72)发明人 李秋德 吉胜芬 余洋 胡思贵  熊庆宇  (74)专利代理 机构 重庆西南 华渝专利代理有限 公司 50270 专利代理师 陈香兰 (51)Int.Cl. G06F 16/25(2019.01) G06F 16/28(2019.01) G06F 16/2458(2019.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于多视图深度度量学习的混合属性 数据转换方法 (57)摘要 本发明提供了一种基于多视图深度度量学 习的混合属性数据转换方法, 包括: 获取包括至 少一个待转换样本的待转换样 本集, 将待转换样 本集输入预先训练好的多视图深度度量学习模 型获得待转换样本集的转换结果, 多视图深度度 量学习模型包括: 多视图信息提取模块, 提取待 转换样本集的属性内耦合视图、 属性间耦合视图 和属性对类耦合视图; 深度度量模块, 将属性内 耦合视图、 属性间耦合视图和属性对类耦合视图 映射为相应的数值向量; 融合模块, 将多个视图 的数值向量与待转换样本集的数值属性数据融 合。 能全面挖掘分类属性数据的本质特征, 保持 数据转换前后数据分布一致, 将混合属性数据上 的分类属性数据无损地表示为高质量的数值向 量。 权利要求书4页 说明书10页 附图2页 CN 115544137 A 2022.12.30 CN 115544137 A 1.一种基于多视图深度 度量学习的混合属性数据转换 方法, 其特 征在于, 包括: 获取包括至少一个待转换样本的待转换样本集, 待转换样本包括数值属性数据和分类 属性数据; 将待转换样本集输入预先训练好的多视图深度度量学习模型获得待转换样本集的转 换结果, 所述多视图深度 度量学习模型包括: 多视图信 息提取模块, 基于待转换样本集的分类属性数据提取待转换样本集的属性内 耦合视图、 属性间耦合视图和 属性对类耦合视图; 深度度量模块, 将待转换样本集的属性内耦合视 图、 属性间耦合视 图和属性对类耦合 视图分别映射 为相应的数值向量; 融合模块, 将待转换样本集的属性内耦合视 图、 属性间耦合视 图和属性对类耦合视 图 映射的数值向量与待转换样本集的数值属性数据融合, 将融合结果作为待转换样本集的转 换结果。 2.如权利要求1所述的基于多视图深度度量学习的混合属性数据转换方法, 其特征在 于, 获取待转换样本集之后, 还 包括对待转换样本集进行 预处理的步骤。 3.如权利要求1所述的基于多视图深度度量学习的混合属性数据转换方法, 其特征在 于, 所述多视图信息提取模块通过待转换样本集分类属性数据中分类属性的分类值的后验 频率和OneHot编码共同提取属性内耦合视图; 所述多视 图信息提取模块通过待转换样本集分类属性数据中不同分类属性之间的条 件交互信息提取属性间耦合视图; 所述多视 图信息提取模块通过待转换样本集分类属性数据中属性与类标签的相互作 用提取属性对类耦合视图。 4.如权利要求1或2或3所述的基于多视 图深度度量学习的混合属性数据转换方法, 其 特征在于, 待转换样本集的属性内耦合视图表示 为: 其中, n(o)表示待转换样本集中待转换样本的数量; n (a)表示待转换样本集的分类属性维数, j表示分类属性索引, j∈[1, n(a)], 表示第j维分 类属性下包含的分类值数量 ; 表示第j维分类属性的 属性内耦合扩展矩阵 表示待转换样 本集中第j维分类属性的分类值集合, fIa(xj, *)表 示第j维分类属性的属性内耦合扩展向量集合; 设i ′表示第j维分类属性下分类值的索引, 则第j维分类属性下第i ′个分类值xj , i′的属性内耦合扩展向量为: ppost(xj, i′)表示第j维分类属性下第i ′个分类值 xj, i′的后验频率。 5.如权利要求1或2或3所述的基于多视 图深度度量学习的混合属性数据转换方法, 其 特征在于, 待转换样本集的属性间耦合视图表示 为: 其中, n(o)表示待转换样本集中待转换样本的数量; n(a)表示待转换样本集的分类属性权 利 要 求 书 1/4 页 2 CN 115544137 A 2维数, j表示分类属性索引, j∈[1, n(a)], 表示表示第k维分类属性下包含的分类值数量, k∈[1, n(a)], j≠k, 表示第j维分类属性之外的所有分类属性包含的分类值总数 量; 表示第j维分类属性的属性间耦合扩展矩阵: 表示待 转换样本集中第j维分类属性的分类值集合, fIe(xj, *)表示第j维分类属性的属性间耦合扩 展向量集合; 设i ′表示第j维分类属性下分类值的索引, 则第j维分类属性下第i ′ 个分类值xj, i′的属性间耦合扩展向量为: Ak表示第k维属性下的 分类值集合, xk, i″∈Ak, p(xj, i′|xk, i″)表示xj, i′在 第k维属性的第i ″个分类值 为xk, i″的条件下的条件概 率。 6.如权利要求1或2或3所述的基于多视 图深度度量学习的混合属性数据转换方法, 其 特征在于, 待转换样本集的属性对类耦合视图表示 为: 其中, n(o)表示待转换样本集中待转换样本的数量; n(a)表示待转换样本集的分类属性 维数, j表示分类属性索引, j∈[1, n(a)], n(c)表示分类标签数量; 表示第j维分类属性的 属性对类耦合扩展矩阵: 表示待转换样本集中第j维分类属性的 分类值集合, fAC(xj, *)表示第j维分类属性的属性对 类耦合扩展向量集合, 设i ′表示第j维分 类属性下分类值的索引, 则第j维分类属性下第i ′个分类值xj, i′的属性对类耦合 扩展向量为: p(ci″|xj, i′)表示第 i″ ′个类标签ci″ ′在xj, i′条件下的条件概 率。 7.如权利要求1或2或3所述的基于多视 图深度度量学习的混合属性数据转换方法, 其 特征在于, 所述多视图深度 度量学习模型的建立过程包括: 步骤S1, 获取混合属性的训练样本集, 训练样本包括数值属性数据和分类属性数据; 步骤S2, 构建多视图深度度量学习模型的多视图信息提取模块和深度度量模块, 多视 图信息提取模块基于训练样本集的分类属性数据获取训练样本集的属性内耦合视图、 属性 间耦合视图和属 性对类耦合视图, 所述深度度量模块包括三个深度学习子模型, 三个深度 学习子模型分别用于将属性内耦合视图、 属性间耦合视图和属性对类耦合视图映射为各自 对应的数值向量; 构建度量学习模块, 用于为深度学习子模型设置损失函数并优化深度 学习子模型的网 络参数; 构建多视图融合学习模块, 用于建立目标损失函数, 基于HISC依赖准则对三个深度学 习子模型进行多视图学习并优化深度学习子模型的网络参数; 步骤S3, 利用训练样本数据集联合度量学习模块和多视图融合学习模块对多视图深度 度量学习模型进行迭代学习直到 达到迭代停止条件。 8.如权利要求7所述的基于多视图深度度量学习的混合属性数据转换方法, 其特征在 于, 所述步骤S3包括: 步骤S31, 将训练样本集输入多视图信息提取模块获得训练样本集的属性内耦合视图、权 利 要 求 书 2/4 页 3 CN 115544137 A 3

PDF文档 专利 一种基于多视图深度度量学习的混合属性数据转换方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多视图深度度量学习的混合属性数据转换方法 第 1 页 专利 一种基于多视图深度度量学习的混合属性数据转换方法 第 2 页 专利 一种基于多视图深度度量学习的混合属性数据转换方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:09上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。