说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211119664.0 (22)申请日 2022.09.14 (71)申请人 广东工业大 学 地址 510090 广东省广州市越秀区东 风东 路729号 (72)发明人 刘德荣 廖礼炉 王永华  (74)专利代理 机构 广州粤高专利商标代理有限 公司 44102 专利代理师 刘俊 (51)Int.Cl. G06F 16/2458(2019.01) G06F 16/2455(2019.01) (54)发明名称 一种基于麻雀搜索算法的时间序列关联规 则挖掘方法 (57)摘要 本发明公开了一种基于麻雀搜索算法的时 间序列关联规则挖掘方法, 包括以下步骤: S1、 从 时间序列中提取时间特征和统计特征, 构建一个 待挖掘的特征数据集; S2、 麻雀位置采用数值属 性与分类属性混合的编码方式, 其中一个麻雀位 置表示一个关联规则; S3、 将置信度、 可理解性、 趣味性作为适应度函数即优化目标; S4、 采用基 于Pareto最优解集的多目标优化方法; S5、 采用 麻雀搜索算法对可行解进行优化, 得到一组 Pareto最优解集, 即一组关联规则。 本方法与传 统技术相比, 能够根据需要提取相应的特征, 构 建新的特征数据集, 并对其进行挖掘, 可将时间 序列关联规则挖掘转换为离散属性和数值属性 混合的关联规则挖掘, 经过优化, 最终得到一组 高质量的关联规则。 权利要求书3页 说明书10页 附图3页 CN 115525692 A 2022.12.27 CN 115525692 A 1.一种基于麻雀搜索算法的时间序列关联规则挖掘方法, 其特 征在于, 包括以下步骤: S1、 从时间序列中提取时间特 征和统计特 征, 构建一个待挖掘的特 征数据集; S2、 麻雀位置采用数值属性与分类属性混合的编码方式, 其中一个麻雀位置表示一个 关联规则; S3、 确定优化目标, 将置信度、 可理解 性和趣味性作为 适应度函数; S4、 采用基于Pareto 最优解集的多目标优化方法; S5、 采用麻雀搜索算法对可行解进行优化, 优化目标是使置信度、 可理解性、 趣味性最 大, 最终可 得到一组Pareto 最优解集, 即一组关联规则。 2.根据权利要求1所述的一种基于麻雀搜索算法的时间序列关联规则挖掘方法, 其特 征在于, 步骤S1 中所述时间特征包括有: 季节、 星期、 时间段、 季度、 节假日和工作日; 将所述 时间特征转换成分类属性, 采用设定的数字表示 不同的分类。 3.根据权利要求2所述的一种基于麻雀搜索算法的时间序列关联规则挖掘方法, 其特 征在于, 所述分类属性包括有: Week={0,1,2,3,4,5,6}                 (1) 其中, Week为创建的一个新属性, 0表示星期日, 1表示星期一, 2表示星期二, 3表示星期 三, 4表示星期四, 5表示星期五, 6表 示星期六; Season为创建的一个新属性, 0表 示春季, 1表 示夏季, 2表 示秋季, 3表示冬季, month为时间序列中的月份; Part为创建的一个新属性, 0表 示黎明、 1表 示早上、 2表 示中午、 3表 示下午、 4表 示晚上、 5表示午夜, hour 为时间序列中的小 时。 4.根据权利要求1所述的一种基于麻雀搜索算法的时间序列关联规则挖掘方法, 其特 征在于, 所述统计特 征包括有: 单位时间内的总和、 均值、 方差、 中值、 最小值、 最大值; 其中, 将所述时间特征和 统计特征合并构建成一个新的待挖掘的特征数据集, 所述特 征数据集既包 含数值属性又包 含分类属性。 5.根据权利要求1所述的一种基于麻雀搜索算法的时间序列关联规则挖掘方法, 其特 征在于, 麻雀位置采用数值属 性与分类属 性混合编码的方式, 即令麻雀位置既含数值属 性 又含分类属性, 其中一个麻雀 位置表示一个 关联规则; 每个所述麻雀 位置包括d维, 其中d是 数据集的属性个数, 所述麻雀位置的每一维包括: 决策位AC、 属性区间下界LB、 属性区间上 界UB; 其中决策位AC的取值为{0,1,2}, 0表示不参与关联规则的组成, 1表示为该关联规则 的前件, 2表示为该关联规则的后件; 对于数值属性, 属性区间下界LB与上界UB表示该属性 的区间范围, 对于分类属性, 属性区间下界LB等于属性区间上界UB。权 利 要 求 书 1/3 页 2 CN 115525692 A 26.根据权利要求1所述的一种基于麻雀搜索算法的时间序列关联规则挖掘方法, 其特 征在于, 步骤S3中所述 适应度函数的数 学表达式, 具体为: Confidence表示置信度, 用于衡量关联规则前件与后件的关联紧密程度, 置信度越大, 则说明前件与后件的紧密程度越 大, 即前件 出现, 那么后件 出现的概率也越 大, 其中SUP(X) 表示包含该关联规则前件的事务数, SUP(XY)表示包 含该关联规则的事务数; Comprehensibility表示可理解性, 用于衡量关联规则所包含的信息的复杂程度, 其 中 A表示关联规则前件的属性个数, B表示关联规则后件的属性个数; Interestingness表示趣味性, 用于衡量关联规则的有趣性, 它由三个概率的乘积组 成, 第一个是基于前件生成规则的概率, 第二个是基于后件生成规则的概率, 第三个是基于 整个数据集 不产生规则的概 率。 7.根据权利要求6所述的一种基于麻雀搜索算法的时间序列关联规则挖掘方法, 其特 征在于, 所述 步骤S4, 其数 学表达方式具体为: 其中, (x)为目标函数, 优化目标是使关联规则的置信度、 可理解性、 趣味性最大; 为可 行解, 为决策空间, 即由数据集构成的关联规则集 合。 8.根据权利要求7所述的一种基于麻雀搜索算法的时间序列关联规则挖掘方法, 其特 征在于, 所述麻雀搜索算法中, 每只麻雀有一个位置属 性, 在D维解空间内每只麻雀的位置 为xi=(x1,x2,…,xD), 适应度值为fi=f(x1,x2,…,xD), 共有3种麻雀, 分别是发现者、 跟随 者、 侦查者。 9.根据权利要求8所述的一种基于麻雀搜索算法的时间序列关联规则挖掘方法, 其特 征在于, 所述3种麻雀的位置更新公式具体为: 式(8)为发现者位置更新公式, 其中 为第t代中第i个个体 的第d维位置, α为[0,1] 中的均匀随机数, Q为一个标准正态分布随机数, R2为[0,1]中的均匀随机数, itermax为最大权 利 要 求 书 2/3 页 3 CN 115525692 A 3

PDF文档 专利 一种基于麻雀搜索算法的时间序列关联规则挖掘方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于麻雀搜索算法的时间序列关联规则挖掘方法 第 1 页 专利 一种基于麻雀搜索算法的时间序列关联规则挖掘方法 第 2 页 专利 一种基于麻雀搜索算法的时间序列关联规则挖掘方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:13上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。