说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211078035.8 (22)申请日 2022.09.02 (71)申请人 国网青海省电力公司海西供电公司 地址 816099 青海省海西蒙古族藏族自治 州格尔木市黄河中路80号 申请人 国网青海省电力公司   国家电网有限公司 (72)发明人 张艳霞 刘占双 史杰 于林林  薛琴 卓钊 王翰雯  (74)专利代理 机构 西宁工道知识产权代理事务 所(普通合伙) 63102 专利代理师 沈耀忠 (51)Int.Cl. G06K 9/62(2022.01) G06F 16/2458(2019.01)G06F 16/28(2019.01) (54)发明名称 一种基于数据驱动 的用户窃电行为检测辅 助方法 (57)摘要 一种基于数据驱动 的用户窃电行为检测辅 助方法, 涉及窃电行为检测技术领域, 基于AMI (高级量测体系)获取用户历史用电量数据, 展 开 窃电检测,其包括以下几个方面: 数据获取、 数据 预处理、 用户用电特征提取、 窃电检测、 低压配电 网线损率研究五个部分。 本发明的有益效果在 于: 开发基于数据驱动的用户窃电行为检测软 件, 实现对用户是否窃电、 窃电时间、 地点、 严重 程度及窃电类型的准确判别预警, 统计 疑似窃电 的开始时间和异常累计用电量, 为锁定窃电行为 提供依据。 权利要求书3页 说明书13页 附图7页 CN 115409120 A 2022.11.29 CN 115409120 A 1.一种基于数据驱动的用户窃电行为检测辅助方法, 其特征在于: 基于AMI(高级量测 体系)获取用户历史用电量数据, 窃电检测,其包括以下几个方面: 数据获取、 数据预处理、 低压配电网线损率、 用户用电特 征提取、 窃电检测五个步骤; 第一步: 数据获取: 用户窃电行为直接反映到智能电表终端的读数中, 因此获取一定时 间跨度的待检测用户用电数据, 窃电检测使用用户用电量数据和用户负荷数据进行, 采样 间隔30分钟、 1小时即可满足需求, 时间跨度为用户1年的用电记录; 同时, 也应获取专变相 应时间跨度内的一系列数据, 以应对各种窃电手段; 第二步: 数据预处理: 根据获取数据情况, 指定相应的数据预处理方案, 对数据进行规 整, 清洗工作; 数据质量的影响后续窃电检测的结果, 不同数据质量问题具有 各自的处理方 法, 具有高耦合度; 第三步: 低压配电网线损率: 根据搜集获取的数据类型, 对所辖区域内低压台区配电网 的线损率进行研究分析, 挖掘线损率高的线路信息; 高线损率线路中可疑窃电用户优先进 行排查; 第四步: 用户用电特征提取: 挖掘能够 反映用户用电行为的一系列特征, 采取数据 科学 中特征工程的一系列方法, 以用户为单位, 从用户用电数据集中获取能够反映用户用电行 为的一系列特 征; 第五步: 窃电检测: 采用机器学习算法, 以用户为单位对用电特征进行异常监测分析, 挖掘用户异常用电行为, 对各个用户异常用电天数进 行统计, 输出用户窃电概率, 辅助工作 人员进行筛查。 2.根据权利要求1所述的一种基于数据驱动的用户窃电行为检测辅助方法, 其特征在 于, 步骤一: 经过实际调研获取用于后续分析的数据源, 建立数据获取更新渠道, 采用分布 式存储, 构架底层架构; 步骤二: 采用数据仓库技术, 整合分布式存储中多个数据源, 在此过程中, 需要根据数 据实际情况, 制定个性化数据处理方案, 将原始数据中的异常、 重复、 缺 失数据过滤后, 汇总 到数据仓库中; 步骤三: 将机器学习中的算法运用到电力行业大数据中, 以所辖区域内用电用户为单 位进行数据挖掘, 实现用户用电行为特 征提取、 窃电行为检测的过程, 步骤四: 基于已有的海量数据, 对所辖区域内低压配电网线路线损率展开研究分析, 对 于高线损率线路中的高怀疑窃电用户优先进行稽查, 同时研究其 他潜在窃电方式; 步骤五: 选取典型台区进行实验分析, 基于窃电检测结果, 辅助电网工作人员实地稽 查, 验证平台对窃电行为检测的准确度。 3.根据权利要求1所述的一种基于数据驱动的用户窃电行为检测辅助方法, 其特征在 于, Hadoop使用J ava编写, 允许分布在集群, 使用简单的编程模 型的计算机大型数据集处理 的Apache的开源框架, Hadoop框架应用工程提供跨计算机集群的分布式存储和计算的环 境, Hadoop是为从单一服务器到上千台机器扩展, 每个机器都可以提供本地计算和存储, Hadoop主要有两个层次包括分布式文件系统, 并行编程模型, 即: 加工/计算层 (MapReduce), 以及存 储层。 4.根据权利要求1所述的一种基于数据驱动的用户窃电行为检测辅助方法, 其特征在 于, MapReduce是一种处理海量数据的分布式计算模型框架, 用于对大规模数据的并行计权 利 要 求 书 1/3 页 2 CN 115409120 A 2算,HBase是Hadoop的数据库, 能够对 大型数据提供随机、 实时的读写访问,包括管理, 协调, 编辑语言, 计算, 表存储和对象存储; 编辑语 言包括数据流和类SQL; 计算包括分布式程序框 架; 表存储包括元数据和列存 储; 对象存 储包括分布式文件系统。 5.根据权利要求1所述的一种基于数据驱动的用户窃电行为检测辅助方法, 其特征在 于, 最适合聚类的降维算法, 其是将高维数据看作高维空间中的点xi用流性方法将其映射 至低维空间中的点yi, 将数据之间的欧氏距离转化为条件概率, 故t ‑SNE算法在降维之后, 可以很好 地保留原 始数据之间的相对距离, 高维数据: xi与xj的相似度为条件概 率pij, 低维数据: yi与yj的相似度为条件概 率qij; 损失函数: 为了保持映射前后数据在空间中的相对关系, 即高维空间中相对较远的点 在映射至低维空间中依然较 远, 用KL散度反应两者分布的正关系; 其中, 用正态分布表示高维空间中点与点的关系, 即当xi与xj很近时, pij越大; 当两者很 远时, pij越小, 而用t分布表示低维空 间中点与点的关系, t分布根据小样本估 计呈正态分布 且方差未知的总体均值, t分布与正态分布曲线上非常接近, 但与其自由度的大小有关, 自 由度越小, t分布曲线越平坦、 中间低、 两侧尾部略高, 自由度越大, t分布曲线越接近正态分 布, 当自由度接 近无限时, t分布为标准 正态分布。 6.根据权利要求1所述的一种基于数据驱动的用户窃电行为检测辅助方法, 其特征在 于, 当数据量上升到一定的程度时, 如超过5万条, 则大部分算法不适用, 仅K ‑means与 HDBScan效果更佳, 首先, 优先尝试HDBScan, 若无法降维或者降低数量时, 再使用K ‑Means, 如果多次运行K ‑Means发现每次的分类结果具有极大的差异性, 大概率是K ‑Means不适用于 当前数据。 7.根据权利要求1所述的一种基于数据驱动的用户窃电行为检测辅助方法, 其特征在 于, 另一种替代方法是对原始数据进行多次随机采样形成小样本集合, 并对小样本进行聚 类, 并且融合结果, 其中, 随机采样样本大小的选取必须有足够的代表性; 在分类结果融合 的过程中, 需要关注聚类结果的稳定性, 随机数据是否合理,权 利 要 求 书 2/3 页 3 CN 115409120 A 3

PDF文档 专利 一种基于数据驱动的用户窃电行为检测辅助方法

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于数据驱动的用户窃电行为检测辅助方法 第 1 页 专利 一种基于数据驱动的用户窃电行为检测辅助方法 第 2 页 专利 一种基于数据驱动的用户窃电行为检测辅助方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。