说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211108909.X (22)申请日 2022.09.13 (71)申请人 税友软件集团股份有限公司 地址 310053 浙江省杭州市滨江区浦沿街 道南环路3738号 (72)发明人 罗贤哲 徐煌 刘子星 丁乐  计春龙 王伟  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 姚莹丽 (51)Int.Cl. G06F 16/2457(2019.01) G06F 16/2458(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种企业投入产出异常识别系统、 方法、 设 备及介质 (57)摘要 本申请公开了一种企业投入产出异常识别 系统、 方法、 设备及介质, 该系统包括: 数据提取 模块, 用于从待识别企业的发票数据提取待识别 企业的第一投入 数据和第一产出数据; 特征提取 模块, 用于分别提取第一投入数据和第一产出数 据的特征以得到第一投入数据特征和第一产出 数据特征; 类别确定模块, 用于确定待识别企业 在所属行业中的工艺类别以得到目标工艺类别; 模型输出模块, 用于将第一投入 数据特征输入目 标工艺类别对应的训练后神经网络模 型, 得到模 型输出结果; 异常识别模块, 用于基于模型输出 结果和第一产出数据特征识别出待识别企业的 投入产出是否存在异常。 能够提升企业投入产出 异常识别的准确度和效率。 权利要求书2页 说明书9页 附图4页 CN 115470253 A 2022.12.13 CN 115470253 A 1.一种企业投入产出异常识别系统, 其特 征在于, 包括: 数据提取模块, 用于从待识别企业的发票数据提取所述待识别企业的第 一投入数据和 第一产出 数据; 特征提取模块, 用于分别提取所述第 一投入数据和所述第 一产出数据的特征以得到第 一投入数据特 征和第一产出 数据特征; 类别确定模块, 用于确定所述待识别企业在所属行业中的工艺类别以得到目标工艺类 别; 模型输出模块, 用于将所述第 一投入数据 特征输入所述目标工艺类别对应的训练后神 经网络模型, 得到模型输出结果; 该训练后神经网络模型为利用所述 目标工艺类别的投入 数据特征样本及投入数据特征样本对应的标签训练得到的模型, 所述标签为所述投入数据 特征样本对应的产出 数据特征; 异常识别模块, 用于基于所述模型输出结果和所述第 一产出数据特征识别出所述待识 别企业的投入产出 是否存在异常。 2.根据权利要求1所述的企业投入产出异常识别系统, 其特征在于, 所述特征提取模 块, 包括: 商品类别获取子模块, 用于获取 所述待识别企业所属行业对应的各商品类别; 第一特征提取子模块, 用于基于所述各商品类别分别提取所述第 一投入数据和所述第 一产出数据的特 征以得到第一投入数据特 征和第一产出 数据特征; 其中, 所述第一投入数据特征和所述第一产出数据特征均为特征向量, 特征向量中的 元素为所述各商品类别中每 个商品类别下的总商品金额。 3.根据权利要求2所述的企业投入产 出异常识别系统, 其特征在于, 所述商 品类别获取 子模块, 包括: 发票数据获取单元, 用于获取待识别企业所属行业的多个企业的企业发票数据; 所述 企业发票数据包括第二投入数据和 第二产出数据, 第二投入数据包括购入商品名称以及每 个购入商品名称对应的商品金额、 第二产出数据包括售出商品名称以及每个售出商品名称 对应的商品金额; 排序单元, 用于对所有购入商 品名称对应的商 品金额以及所有售出商品名称对应的商 品金额进行排序, 得到排序结果; 核心商品确定单元, 用于基于所述排序结果筛选出最高的预设数量个商品金额, 并将 所述预设数量个商品金额对应的商品确定为核心商品; 商品归类单元, 用于基于所述核心商 品的商品编码对所述核心商 品进行归类以得到各 归类类别, 并将非核心商品的类别均确定为非核心商品类别; 各商品类别确定单元, 用于将所述各归类类别以及所述非核心商 品类别确定为该行业 的各商品类别。 4.根据权利要求3所述的企业投入产出异常识别系统, 其特征在于, 所述类别确定模 块, 包括: 第一特征拼接子模块, 用于将所述第一投入数据特征和第一产出数据特征拼接, 得到 目标拼接特 征; 类别确定子模块, 用于计算所述目标拼接特征与聚类产生的各簇的聚类中心之间的距权 利 要 求 书 1/2 页 2 CN 115470253 A 2离, 并将距离最近的簇对应的工艺类别确定为所述目标工艺类别; 其中, 所述各簇中每个簇 对应一个工艺类别。 5.根据权利要求4所述的企业投入产出异常识别系统, 其特征在于, 还包括聚类模块, 所述聚类模块包括: 第二特征提取子模块, 用于基于各商品类别分别提取多个企业的企业发票数据的特 征, 得到每个企业的第二投入数据和 第二产出数据对应的第二投入数据特征和 第二产出数 据特征; 所述多个企业均为待识别企业所属行业的企业; 第二特征拼接子模块, 用于对于任意企业, 拼接该企业的所述第二投入数据特征和第 二产出数据特征, 得到拼接特 征; 聚类子模块, 用于对所述多个企业的所述 拼接特征进行聚类, 得到多个簇 。 6.根据权利要求5所述的企业投入产出异常识别系统, 其特征在于, 所述聚类子模块, 具体用于: 基于K‑means算法对多个企业的所述 拼接特征进行聚类, 得到多个簇 。 7.根据权利要求5所述的企业投入产出异常识别系统, 其特 征在于, 还 包括: 模型训练模块, 用于对于任意工艺类别, 将该工艺类别 中每个企业的所述第二投入数 据特征作为投入数据特征样 本, 该企业的第二产出数据特征作为标签, 得到训练数据集, 并 利用该训练数据集对初始模型进行训练, 得到该工艺类别对应的训练后神经网络模型。 8.一种企业投入产出异常识别方法, 其特 征在于, 包括: 从待识别企业的发票数据提取 所述待识别企业的第一投入数据和第一产出 数据; 分别提取所述第一投入数据和所述第一产出数据的特征以得到第一投入数据特征和 第一产出 数据特征; 确定所述待识别企业在所属行业中的工艺类别以得到目标工艺类别; 将所述第一投入数据 特征输入所述目标工艺类别对应的训练后神经网络模型, 得到模 型输出结果; 该训练后神经网络模型为利用所述目标工艺类别的投入数据特征样本及所述 投入数据特征样本对应的标签训练得到的模型, 所述标签为所述投入数据特征样本对应的 产出数据特征; 基于所述模型输出结果和所述第一产出数据特征识别出所述待识别企业的投入产出 是否存在异常。 9.一种电子设备, 其特 征在于, 包括存 储器和处 理器, 其中: 所述存储器, 用于保存计算机程序; 所述处理器, 用于执行所述计算机程序, 以实现如权利要求8所述的企业投入产 出异常 识别方法。 10.一种计算机可读存储介质, 其特征在于, 用于保存计算机程序, 其中, 所述计算机程 序被处理器执行时实现如权利要求8所述的企业投入产出异常识别方法。权 利 要 求 书 2/2 页 3 CN 115470253 A 3

PDF文档 专利 一种企业投入产出异常识别系统、方法、设备及介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种企业投入产出异常识别系统、方法、设备及介质 第 1 页 专利 一种企业投入产出异常识别系统、方法、设备及介质 第 2 页 专利 一种企业投入产出异常识别系统、方法、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:14上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。