说明:收录25万 73个行业的国家标准 支持批量下载
ICS35.020 CCSL70 中华人民共和国国家标准 GB/T45401.2—2025 人工智能 计算设备调度与协同 第2部分:分布式计算框架 Artificialintelligence—Schedulingandcooperationforcomputingdevices— Part2:Frameworkfordistributedcomputing 2025-03-28发布 2025-03-28实施 国家市场监督管理总局 国家标准化管理委员会发布目 次 前言 Ⅲ ………………………………………………………………………………………………………… 引言 Ⅳ ………………………………………………………………………………………………………… 1 范围 1 ……………………………………………………………………………………………………… 2 规范性引用文件 1 ………………………………………………………………………………………… 3 术语和定义 1 ……………………………………………………………………………………………… 4 缩略语 2 …………………………………………………………………………………………………… 5 概述 2 ……………………………………………………………………………………………………… 5.1 总体框架 2 …………………………………………………………………………………………… 5.2 适用性 3 ……………………………………………………………………………………………… 6 计算设备技术要求 3 ……………………………………………………………………………………… 6.1 云侧设备 3 …………………………………………………………………………………………… 6.2 边侧设备 4 …………………………………………………………………………………………… 6.3 端侧设备 4 …………………………………………………………………………………………… 7 分布式计算协同技术要求 5 ……………………………………………………………………………… 7.1 架构 5 ………………………………………………………………………………………………… 7.2 通用要求 5 …………………………………………………………………………………………… 7.3 组件要求 6 …………………………………………………………………………………………… 7.4 云云协同要求 8 ……………………………………………………………………………………… 7.5 云边端协同要求 9 …………………………………………………………………………………… 7.6 多端协同要求 11 ……………………………………………………………………………………… 8 云边端分布式计算协同接口 12 …………………………………………………………………………… 8.1 边侧节点管理 12 ……………………………………………………………………………………… 8.2 部署及更新 14 ………………………………………………………………………………………… 8.3 任务运行管理 17 ……………………………………………………………………………………… 参考文献 19 …………………………………………………………………………………………………… ⅠGB/T45401.2—2025 前 言 本文件按照GB/T1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定 起草。 本文件是GB/T45401《人工智能 计算设备调度与协同》的第2部分。GB/T45401已经发布了 以下部分: ———第1部分:虚拟化与调度; ———第2部分:分布式计算框架。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本文件起草单位:中国电子技术标准化研究院、华为技术有限公司、北京航空航天大学、中国科学院 软件研究所、华为云计算技术有限公司、阿里云计算有限公司、北京百度网讯科技有限公司、浪潮电子信 息产业股份有限公司、上海商汤智能科技有限公司、北京大学武汉人工智能研究院、上海市人工智能行 业协会、中国移动通信集团有限公司、中国科学院计算技术研究所、科大讯飞股份有限公司、北京大学、 深圳云天励飞技术股份有限公司、上海天数智芯半导体有限公司、北京壁仞科技开发有限公司、杭州海 康威视数字技术股份有限公司、南方电网人工智能科技有限公司、龙芯中科技术股份有限公司、苏州登 临科技有限公司、浙江大华技术股份有限公司、蚂蚁科技集团股份有限公司、国科础石(重庆)软件有限 公司、广东电网有限责任公司、广电运通集团股份有限公司、上海计算机软件技术开发中心、上海文鳐信 息科技有限公司、京东方科技集团股份有限公司、天津(滨海)人工智能创新中心。 本文件主要起草人:曹晓琦、董建、杨雨泽、鲍薇、徐洋、于超、李斌斌、王莞尔、栾钟治、朱毅鑫、董乾、 孟令中、郑子木、吴涛、田晓利、张亚强、马珊珊、马骋昊、赵春昊、吴庚、曹汐、王煜炜、吴婷、杨超、王志芳、 余雪松、丁瑞全、叶挺群、董召杰、马莞悦、代君、孔维生、郭智慧、罗勇军、严宇平、陈浩敏、杨波、陈敏刚、 牛科科、仲凯韬、姜幸群、史殿习。 ⅢGB/T45401.2—2025 引 言 随着人工智能计算形态的不断发展,承载人工智能应用的计算设备的部署和使用呈现分布式、全场 景的趋势。同一人工智能计算任务往往需要多种形态的计算设备协作完成,为不同地域、类型的用户提 供服务。需要对不同形态的计算设备资源合理利用及分配,明确必要的技术架构、能力要求以及接口 等,为产品提供参考框架以及评价体系,缓解不同形态人工智能计算设备横向协同割裂的现状。 GB/T45401《人工智能 计算设备调度与协同》拟由两个部分组成。 ———第1部分:虚拟化与调度,旨在确立人工智能计算设备虚拟化与调度系统的架构,规定技术要 求及对应的测试方法。 ———第2部分:分布式计算框架,旨在确立人工智能计算设备分布式计算的架构,规定功能和性能 技术要求,定义分布式计算协同接口。 ⅣGB/T45401.2—2025 人工智能 计算设备调度与协同 第2部分:分布式计算框架 1 范围 本文件确立了人工智能计算设备分布式计算的架构,规定了功能和性能技术要求,定义了分布式计 算协同接口。 本文件适用于用于分布式人工智能计算系统的设计、开发和测试。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文 件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于 本文件。 GB/T41867 信息技术 人工智能 术语 GB/T42018—2022 信息技术 人工智能 平台计算资源规范 GB/T45401.1—2025 人工智能 计算设备调度与协同 第1部分:虚拟化与调度 GB/T45280—2025 人工智能 异构人工智能加速器统一接口 GB/T45087—2024 人工智能 服务器系统性能测试方法 3 术语和定义 GB/T41867、GB/T42018—2022、GB/T45401.1—2025和GB/T45280—2025界定的以及下列术 语和定义适用于本文件。 3.1 分布式机器学习 distributedmachinelearning 一种机器学习的方法或过程,利用互联网络作为首选通信载体,在不同子系统上完成同一个机器学 习任务。 注1:互联网络包含局域互联网及广域互联网。 注2:分布式按照机器学习任务种类不同,分布式机器学习分为分布式训练、分布式推理。 [来源:ISO/IEC2382:2015,2178059,有修改] 3.2 联邦[机器]学习 federated[machine]learning 一种机器学习方法或过程,使多个参加者协作构建及使用机器学习模型而不暴露参加者的私有 数据。 3.3 增量学习 incrementallearning 一种分为多个阶段的自适应学习方法,其中在前驱阶段学得的知识被转化为适当形式,以便为后继 1GB/T45401.2—2025 阶段的新知识提供基础。 注1:在机器学习领域的某些文献里,增量学习称为“(机器学习模型的)增量(预)训练”。 注2:模型微调是增量学习的方式之一。 [来源:ISO/IEC2382:2015,2123002,有修改] 3.4 边侧计算 edgecomputing 一种分布式计算方法或过程,其中处理及存储过程发生在分布式系统的边侧。 注:计算发生靠近边侧的程度按系统的需求定义设定。 [来源:ISO/IECTR23188:2020,3.1.3] 3.5 集合通信 collectivecommunication 一种通信模式,其所传递数据在一组处理器单元(称为节点)上处理,其进程或计算节点之间协同工 作以进行数据交换和同步。 注:集合通信的过程一般涉及有多个接受者和发送者。 4 缩略语 下列缩略语适用于本文件。 AI:人工智能(ArtificialIntelligence) CPU:中央处理单元(CentralProcessingUnit) FPGA:现场可编程逻辑门阵列(FieldProgrammableGateArray) GPU:图形处理单元(GraphicsProcessingUnit) NPU:神经网络处理单元(Neural-networkProcessingUnit)

.pdf文档 GB-T 45401.2-2025 人工智能 计算设备调度与协同 第2部分 分布式计算框架

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
GB-T 45401.2-2025 人工智能 计算设备调度与协同 第2部分 分布式计算框架 第 1 页 GB-T 45401.2-2025 人工智能 计算设备调度与协同 第2部分 分布式计算框架 第 2 页 GB-T 45401.2-2025 人工智能 计算设备调度与协同 第2部分 分布式计算框架 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-07-27 18:49:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。