《联邦学习实战》杨强 读书笔记十七——联邦学习加速方法

news/2024/5/19 14:23:48 标签: 神经网络, 深度学习, 机器学习, 边缘计算

目录

同步参数更新的加速方法

增加通信间隔

减少传输内容

非对称的推送和获取

计算和传输重叠

异步参数更新的加速方法

基于模型集成的加速方法

One-Shot联邦学习

基于有监督的集成学习方法

基于半监督及知识蒸馏的方法

基于学习的联邦模型集成


如何在保证模型性能不下降的前提下,有效提升联邦学习的训练效率,成为当前联邦学习的一个研究热点问题。

模型计算和通信传输成为影响联邦学习效率的两大因素。具体优化联邦学习的各类方法见下图:

WFBP表示wait-free backpropagation;0ZMQ表示ZeroMQ,NCCL表示NVIDIA collective library。

通信效率的优化显得比计算性能的优化复杂和困难得多,因而从计算机系统的角度看,边缘端设备的算力水平在不断提高。但通信网络,一方面受网络带宽的影响另一方面由于联邦学习的客户端分布具有跨地域的特点,使得各客户端设备之间的通信延迟提高,设备间通信失败的风险比一般的分布式学习大。

同步参数更新的加速方法

同步的参数更新是指服务器会等待每一个客户端完成本地迭代并上传更新的模型参数,然后进行统一的聚合处理。适当降低通信的频度,从而减小通信开销,加速模型训练,常见的方法包括增加通信间隔、减小传输内容、非对称的推送和获取、计算和传输流水线操作。

增加通信间隔

将通信的频度从原来本地模型每次更新后(即每个SGD更新步骤)都通信一次,变成本地模型多次更新后(即多个SGD更新步骤)才通信一次。

减少传输内容

两个代表性的联邦学习的模型参数更新策略:

  1. 轮廓更新(Sketched updates):参与方在本地正常更新模型参数,之后以编码的方式对参数进行压缩并上传,服务器将压缩的模型参数进行解码,还原原始的模型参数。
  2. 结构更新(Structured updates):在联邦模型训练过程中,参与方之间可以先限定要传输模型的结构,模型传输只按照限定的结构进行。可以采用掩码策略。掩码矩阵是一个维度与原始模型维度相同的只包含0或1的矩阵。在上传模型参数时,只上传掩码矩阵对应位置为1的元素。

由于模型结构在联邦学习中是共享的,所以我们可以使用模型参数的压缩技术来降低通信代价。深度学习的模型压缩策略都可以应用到联邦学习场景中。具体的方法包括知识蒸馏、网络剪枝,以及针对移动端设备的轻型网络SqueezeNet、MobileNets、Shufflent、Xception等。

模型压缩出了能够有效减少参数传输量、提升联邦学习的训练效率,还能在一定程度上保护模型的原始参数不被泄露,提升模型的安全性。

非对称的推送和获取

联邦学习的通信操作主要包括下面两点:向协调方推送模型更新;从协调方获取最新的全局模型。可以对这两种操作采用不同的通信频率。

在训练过程中,如果某个参与方的本地模型参数变化不太大,实际上没有必要频繁地把很小的更新发送到协调方。同样,也没有必要在每一步都对本地模型进行校准。通过调节推送间隔和获取间隔这两个参数,我们可以在系统性能和模型精度之间找到一个平衡点。

计算和传输重叠

通过在时间上将计算进程和通信进程重叠并行来实现,即流水线操作。流水线是计算机系统中常用的优化方法,通过将没有依赖关系的不同操作用流水线并行,获得加速。

在联邦学习训练过程中,可以将一次迭代分为计算和通信两个步骤。虽然相邻两次迭代之间存在依赖性,但可以利用机器学习的容错性,适当打破这种依赖关系,从而让两次迭代之间的计算和通信以流水线的方式重叠。

异步参数更新的加速方法

异步更新策略是指联邦系统中的每一个参与方完成本地模型训练迭代后,无需等待联邦学习系统的其他参与方,就可以向服务端发送本地模型参数更新并请求当前的全局模型下发,以便继续进行后续训练。同时,服务端也会根据每一个客户端上传的最新模型参数进行聚合,而不需要考虑每一个参与方与服务端的通信次数是否相同。

与同步更新相比,尽管异步更新策略的效率可以大大提高,但是,它会使得来自不同参与方的本地模型参数之间存在延迟的现象,给模型聚合的收敛性带来了一定的影响。

异步更新策略可能引发“延迟”问题,即各参与方的初始本地模型很可能不是当前最新的全局模型,这是因为全局模型不再由服务端进行统一的分发,每一个客户端都独立地从服务端申请获取全局模型,造成各个客户端获取的全局模型很不一致。另一个问题就是模型的不稳定性,这主要是因为参与方之间的步调可能相差很大。

研究人员也提出了很多折中的解决方案,即介于同步和异步之间的新的通信方式,例如延时同步并行(SSP)、带延迟补偿的异步随机梯度下降算法、基于集成压缩的异步更新方法。

基于模型集成的加速方法

One-Shot联邦学习

针对横向两帮学习,one-shot联邦学习被提出,即参与方与协调服务器之间只需要进行一轮通信就可以完成全局联邦学习模型的构建。

基于有监督的集成学习方法

由于不同参与者的本地模型质量可能有很大不同,最佳的生成全局联邦模型的方法可能只需要考虑一部分参与者的本地模型,而非所有参与者的本地模型。具体有以下几种策略:

  1. 交叉验证(CV)选择:设备只有在其本地验证数据上达到某些基准性能(例如ROC或AUC)时,才共享其本地模型,并且基准由协调服务器预先确定。服务器从这个K个本地模型集合中,挑选符合性能指标的前N个最佳模型。
  2. 数据选择:参与者只有在拥有一定数量的本地培训数据时才共享其本地模型,并且该数据量由协调服务器预先确定。协调服务器将这些本地模型中的模型集成在一起,这些模型是在前N个最大的数据集上训练的。
  3. 随机选择:服务器从K个本地模型中随机选择N个本地模型进行聚合。

基于半监督及知识蒸馏的方法

当协调服务器可以访问未标记的公共代理数据时,可以通过知识蒸馏将联邦模型压缩为较小的模型。在传统的知识蒸馏方法中,利用教师模型输出的带有概率标记的数据对学生模型进行训练,从而将教师模型中的知识转移到学生模型中。

知识蒸馏不仅有助于压缩模型,还可以实现隐私保护学习。

基于学习的联邦模型集成

特征分布的机器学习(FDML)采用异步随机梯度下降算法。FDML系统对任何有监督的学习任务都有效,它要求每个参与方可以使用任意的模型,通过将数据输入每一个客户端模型中得到局部特征,进一步得到局部预测,将不同的局部预测汇总为最终预测。

FDML系统的优点是,在每次训练迭代期间,每个参与方都应使用自己的局部特征集的小批量来更新局部模型参数,并且对于每个样本,只需共享其局部对协调服务器的预测。由于一方的原始功能或本地模型参数没有转移到任何外部站点,FDML保留了数据的局部性,并且更不容易遭受针对其他协作学习算法的模型反转进攻。

本读书笔记系列针对2021年5月出版的《联邦学习实战》(见下图),后续部分将逐步更新


http://www.niftyadmin.cn/n/560819.html

相关文章

Winform开发框架之字典数据管理

好久没写博客了,除了是工作较忙的原因外,其实是也一直在想如何整合我所有的开发经验及技术积累,开发过很多Winform共享软件、Asp.net的WebForm项目,发现很多东西是相互关联很紧密的,但往往我们太忙太懒,要好…

《联邦学习实战》杨强 读书笔记十八——联邦学习与其他前沿技术

目录 联邦学习与Split Learning Split Learning设计模式 Split Learning与联邦学习的异同 联邦学习与边缘计算 边缘计算综述 联邦学习与边缘计算的异同点 联邦学习与Split Learning Split Learning的核心思想是将网络的结构进行拆分,每个设备只保留一部分网络…

用符号常量表示常数—《狂人C》习题解答3(习题2.6)

/* 求出整数123的各位数字相应的字符ASCII码编号并输出。 */#include <stdio.h> #include <stdlib.h>#define ZHENGSHU_3 123 //问题中的常数一般应该用符号常量表示 #define GE 1 #define SHI 10 #define BAI 100 #define QIAN 1000int main( void ) {printf(&qu…

《联邦学习实战》杨强 读书笔记十九——总结与展望

联邦学习进展总结 理论研究总结 提升通信性能&#xff0c;提高联邦学习训练效率&#xff0c;方案概括来说包括&#xff1a; 减少不必要的参数传输。对模型或梯度进行压缩。减少全局的训练次数。异步的更新机制。提升安全性&#xff0c;保障隐私数据安全。安全性威胁主要来自两…

javascript实现cookies的查询代码实例

javascript实现cookies的查询代码实例 <script language"javascript"> <!-- var cookies document.cookie; function readcookie(name) { var start cookies.<a href"http://www.3ppt.com/tags.php/indexof">…

6G移动通信总结

总结 由于持续增长的通信业务需求和更加复杂的网络结构&#xff0c;2030年以前&#xff0c;5G或许不能很好地满足人们的通信需求。本文主要从六个方面介绍了6G带来的总体通信改变。同时&#xff0c;本文分别从空中接口和传输技术和网络架构两方面介绍了6G的新颖技术。此外&…

《联邦学习实战》杨强 读书笔记十一——联邦学习在智能物联网中的应用案例

目录 案例的背景与动机 历史数据分析 出行时间预测模型 问题定义 构造训练数据集 模型结构 联邦学习在智慧城市建设中的一个应用&#xff0c;即用户的出行预测&#xff0c;帮助用户更好地规划出行安排。 人工智能物联网&#xff08;以下简称AIoT&#xff09;是一种将人工…

分享25款鲜艳亮丽的精美桌面壁纸

这篇文章与大家分享25款鲜艳亮丽的精美壁纸&#xff0c;赶紧下载吧&#xff0c;换个漂亮的图片&#xff0c;让你桌面靓起来&#xff01; &#xff08;编译来源&#xff1a;梦想天空 原文来自&#xff1a;35 Bright & Colourful Wallpapers to Download&#xff09;转载于:…