《联邦学习实战》杨强 读书笔记十九——总结与展望

news/2024/5/19 14:45:22 标签: 深度学习, 神经网络, 机器学习, 边缘计算

联邦学习进展总结

理论研究总结

  1. 提升通信性能,提高联邦学习训练效率,方案概括来说包括:
    1. 减少不必要的参数传输。
    2. 对模型或梯度进行压缩。
    3. 减少全局的训练次数。
    4. 异步的更新机制。
  2. 提升安全性,保障隐私数据安全。安全性威胁主要来自两个方面:一是来自外部的威胁,例如针对联邦学习客户端或服务端的外部攻击、传输过程中可能存在的信息泄露等。二是来自内部的威胁,也就是当参与联邦学习训练的客户端或服务端是一个恶意的参与方,它会通过篡改模型的参数或数据、加入后门等策略达到攻击的效果。

针对来自外部的攻击,可以采用同态加密、多方安全计算、差分隐私等隐私保护技术。

针对来自内部的攻击,当前的策略包括:

  1. 异常检测。包括对异常模型的检测,也包括对异常客户端的检测。
  2. 采用更随机的挑选策略。在每一轮迭代过程中,都会挑选一部分客户端设备而不是全部参与下一轮训练。
  1. 模型公平性和收敛性。在联邦学习中,每个参与方本地的训练数据都是独立提供的,即数据通常是非独立同分布(Non-IID)的;另一方面是各参与方提供的数据量大小不等。

缓解Non-IID的一种策略是通过对多方的客户端数据分布进行学习,得到一个生成模型,然后将其发送给各参与方,让各参与方生成更多分布均匀的数据。

未来展望

联邦学习的可解析性

模型的可解析性是当前人工智能的研究热点。特别是在将算法模型落地到工业界时,我们需要向客户解析产生这个结果的原因。

面向客户开发人员两个群体,可解析性主要包括模型结构的可解析性和模型结果输出的可解析性两个方面。

  1. 模型结构的可解析性:即通过可视化、参数分析等方式让用户理解复杂的内部结构,通过对比实验解释模型的运行原理。
  2. 模型结果的可解析性:一个典型的机器学习流程包括模型训练和模型推断两个阶段。为了使结果的输出可解析,当前一般采取的策略包括两种:
    1. 训练的模型采用可解析的模型,主要包括线性模型、决策树模型、朴素贝叶斯模型和K近邻算法。
    2. 采用模型无关的可解析策略。模型无关的可解析性策略将解释与机器学习模型分离。模型无关的解释方法相对于可解析性模型的最大优势在于其灵活性,能应用到任意的模型上。

面向监管立法机构人员参与方,以下几个问题是特别关心的问题:

  1. 模型的隐私损失解析:在联邦学习的落地应用中,通常需要在模型效率、模型准确度和数据的隐私损失之间取一个平衡点。
  2. 联邦学习的公平性解析:参与联邦学习训练的参与方至少有两个,每个参与方都期望自身的数据和模型能够对联邦社区做出贡献。如果能够在不泄露隐私的前提下,将每个参与方对全局模型的贡献以某种方式展示出来,就能提高每个参与方的积极性,促进联邦学习生态的发展。

联邦学习的公平性激励机制

要想使联邦学习模型取得好的效果,需要各参与方持续提供高质量的训练数据,同时让更多的参与方加入联邦生态,就要通过鼓励联邦生态中的参与方多做贡献,并且能够根据对模型的贡献度分配来激励参与者——这就是联邦学习的公平性机制问题。

激励机制通常与博弈论等数学知识关系密切,当前的研究仍在起步阶段,在今后的发展中有很大的研究价值和应用空间。

联邦学习的模型收敛性和性能分析

从效率角度来说,目前联邦学习仍然有许多需要提升的地方。

  1. 有限资源下的参数调节。在联邦学习中,除了具有与深度学习或传统机器学习相似的优化函数选择,例如学习率、批量大小、正则化等,还要考虑聚合规则、每个迭代中选择的客户端数量、本地每轮的迭代数量等参数选择。
  2. 有限的通信带宽及设备的不可靠性。在靠近终端设备的节点,或则互联网中靠近终端的端方用户,通常拥有较低的网络带宽和通信效率。同时,这种网络连接可能有较高的花费,或者无法保证完全稳定在线。
  3. 非独立同分布的数据。与中心化的机器学习训练过程相比,这种数据分布造成的影响将降低模型训练效果。未来的几个研究方向包括对目标函数进行改进、对优化函数进行改进等。
  4. 特殊数据的处理。在很多时候,引入的新数据可能与之前所有参与方使用的数据完全不同,从而被误判为异常数据。对这种特殊数据的处理,当前联邦学习还没有一个很好的解决方案。

本读书笔记系列针对2021年5月出版的《联邦学习实战》(见下图),后续部分将逐步更新


http://www.niftyadmin.cn/n/560815.html

相关文章

javascript实现cookies的查询代码实例

javascript实现cookies的查询代码实例 <script language"javascript"> <!-- var cookies document.cookie; function readcookie(name) { var start cookies.<a href"http://www.3ppt.com/tags.php/indexof">…

6G移动通信总结

总结 由于持续增长的通信业务需求和更加复杂的网络结构&#xff0c;2030年以前&#xff0c;5G或许不能很好地满足人们的通信需求。本文主要从六个方面介绍了6G带来的总体通信改变。同时&#xff0c;本文分别从空中接口和传输技术和网络架构两方面介绍了6G的新颖技术。此外&…

《联邦学习实战》杨强 读书笔记十一——联邦学习在智能物联网中的应用案例

目录 案例的背景与动机 历史数据分析 出行时间预测模型 问题定义 构造训练数据集 模型结构 联邦学习在智慧城市建设中的一个应用&#xff0c;即用户的出行预测&#xff0c;帮助用户更好地规划出行安排。 人工智能物联网&#xff08;以下简称AIoT&#xff09;是一种将人工…

分享25款鲜艳亮丽的精美桌面壁纸

这篇文章与大家分享25款鲜艳亮丽的精美壁纸&#xff0c;赶紧下载吧&#xff0c;换个漂亮的图片&#xff0c;让你桌面靓起来&#xff01; &#xff08;编译来源&#xff1a;梦想天空 原文来自&#xff1a;35 Bright & Colourful Wallpapers to Download&#xff09;转载于:…

《联邦学习实战》杨强 读书笔记十四——构建公平的大数据交易市场

当数据具有资产属性之后&#xff0c;数据便可以直接或者间接地为公司、为社会创造价值和收益&#xff0c;并且可以作为一种特殊的商品在市场中进行交易。 与传统的商品交易相比&#xff0c;数据资产交易的市场前景更广阔&#xff0c;但同时也面临着很多的挑战&#xff0c;主要…

SP2 网络故障解决

1. 卸载SP2 卸载SP2有两种方法:1.在控制面板的添加删除程序组件里面卸载;2.运行“CMD”命令进入命令提示符窗口&#xff0c;输入以下命 令: cd %Windir%$NtServicePackUninstall$\Spuninstspuninst.exe根据提示操作即可。   2.解决BT下载速度慢的问题 很多朋友在安装电话录音…

《联邦学习实战》杨强 读书笔记八——联邦学习在金融保险领域的应用案例

本章将介绍两个案例&#xff0c;分别是基于纵向联邦的保险个性化定价案例和基于横向联邦的银行间反洗钱模型案例。 基于纵向联邦学习的保险个性化定价案例 案例描述 保险个性化定价&#xff0c;与其他个性化服务一样&#xff0c;需要平衡保险公司和客户之间的关系。一方面&a…

iPhone代码片段收集

1. stringWithFormat 用法&#xff1a; [NSString stringWithFormat:"Hight: %d% Low: %d%", [Temp],"C",[lTemp],"C"]; NSString to NSData: NSString* str "kilonet"; NSData* data[str dataUsingEncoding:NSUTF8StringEncoding];…