文献阅读--FLTrust: Byzantine-robust Federated Learning via Trust Bootstrapping

本文设计了一个 Byzantine-robust （能够抵御投毒攻击）的联邦学习框架。在此 Fed 框架中，每一轮梯度聚合前，server 端会先计算 global模型在root dataset（server额外收集的干净的数据集，大小为100即可）上的梯度，然后通过计算该梯度和各 client 上传的梯度的角度获取 TS（信任分数），并进行幅值的缩放，有效地降低了上传投毒梯度的 clie

学渣渣渣渣渣

18283人浏览 · 2021-10-08 17:04:07

学渣渣渣渣渣 · 2021-10-08 17:04:07 发布

本文设计了一个 Byzantine-robust （能够抵御投毒攻击）的联邦学习框架。在此 Fed 框架中，每一轮梯度聚合前，server 端会先计算 global模型在 root dataset（server额外收集的干净的数据集，大小为100即可）上的梯度，然后通过计算该梯度和各 client 上传的梯度的角度获取 TS（信任分数），并进行幅值的缩放，有效地降低了上传投毒梯度的 client 所造成的影响。

1 问题

在 Fed 框架中，malicious client 会进行投毒攻击，这样的投毒攻击可以表现为直接上传梯度，而不用在样本上进行修改，上传异常梯度，损害 global model 的性能。
在这里插入图片描述

2 挑战

2.1 如何辨别哪个client异常？

如果使用异常检测算法对每个 client 上传的梯度进行无监督二分类的异常检测，则可能出现以下情况：无法确定哪一类代表异常梯度。因此需要一个标杆，能够确定哪一类代表异常值。

2.2 如何控制更新权重？

在以往的数据聚合阶段，都是根据各方的数据量进行权重配比，即数据量越多的 client 更新时获得的权重更大，聚合算法如下图：
在这里插入图片描述
这样的算法存在一个问题，恶意敌手可以通过谎报更多的数据量从而获取更大的权重，其数据投毒造成的危害也越大。

2.3 计算量

考虑有些 client 是 IoT 场景下的边缘设备，计算能力十分有限，因此本文所涉及的算法要求：
1.不给client增加计算量；
2.server计算量能小就小。

3 解决方案

这张图非常清楚的概括了本文所提出的框架：
在这里插入图片描述
在图中， $g_0$ 表示 server 端利用 global model 对 root dataset 计算得到的梯度。
本文的 basic idea ：异常的梯度和正常的梯度会有较大的角度偏差。
RELU函数过滤了角度差大于180度的异常梯度，是一个不错的做法。
在中间下面的方框中，还进行了幅值的归一化，防止某一方 scale 了原有梯度，企图获取更大的影响力。