后门准确率降至3%，主任务性能几乎不变！华工JHU提出全新「联邦学习后门攻击识别」解决方案｜ICCV2023

新智元报道

编辑：LRS

【新智元导读】无惧联邦学习中的后门攻击！全新解决方案利用多指标和动态加权来自适应地识别后门，在难度最高的Edge-case PGD中，后门准确率仅为3.06%。

由于难以被服务器端的防御方法识别，Edge-case PGD攻击目前已经给联邦学习带来巨大的威胁。
诸如FLAME，Foolsgold等SOTA模型，可以在CIFAR-10数据集上实现高达60%的后门攻击成功率。
最近，华南理工大学AI安全团队联合约翰斯·霍普金斯大学提出了一种抵御联邦学习中后门攻击的新方法，并已被ICCV 2023收录。后门准确率降至3%，主任务性能几乎不变！华工JHU提出全新「联邦学习后门攻击识别」解决方案｜ICCV2023

论文地址：http://arxiv.org/abs/2303.06601

开源代码：https://github.com/siquanhuang/Multi-metrics_against_backdoors_in_FL

研究在缓解「维度诅咒」的基础上，提出了一种Multi-metrics的动态框架，以强大的后门识别能力将Edge-case PGD攻击的后门准确率降低至惊人3.06%，并且保持着几乎不变的主任务准确率84%，大大提高了联邦学习框架的鲁棒性。

简介

联邦学习（FL）的分散性和隐私保护性使其很容易受到后门攻击，这些攻击的目的是在对手选择的特定输入上操纵生成模型的行为。

然而，大多数基于统计差异的防御措施只能对特定攻击有效，尤其是当恶意梯度与良性梯度相似或数据高度非独立且同分布（非IID）时。研究人员在重新审视了基于距离的防御方法后发现：1. 欧氏距离在高维度下是毫无意义的；2. 具有不同特征的恶意梯度无法利用单一的指标进行识别。为此，研究人员提出了一种简单而有效的防御策略，利用多指标和动态加权来自适应地识别后门。同时，这种新型防御方法不依赖于对攻击设置或数据分布的预定义假设，对良性性能的影响也很小。为了评估方法的有效性，研究人员在各种攻击设置下的不同数据集上进行了综合实验，并取得了最佳防御性能。例如，在难度最高的Edge-case PGD下，后门准确率最低，仅为3.06%，与以往的防御方法相比优势明显。

实验还证明，研究人员提出的方法可以很好地适应各种非IID度，而不会牺牲良性性能。

方法

曼哈顿距离缓解维度诅咒

后门准确率降至3%，主任务性能几乎不变！华工JHU提出全新「联邦学习后门攻击识别」解决方案｜ICCV2023 Theorem1为维度诅咒效应的公式，随着维度d的上升，距离指标将会逐渐丧失意义。虽然无法彻底解决维度诅咒带来的问题，根据理论证明，研究人员表示曼哈顿距离在高维空间中的识别能力要远远好于常用的欧式距离，可以缓解维度诅咒效应。