1. 背景知识介绍

平台已集成的攻击算法及简要说明如下所示

1.1. 图像攻击方法(黑白盒)

白盒攻击

项目的部分攻击算法是白盒的攻击方式,需要完整的知道model的结构和对应的梯度等信息。

黑盒攻击

项目的部分攻击算法是黑盒的攻击方式,不需要完整的知道model的结构和对应的梯度等信息,只需要知道经过该模型的预测结果,用于作为评测的数据输入。

score-based黑盒

攻击算法可以知道model的完整输出,即model对每个类别的置信度。

decision-based黑盒

攻击算法仅知道model的分类标签输出。

decision-based黑盒

利用对抗样本的可迁移性,对源模型进行预训练,然后再利用白盒攻击算法去攻击源模型,生成对抗样本。这种攻击不需要关于黑盒model的任何信息。

1.2. 攻击方法(目标/非目标)

目标攻击

目标攻击是指将原始样本通过攻击后,指定攻击后的结果类别

非目标攻击

非目标攻击是指将原始样本通过攻击后,结果类别与原有的模型类别不同即可