1. 背景知识介绍¶
平台已集成的攻击算法及简要说明如下所示
1.1. 图像攻击方法(黑白盒)¶
白盒攻击¶
项目的部分攻击算法是白盒的攻击方式,需要完整的知道model的结构和对应的梯度等信息。
黑盒攻击¶
项目的部分攻击算法是黑盒的攻击方式,不需要完整的知道model的结构和对应的梯度等信息,只需要知道经过该模型的预测结果,用于作为评测的数据输入。
score-based黑盒¶
攻击算法可以知道model的完整输出,即model对每个类别的置信度。
decision-based黑盒¶
攻击算法仅知道model的分类标签输出。
decision-based黑盒¶
利用对抗样本的可迁移性,对源模型进行预训练,然后再利用白盒攻击算法去攻击源模型,生成对抗样本。这种攻击不需要关于黑盒model的任何信息。
1.2. 攻击方法(目标/非目标)¶
目标攻击¶
目标攻击是指将原始样本通过攻击后,指定攻击后的结果类别
非目标攻击¶
非目标攻击是指将原始样本通过攻击后,结果类别与原有的模型类别不同即可