背景知识介绍 ===================== 平台已集成的攻击算法及简要说明如下所示 图像攻击方法(黑白盒) ------------------------ 白盒攻击 ~~~~~~~~ 项目的部分攻击算法是白盒的攻击方式,需要完整的知道model的结构和对应的梯度等信息。 黑盒攻击 ~~~~~~~~ 项目的部分攻击算法是黑盒的攻击方式,不需要完整的知道model的结构和对应的梯度等信息,只需要知道经过该模型的预测结果,用于作为评测的数据输入。 score-based黑盒 ~~~~~~~~~~~~~~~~ 攻击算法可以知道model的完整输出,即model对每个类别的置信度。 decision-based黑盒 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 攻击算法仅知道model的分类标签输出。 decision-based黑盒 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 利用对抗样本的可迁移性,对源模型进行预训练,然后再利用白盒攻击算法去攻击源模型,生成对抗样本。这种攻击不需要关于黑盒model的任何信息。 攻击方法(目标/非目标) ----------------------------- 目标攻击 ~~~~~~~~ 目标攻击是指将原始样本通过攻击后,指定攻击后的结果类别 非目标攻击 ~~~~~~~~~~ 非目标攻击是指将原始样本通过攻击后,结果类别与原有的模型类别不同即可