1. 项目简介

人工智能技术在公共安全、金融经济、国防安全等领域取得了巨大进展和广泛应用。然而,由于现实应用场景的开放性,当前的人工智能技术暴露出稳定性、安全性等方面的安全隐患。对于人工智能算法的评测与度量,对于理解人工智能的行为并进一步提升其质量和推进在真实场景中的可用性具有重要意义。

本项目面向智能算法评测相关的挑战,针对图像分类、文本情感分析和语音识别三方面的应用集成了40余种评测(对抗攻击)算法,可以对相关的CNN、Transformer、RNN等深度学习模型进行鲁棒性评测,并且介绍了相关的数据集以及添加新的模型鲁棒性评测算法的方法。基于本项目,研发了深度学习模型评测工具,形成了一个智能算法的评测平台。

1.1. 项目地址

本项目开源在启智社区,地址为: https://git.openi.org.cn/Numbda/AI-Testing

2. 项目成员

喻文健、杨定澄、李浩源、文豪

清华大学 计算机科学与技术系