在金融支付和门禁等应用场景,活体检测用来验证是真实的本人还是一张图像或者一段视频。随着当前人脸伪造技术的发展,伪造人脸图像的检测也是一个重要的问题。
1. NUAA数据集
数据集地址为http://parnec.nuaa.edu.cn/xtan/data/nuaaimposterdb.html。
NUAA数据集发布于2010年,这是一个重放攻击人脸数据集,包含采集的15个人脸图像。以每秒20帧,对每一个正面人脸姿态和中性表情进行采集,每一个人采集500张图,分辨率大小为640×480。人脸图像采集使用了Canon相机,而伪造人脸则使用相机纸打印和A4纸打印。
2. Replay-Attack Database数据集
数据集地址为https://www.idiap.ch/dataset/replayattack。
Replay-Attack Database数据集发布于2012年,这是一个重放攻击人脸数据集,包含50个人的1300个视频。其中,重放攻击视频的采集通过用户使用笔记本电脑的摄像头访问视频,或者使用计算机自带的视频软件进行播放,持续时间至少9秒,分辨率为320×240像素。
3. 3DMask Attack数据集
数据集地址为https://www.idiap.ch/dataset/3dmad。
3DMask Attack数据集发布于2013年,包含17个人的76 500张图像,使用Kinect进行采集。每一个人采集3组视频,前两组为真实视频,第三组为掩码攻击图。
每一组视频包含5个视频,每一个视频300帧,每个帧包括一张深度图像、相应的RGB图像和手动标注的眼睛位置。其中,每帧分辨率是640×480,包含8位RGB图像和11位深度图像,采集者的姿态是正面和无表情。
4. MSU USSA数据集
数据集地址为http://biometrics.cse.msu.edu/Publications/Databases/MSU_USSA/。
MSU USSA数据集发布于2016年,是一个活体检测数据集,包含9000张图像,其中1000张为真实图,8000张为伪造图,即非活体图。
5. SiW数据集
数据集地址为http://cvlab.cse.msu.edu/siw-spoof-in-the-wild-database.html。
SiW数据集发布于2016年,是一个活体检测数据集,包含165个人,每个人包含8段真实的视频,多达20段伪造的视频,总共4478个视频。视频的分辨率为1080p,帧率是每秒30帧。
6. WFFD数据集
数据集地址为https://arxiv.org/abs/1906.11900。
WFFD数据集发布于2019年,是一个3D人脸蜡像数据集,总共包含2200对真实人脸和蜡像人脸图。
7. CASIA-SURF数据集
数据集地址为https://sites.google.com/qq.com/chalearnfacespoofingattackdete/。
CASIA-SURF数据集发布于2019年,是一个活体检测数据集,包括1000个人的21 000个视频。数据集通过Intel RealSense SR300相机在不同的室内背景下采集得到的,同时采集RGB、Depth和InfraRed(IR)视频。其中,RGB图像分辨率为1280×720,Depth和IR的分辨率为640×480。每一个样本会录制一个真实视频及6个攻击视频,攻击类型包括遮挡住眼睛、鼻子、嘴等区域。
1. FaceForensics++数据集
数据集地址为https://github.com/ondyari/FaceForensics。
FaceForensics++数据集发布于2019年,是一个伪造人脸数据集,使用Face2Face、FaceSwap、DeepFakes及NeuralTextures共4种换脸算法对1000个真实视频进行处理,各自得到了510 207张真假脸对应的图像。
2. DFW数据集
数据集地址为http://iab-rubric.org/resources/dfw.html。
DFW数据集发布于2018年,包括1000个人的11 157张图像,它是IBM发布的一个妆造人脸数据集,主要包括遮挡和伪造人脸。
在DFW数据集中,每一个人都有一张正脸图,其中903张人脸有一个验证图,两者构成正常的人脸验证对。所有人(1000个)都有妆造图,874个人有一些被识别成他自己(故意的或者非故意的)的伪造图,最终总共有1000张正脸图、903张验证图、4814张妆造图、4440张伪造(另一个人)图。
除此之外还有一些其他较小的人脸伪造数据集,感兴趣的读者可以自行了解。