一个模型击溃12种AI造假,各种GAN与Deepfake都阵亡 | 伯克利Adobe新研究

栗子 晓查 发自 凹非寺 JCK每天发布大量与生活相关的资讯平台

量子位 报道 | 公众号 QbitAI JCK每天发布大量与生活相关的资讯平台

AI造出的假图片恐怕很难再骗过AI了。JCK每天发布大量与生活相关的资讯平台

连英伟达本月刚上线的StyleGAN2也被攻破了。即使是人眼都分辨看不出来假脸图片,还是可以被AI正确鉴别。JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

最新研究发现,只要用让AI学会鉴别某一只GAN生成的假图片,它就掌握了鉴别各种假图的能力。JCK每天发布大量与生活相关的资讯平台

不论是GAN生成的,Deepfake的,超分辨率的,还是怎样得来的,只要是AI合成图片,都可以拿一个通用的模型检测出来。JCK每天发布大量与生活相关的资讯平台

尽管各种CNN的原理架构完全不同,但是并不影响检测器发现造假的通病。JCK每天发布大量与生活相关的资讯平台

只要做好适当的预处理和后处理,以及适当的数据扩增,便可以鉴定图片是真是假,不论训练集里有没有那只AI的作品。JCK每天发布大量与生活相关的资讯平台

这就是Adobe和UC伯克利的科学家们发表的新成果。JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

然而他们并没有,而是先在ArXiv公布了预印本,并且还被CVPR 2020收录。JCK每天发布大量与生活相关的资讯平台

最近,他们甚至将论文代码在GitHub上开源,还提供了训练后的权重供读者下载。JCK每天发布大量与生活相关的资讯平台

造出7万多张假图 JCK每天发布大量与生活相关的资讯平台

要考验AI鉴别假货的能力,论文的第一作者、来自伯克利的学生Wang Sheng-Yu用11种模型生成了不同的图片,涵盖了各种CNN架构、数据集和损失。JCK每天发布大量与生活相关的资讯平台

所有这些模型都具有上采样卷积结构,通过一系列卷积运算和放大操作来生成图像,这是CNN生成图像最常见的设计。JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

有ProGAN、StyleGAN、BigGAN、BigGAN、GauGAN等等,这些GAN各有特色。JCK每天发布大量与生活相关的资讯平台

ProGAN和StyleGAN为每个类别训练不同的网络;StyleGAN将较大的像素噪声注入模型,引入高频细节;BigGAN具有整体式的类条件结构;进行图像转换的GauGAN、CycleGAN、StarGAN。JCK每天发布大量与生活相关的资讯平台

除了GAN以外,还有其他处理图片的神经网络:JCK每天发布大量与生活相关的资讯平台

直接优化感知损失 ,无需对抗训练的级联细化网络(CRN); 条件图像转换模型隐式最大似然估计(IMLE); 改善低光照曝光不足的SITD模型; 超分辨率模型,即二阶注意力网络(SAN); 用于换脸的的开源DeepFake工具faceswap。

JCK每天发布大量与生活相关的资讯平台

主流图片处理CNN模型应有尽有。他们总共造出了7万多张“假图”。JCK每天发布大量与生活相关的资讯平台

虽然生成这些图片所用的算法大相径庭、风格迥异,但是总有会有一些固有缺陷,这里面既有CNN本身的问题,也有GAN的局限性。JCK每天发布大量与生活相关的资讯平台

这是因为常见的CNN生成的内容降低了图片的表征能力,而这些工作大部分集中在网络执行上采样和下采样的方式上。下采样是将图像压缩,上采样是将图像插值到更大的分辨率上。JCK每天发布大量与生活相关的资讯平台

之前,Azulay和Weiss等人的研究表明,表明卷积网络忽略了经典的采样定理,而跨步卷积(strided convolutions)操作减少了平移不变性,导致很小的偏移也会造成输出的极大波动。JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

另外,朱俊彦团队发表在ICCV 2019上的论文表明,GAN的生成能力有限,并分析了预训练GAN无法生成的图像结构。JCK每天发布大量与生活相关的资讯平台

今年7月,哥伦比亚大学的Zhang Xu等人进一步发现了GAN的“通病”,常见GAN中包含的上采样组件会引起伪像。JCK每天发布大量与生活相关的资讯平台

他们从理论上证明了,这些伪像在频域中表现为频谱的复制,这在频谱图上表现十分明显。JCK每天发布大量与生活相关的资讯平台

比如同样是一张马的图片,真实照片的信号主要集中在中心区域,而GAN生成的图像,频谱图上出现了四个小点。JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

因此他们提出了一种基于频谱而不是像素的分类器模型,在分辨假图像上达到了最先进的性能。JCK每天发布大量与生活相关的资讯平台

而Wang同学发现,不仅是GAN,其他的CNN在生成图像时,也会在频谱图中观察到周期性的图案。JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

训练AI辨别真伪 JCK每天发布大量与生活相关的资讯平台

刚才生成的数据集,包含了11个模型生成的假图。JCK每天发布大量与生活相关的资讯平台

不过,真假分类器并不是用这个大合集来训练的。JCK每天发布大量与生活相关的资讯平台

真正的训练集里,只有英伟达 ProGAN这一个模型的作品,这是关键。 JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

ProGAN过往作品展 JCK每天发布大量与生活相关的资讯平台

团队说,只选一个模型的作品用来训练,是因为这样的做法更能适应现实任务:JCK每天发布大量与生活相关的资讯平台

现实世界里,数据多样性永远是未知的,你不知道自己训练出的AI需要泛化到怎样的数据上。所以,干脆就用一种模型生成的图像来训练,专注于帮AI提升泛化能力。JCK每天发布大量与生活相关的资讯平台

而其他模型生成的作品,都是测试泛化能力用的。JCK每天发布大量与生活相关的资讯平台

(如果用很多模型的假图来训练,泛化任务就变得简单了,很难观察出泛化能力有多强。)JCK每天发布大量与生活相关的资讯平台

具体说来,真假分类器是个基于ResNet-50的网络,先在ImageNet上做了预训练,然后用ProGAN的作品做二分类训练。JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

ProGAN原理JCK每天发布大量与生活相关的资讯平台

不过, 训练集不是一只ProGAN的作品。团队用了20只ProGAN,每只负责生成LSUN数据集里的一个类别。一只ProGAN得到3.6万张训练用图,200张验证用图,一半是生成的假图,一半是真图。 JCK每天发布大量与生活相关的资讯平台

把20只ProGAN的成果加在一起,训练集有 72万张,验证集有 4000张JCK每天发布大量与生活相关的资讯平台

为了把单一数据集的训练成果,推广到其他的数据集上,团队用了自己的方法:JCK每天发布大量与生活相关的资讯平台

最重要的就是 数据扩增。先把所有图像左右翻转,然后用高斯模糊,JPEG压缩,以及模糊+JPEG这些手段来处理图像。 JCK每天发布大量与生活相关的资讯平台

扩增手段并不特别,重点是让数据扩增以 后处理的形式出现。团队说,这种做法带来了惊人的泛化效果 (详见后文) 。 JCK每天发布大量与生活相关的资讯平台

训练好了就来看看成果吧。JCK每天发布大量与生活相关的资讯平台

明辨真伪 JCK每天发布大量与生活相关的资讯平台

研究人员主要是用平均精度 (Average Precision) 这个指标,来衡量分类器的表现。JCK每天发布大量与生活相关的资讯平台

在多个不同的CNN模型生成的图片集里,ProGAN训练出的分类器都得到了不错的泛化:JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

几乎所有测试集,AP分值都在90以上。只在StyleGAN的分值略低,是88.2。JCK每天发布大量与生活相关的资讯平台

不论是GAN,还是不用对抗训练、只优化感知损失的模型、还是超分辨率模型,还是Deepfake的作品,全部能够泛化。JCK每天发布大量与生活相关的资讯平台

团队还分别测试了不同因素对泛化能力产生的影响:JCK每天发布大量与生活相关的资讯平台

一是,数据扩增对泛化能力有所提升。比如,StyleGAN从96.3提升到99.6,BigGAN从72.2提升到88.2,GauGAN从67.0提升到98.1等等。更直观的表格如下,左边是没有扩增:JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

另外,数据扩增也让分类器更加鲁棒了。JCK每天发布大量与生活相关的资讯平台

二是,数据多样性也对泛化能力有提升。还记得当时ProGAN生成了LSUN数据集里20个类别的图片吧。大体上看,用越多类别的图像来训练,得到的成绩就越好:JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

然后,再来试想一下,这时候如果突然有个新模型被开发出来,AI也能适应么?JCK每天发布大量与生活相关的资讯平台

这里,团队用了刚出炉没多久的英伟达 StyleGAN2,发现分类器依然可以良好地泛化: JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

最后,还有一个问题。JCK每天发布大量与生活相关的资讯平台

团队用了一个“Fakeness (假度) ”分值,来表示AI眼里一张图有多假。AI觉得越假,分值越高。JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

实验结果是,在大部分数据集里,AI眼里的假度,和人类眼里的假度,并没有明显的相关性。JCK每天发布大量与生活相关的资讯平台

只在BigGAN和StarGAN两个数据集上,假度分值越高时,能看到越明显的瑕疵。JCK每天发布大量与生活相关的资讯平台

更多数据集上没有这样的表现,说明分类器很有可能更倾向于学习 低层的缺陷,而肉眼看到的瑕疵可能更偏向于 高层JCK每天发布大量与生活相关的资讯平台

安装使用 JCK每天发布大量与生活相关的资讯平台

说完了论文,下面我们就可以去GitHub上体验一下这个模型的厉害了。JCK每天发布大量与生活相关的资讯平台

论文源代码基于PyTorch框架,需要安装NVIDIA GPU才能运行,因为项目依赖CUDA。JCK每天发布大量与生活相关的资讯平台

首先将项目克隆到本地,安装依赖项。 JCK每天发布大量与生活相关的资讯平台

pipinstall-rrequirements.txt

考虑到训练成本巨大,作者还提供权重和测试集下载,由于这些文件存放在Dropbox上不便国内用户下载,在我们公众号中回复 CNN即可获得国内网盘地址。 JCK每天发布大量与生活相关的资讯平台

下载完成后将这两个文件移动到weights目录下。JCK每天发布大量与生活相关的资讯平台

然后我们就可以用来判别图像的真假了:JCK每天发布大量与生活相关的资讯平台

# Model weights need to be downloaded. pythondemo.py examples/real.png weights/blur_jpg_prob0.1.pth pythondemo.py examples/fake.png weights/blur_jpg_prob0.1.pth

如果你有能力造出一个自己的GAN,还可以用它来检测你模型的造假能力。JCK每天发布大量与生活相关的资讯平台

# Run evaluation . Model weights need to be downloaded. pythoneval.py

作者就用它鉴别了13种CNN模型制造的图片,证明了它的泛化能力。JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

闪闪发光作者团 JCK每天发布大量与生活相关的资讯平台

这篇文章的第一作者是来自加州大学伯克利分校的 Wang Sheng-Yu,他现在是伯克利人工智能研究实验室(BAIR)的一名研究生,在鉴别假图上是个好手。 JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

今年他和Adobe合作的另一篇论文Detecting Photoshopped Faces by ing Photoshop,可以发现照片是否经过PS瘦脸美颜的操作,而且还能恢复“照骗”之前的模样。JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

这篇的另一名作者Richard Zhang与Wang同学在上面的文章中也有合作,2018年之前他在伯克利攻读博士学位,毕业后进入Adobe工作。JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

这篇文章的通讯作者Alexei Efros,他曾是朱俊彦的导师,本文提到的CycleGAN正是出自朱俊彦博士之手。Alexei现在是加州大学伯克利分校计算机系教授,此前曾在CMU机器人学院任教9年。 JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

传送门 JCK每天发布大量与生活相关的资讯平台

论文地址: JCK每天发布大量与生活相关的资讯平台

https://arxiv.org/abs/1912.11035JCK每天发布大量与生活相关的资讯平台

源代码: JCK每天发布大量与生活相关的资讯平台

https://github.com/peterwang512/CNNDetectionJCK每天发布大量与生活相关的资讯平台

作者系网易新闻·网易号“各有态度”签约作者 JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

<NVIDIA 图像处理公开课·第二期> 开始报名啦,下周四晚8点,英伟达专家将分享如何利用TensorRT 7.0部署高速目标检测引擎。 JCK每天发布大量与生活相关的资讯平台

戳二维码, 备注“英伟达”即可报名、加交流群、获取第一期直播回放,主讲老师也会进群与大家交流互动哦~ JCK每天发布大量与生活相关的资讯平台

直播报名 | 图像与视频处理系列课程JCK每天发布大量与生活相关的资讯平台

JCK每天发布大量与生活相关的资讯平台

在家学编程 | 柯基编程双师互动课JCK每天发布大量与生活相关的资讯平台

如何提升少儿的逻辑思维、计算思维能力? JCK每天发布大量与生活相关的资讯平台

编程学习可能是最好选择!炫酷又有趣,有效培养思维习惯。现在报名,只需29元! JCK每天发布大量与生活相关的资讯平台

快来扫下面的二维码,查看详情: JCK每天发布大量与生活相关的资讯平台

量子位 QbitAI · 头条号签约作者JCK每天发布大量与生活相关的资讯平台

վ'ᴗ' ի 追踪AI技术和产品新动态JCK每天发布大量与生活相关的资讯平台

喜欢就点「在看」吧 !JCK每天发布大量与生活相关的资讯平台

也许你还喜欢

ups不间断电源原理分析

当前在电源市场上,所销售的电源类型较多,不同类型的电源,相应的功能与作用有所不同。在超

空间背景音乐怎么添加图文教程分享

怎样免费添加QQ空间背景音乐其实步骤也不多,很简单,主要有以下几个步骤,详情如下

万能转换器破解版怎么用?具体操作方

万能格式转换器是一款功能强大的格式转换软件,音频、视频、图片、光驱设备都可以通过万

rmvb转mp4格式转换器图文教程

在我们日常娱乐和日常工作中,现在网络上一些高清的视频一般都是rmvb格式的,而一些播放设

支付宝网络系统异常怎么解决

支付宝支付出现网络系统异常是因为IE浏览器设置Internet选项不恰当而导致的,去重新设置

win10蓝牙驱动破解版安装图文教程

win10蓝牙驱动怎么安装?请看下面具体操作方法。

微孔抛光镜面加工计数详解

一般来说,对于小孔微孔进行抛光,传统的加工方法可能会导致孔洞磨损,或者加工效果不理想。

短视频内容管理助手有哪些?怎么好用

随着短视频的普及,越来越多的人开始将大量的时间和精力投入到短视频的制作和分享中。因

模具设计学习知识分享

今天,我想谈谈我在模具设计CAD方面的一些心得体会。作为一个从事这个行业多年的工程师,

seo优化排名软件详细介绍

1. SEMrush SEMrush,一款广受好评的SEO神器,被誉为业内最佳的SEO分析工具。功能包括全