马赛克的发明可以说是人类进步史上一次重大的倒车了,自马赛克发明以来,如何去掉马赛克一直是技术社区和民间共通的课题。Google 的人工智能 Google Brain 研究团队近日对外公布了一项新技术,可以把一张只有 8 x 8 像素的大颗粒图片还原成相对清晰的图片。
话不多说,先上一张图看看他们的战果:
上图中左侧是喂给 AI 的压缩后低分辨率图片,中间是经过名为“像素递归超分辨率”(Pixel Recursive Super Resolution)技术处理之后的图片,右侧是没有经过压缩的原图。可以看到左侧完全不知为何物的一团大饼,在中间经过 AI 的处理之后出现了可以分辨的五官。但是唯一的问题是,中间的人和右边的原图看起来还是有一定差距的,尤其是最下面的美女连嘴型和眼妆都发生了巨大的改变。
这套深度学习算法的工作机制十分复杂,但如果简化来说和大家玩你画我猜的过程差不多:
首先算法要猜出原始图片究竟是什么——它是人脸或是培根——如果它判断是人脸,那么接下来一步则要表达出这是一张人脸。表达人脸的方法是从现有的图片库中找到高像素的人脸素材,将其中可能符合这个图片的部分剪切出来拼凑成一张新的图片。
这个过程中的两个步骤分别调用了调节网络(Conditioning Network)和优先网络(Prior network),前者先把素材库里的高清图片全都压缩成马赛克图片,然后一一和输入计算机的马赛克图片对比;后者则根据对比结果预测这张图片究竟是什么东西,并指挥 PixelCNN(开源图像生成模型)把对应的素材贴到合适的位置,最终形成一幅“高清原图”。
这个过程唯一的问题是,即便 AI 对图片的大体内容猜测正确,也不可能 100% 猜中图中每一处细节。尤其是对于面孔来说,能认清五官已经很不错了,要对妆容进行还原就比较困难了。不过,在实际的测试中人脸图片其实是一个还原效果比较好的类别,因为还原的成功率并不按照是否与原图完全一致计算,而是按照还原出来的图片是否可辨认来计算。
在测试中,90% 被打马赛克的人脸被成功还原,72% 被打马赛克的卧室图片被成功还原,这对于此类算法来说是一个十分惊人的成绩。
有人担心这项研究会被用于政府或其他机构对大众进行跟踪——就像你在美剧里经常看到的那样,主角在电脑前对着模糊的监控照片点了点鼠标,犯罪分子的高清照片就神奇的出现在了面前。但介于上文所讲的那样,这个算法的主要工作原理靠猜,所以在这一领域几乎没有任何用处。相比之下,可能普罗大众最旺盛的那个去马赛克需求能更好的实现一些。
不过,要是拿着世界顶级人工智能研究室的研究成果去开车,Google 可能会伤心吧。