近两年,在学术领域引起世界范围热切关注的,当属2016年AlphaGo大战李世石,以及随后AlphaGo与柯洁的人机大战。对这场围棋赛事的直播、解说、讨论热度等都丝毫不亚于今日大家对世界杯的关注。
正当人们都在惊叹AlphaGo的强大,甚至柯洁本人都感叹“AlphaGo实在太完美”的时候,人工智能的脚步却丝毫没有逗留。很快,计算机可以自己作诗、画画、甚至写乐谱了,而且写出来的诗作、画作、乐谱都被认为“挺像样的”;越来越多的“语音助手”,被用于车载导航、电脑和手机的使用;人脸识别技术几乎无所不在:机场、火车站、无人超市,甚至扩展到了猪/牛脸识别,用来判断它们是否生病等。
除了学术界的相关研究进行的如火如荼外,各大知名企业也看到了人工智能技术的蓬勃发展,纷纷投入大量人力物力巩固加强自身的人工智能技术水平。比如,FaceBook、谷歌等比以往更加频繁的出现在学术论文作者的单位列表里,并不断推出让人惊诧的新应用;BATJ纷纷成立或壮大自己的AI Lab,使自己不落伍于这人工智能的时代!
AI时代的宠儿
在琳琅满目的各类人工智能技术中,有这样一项技术,它的提出者被认为是“一个给予机器想象力的人”;这项技术被泰斗级人物Yann LeCun称为是“近 20 年来深度学习领域诞生的最酷想法”;被《麻省理工科技评论》认为是 2018 年“全球十大突破性技术”(10 Breakthrough Technologies)之一;被美国国防部高级研究计划局 (DefenseAdvanced Research Projects Agency,DARPA)资助因这项技术引发的一项竞赛.....备受关注的这项技术就是GAN:Generative Adversarial Nets,生成式对抗网络。
2014年提出的GAN,在2016年开始受到大规模关注。它一方面将产生式模型拉回到了一直由判别式模型称霸的AI竞技场,引起了学者甚至大众对产生式模型的研究兴趣,同时也将对抗训练从常规的游戏竞技领域引到了更一般领域,引起了从学术界到工业界的普遍关注。谷歌、Facebook、Twitter、苹果等众多工业界AI相关的公司也都陆续公开了许多基于GAN的相关研究成果。
那么,这项技术可以用来做什么呢?
GAN的典型应用
图1的两个视频,一个是真实视频,一个是改进后的GAN产生出的合成假视频,你能分的出真假吗?
图1
图2中,可以将黑白图像转换为彩色图像、将航拍图像变成地图形式、将白天的照片转换为黑夜的照片、甚至可以根据物体的轮廓、边缘信息,来生成实体包包的形式;
图2 GAN的部分应用示例
图3中,可以用GAN来对人脸的某一种属性进行单独编辑和操作;
图3. GAN改进版的人脸属性编辑
图4中列出的高清图像也都是由改进后的GAN自动生成的。这一点打破了许多人认为生成式模型GAN无法自动生成高清分辨率的图像的局限性的设想。
图4. 高清图像生成
另外,通过GAN可以实现人脸风格转换、图像去马赛克、图像风格转换等,如图5、6、 7所示。
图5. 图像风格转换
图6. 去马赛克
图7. 图像-艺术画风格转换
快速掌握GAN
对于如此强大、如此重要的技术,要想实实在在的掌握它确实不易。为了帮大家更好的学习GAN,并使用GAN, 深度学习大讲堂在对GAN的发展现状与代码资源进行充分分析与评估后,推出了GAN专题专项学习。
课程将从论文阅读+代码复现两个方面来进行讲解和实战演练。一方面,在论文阅读过程中,我们将会由讲师提前总结梳理每个论文的产生背景、论文中方法的提出动机、方法核心点等几个方面进行全方位介绍;同时,另一方面,也将对代码实现过程进行手把手的讲解,包括代码的准备过程、调试训练过程中的注意事项、实现时经常会被踩的“坑”等。
每次课上所介绍的原理方法与代码实现都是一个相对独立的部分,因此,学员能更灵活的选择其中感兴趣的章节进行实现。而在整个过程中,通过原理方法与代码实践两个方面的双重引导,进而可以使用户在理论上、实际操作上都充分得了解这一技术——GAN。