这份报告试图从学术、工业、政策等角度全面介绍全球人工智能的发展现状,今年的报告更加注重全球数据。报告指出,美国的 AI 研究力量仍是全球最强,但中国的追赶速度很快。报告特别介绍了清华大学学习 AI 课程的学生数量:2017 年人工智能+机器学习课程的入学人数比 2010 年时多 16 倍。
AI Index 2018 版介绍
我们很高兴推出 AI Index 2018 年度报告。本年度的报告要实现两个目标:更新上一年的指标以及尽可能地提供全球性的背景。前一个目标是 AI Index 至关重要的使命——为探讨人工智能设定基础,即意味着要持续不断地跟踪规模和技术的进展。但后一个目标也很重要。没有全球化的视野,不可能讲好 AI 故事。2017 年的报告严重偏向了北美地区的活动。这只是因为我们的全球合作关系还有限,并不是因为我们有内在的偏见。今年,我们开始填补这一全球性漏洞。我们认识到,要使本报告真正完备全面,前方还有很长的路要走——会涉及到更多合作和外部参与。
尽管如此,我们仍可以断言 AI 是全球性的。2017 年,Scopus 上 83% 的 AI 论文都来自美国之外。其中来自欧洲的占到了最大的比例(28%)。在全世界范围内,AI 和机器学习(ML)大学课程的入学人数都在增多,尤其值得一提的是中国的清华大学,该校 2017 年人工智能+机器学习组合课程的入学人数比 2010 年时多 16 倍。2017 年,中国生产的工业机器人的数量也占到了世界的最大比重——占全球机器人总出货量的 30%。而且不只是美国、中国和欧洲,其它地方也在推进 AI 的发展。根据我们的统计 AI 专利的方法,韩国和日本在 2014 年产出的 AI 专利分列全球第二和第三,仅次于美国。另外,南非成功举办了第二届 Deep Learning Indaba 大会,这是世界最大型的机器学习教学活动之一,吸引了来自 20 多个非洲国家的超过 500 名参会者。
AI 的多样性不仅体现在地理上。如今,Partnership on AI 已有大约 50% 的成员组织是非营利性的,包括美国公民自由联盟、国际特赦组织、牛津大学人类未来研究所和联合国开发计划署。而且人们也对 AI 领域中的性别和少数族裔多样性的重要性有了更高的认识。AI4ALL 和 Women in Machine Learning(WiML)等组织正在加大力度鼓励和支持代表性不足的群体参与进来。
下面的指标也能体现本报告所传达的关键信息:AI 是全球性的。
报告目录如下:
领域活力
学术
1996~2017 年间论文发表数量年增长情况
下图展示了 1996 年~2017 年 AI、CS 及所有领域论文数量的增长情况。从图中可以看出,AI 领域的论文增幅最大,比 1996 年增加了 7 倍多。
1998~2017 年间 Scopus 平台 AI 各子领域论文数量年增长情况
下图展示了 Scopus 上的 AI 论文数量(按 AI 子领域划分,各个类别之间可能有交叉)。可以看出,机器学习和概率推理、神经网络、计算机视觉方面的论文最多,增速也最快,反映了这些领域的火热程度。
2000 年&2017 年中国、美国、欧洲区域的活跃 AI 研究方向
下图显示了中国、美国、欧洲的 AI 研究相对活跃指数(RAI,一个国家/地区 AI 出版物份额与全球 AI 出版物份额的对比,1.0 表示该国家/地区在 AI 领域的研究活跃度与全球活跃度完全一致)。可以看出,2000 年中国的工程、技术研究活跃程度高于平均水平,但医疗健康、农业、社会科学、人道主义方面的研究活跃度比较低。到了 2017 年,这几个领域活跃程度有所提高,其中最突出的是农业科学。
1998~2017 年间中国、美国和欧洲论文数量变化情况(按领域划分)
下图展示了中国、美国和欧洲来自政府、企业及医疗领域的论文数量变化情况。从中可以看出,中国、欧洲的 AI 论文主要来自政府,而美国的 AI 论文则主要来自企业。
1998-2016 年各地区发表论文的领域权重引用影响系数(FWCI)
美国的 AI 论文作者获得的引用量要比全球平均水平高 83%,另一方面,中国论文的被引次数增长迅速。
各个国家和地区在 2018 AAAI 大会上的论文发表数量
70% 的 AAAI 论文来自美国、中国。
大型 AI 会议参与度
下图显示了 1984-2018 年间大型 AI 会议的出席人数以及 2012-2018 年各个大型会议出席人数的增长变化。从图中可以看出,1986-1993 年左右,出席大会的人数下降得比较厉害。而从 1995 年至今,出席大型 AI 会议的人数呈波动增长,尤其是从 2013 年开始急剧增加。注:这里对大型会议的定义是 2017 年出席人数超过 2000 的大会。
小型 AI 会议参与度
下图展示了 1995-2018 年间出席小型 AI 会议的人数以及 2012-2018 年各个小型会议出席人数的增长变化。小型会议是指在 2017 年出席人数不足 2000 的大会。
ICLR 2018 的出席人数是 2012 年的 20 倍,这一趋势反映了当前的人工智能更加注重深度学习和强化学习。
业界
AI 工作机会
下图根据所需 AI 技能展示了 2015-2017 年工作机会变化趋势(AI 技能有交叉)。可以看出,机器学习和深度学习方面的工作机会最多,深度学习工作机会增速最快。
开源
GitHub 收藏量(star)
下图展示了 2015-2018 年不同的 AI 和 ML 软件包在 GitHub 上的收藏量变化。从图中可以看到两个近期趋势:大公司支持的框架(如 TensorFlow (谷歌)、PyTorch (Facebook)、MXNet (亚马逊))流行度不断增长;与其他包相比,TensorFlow 具备更强的流行度。
技术表现
计算机视觉
1. 目标检测:ImageNet
下图展示了 2010 到 2018 年目标检测模型在 ImageNet 数据集上的准确率变化。
2. 目标检测:ImageNet 训练时间
下图展示了 2017 年 6 月到 2018 年 11 月训练神经网络在 ImageNet 数据集上得到高准确率所需时间。
3. 实例目标分割:COCO
下图展示了 2015-2018 年模型在 COCO 数据集上的性能变化。
自然语言理解
1. 解析
下图展示了 1995-2015 年 AI 系统在确定句子句法结构的任务上的性能变化。
2. 机器翻译
下图展示了 2008-2018 年机器翻译系统在英语-德语翻译和德语-英语翻译任务上的性能变化。
3. 问答系统:ARC
2018 年 4 月-11 月问答系统在 ARC 基准上的性能变化
4. 问答系统:GLUE
2018 年 5 月-10 月问答系统在 GLUE 基准上的性能变化
识别下方二维码,阅读完整版报告。
延伸阅读:
2017 年报告(中文):http://cdn.aiindex.org/AI-Index-2017-Chinese-Translation.pdf
2018 年报告中文版将于近日发布,敬请期待。