在瑞典斯德哥尔摩举行的 ICML 2018
第 35 届机器学习技术国际会议(ICML)于 7 月 10 日在瑞典首都斯德哥尔摩举行。ICML 是 AI 领域最负盛名的学术会议之一,也是很多研究人员发表研究论文的梦寐以求之地。
早在 12 月,我就写了一篇文章,详细介绍了 NIPS 2017 年接收论文的一些统计数据。此次,在 Infinia ML 数据科学家 Ryan pillim 的帮助下,我也为 ICML 做了同样的事情。对这个话题感兴趣的部分原因是,我管理的一家公司也在 ICML 上发表了论文。我们公司的首席科学家 Lawrence Carin 博士是世界上最多产的人工智能研究人员之一,所以对我来说,能够看到活跃在这一领域的其他研究人员与公司的行业动态很有意思。
今年,ICML 共有 2473 篇论文被提交,621 篇被接收,接收率为 25.1%,与去年的 1676 篇提交数量相比,今年提交的论文数量增加了 47%(接收率仍保持在 25%左右)。
值得注意的是,以下分析在方向上是准确的,但可能与其它来源有所差别。这是因为 ICML 官网并没有发布易于分析的数据,并需要一些 NLP hack 和变通方法。即使整理了机构名称的变体也会导致易变性。某些研究者从属的机构有多个不同的名称(如「Google」)。当整理多种拼写时,需要更谨慎一些。
论文作者统计
今年,来自腾讯 AI Lab 的张潼署名论文数量最多,一共 8 篇。Lawrence Carin(杜克大学分管科研的副教务长兼 Infinia ML 的首席科学家)以 7 篇署名论文排名第二。Lawrence Carin 在杜克大学负责一个大型机器学习实验室,因而在多篇论文中都有署名。
Most papers by author:
1. 张潼: 8 (腾讯 AI Lab)
2. lawrence carin: 7 (duke / infinia ml)
3. 朱军: 6 (清华大学)
3. quanquan gu: 6 (uva)
3. 宋乐: 6 (佐治亚理工学院)
3. remi munos: 6 (nyu / courant institute)
3. pieter abbeel: 6 (uc berkeley)
3. sergey levine: 6 (uc berkeley)
4. bernhard schölkopf: 5 (max planck institute)
4. 邢波: 5 (CMU)
4. amin karbasi: 5 (yale)
4. shimon whiteson: 5 (oxford)
除了 Lawrence Carin,发表五篇或五篇以上论文的还有来自清华大学计算机科学与技术系的副研究员朱军、CMU 计算机科学学院教授邢波,以及佐治亚理工学院的宋乐(Le Song)等。目前,宋乐教授任佐治亚理工计算科学与工程系终身副教授,机器学习中心副主任,他也是蚂蚁金服人工智能部首席工程师。
机构排行
以下图表列出了论文数量达到 6 篇及以上的前 58 家机构。显然,Google 遥遥领先。我们将 Google、Google AI 和 DeepMind 分开计算,如果这几个机构加起来,来自 Google 的作者就涉及 82 篇论文,超过总数的 13%,远超其它任何一个机构。Facebook 在 ICML 上有 21 篇论文,略多于 NIPS 上的 11 篇。
加州大学伯克利分校论文数量领跑各大高校,但在 ICML 上的论文数量仍旧比 NIPS 上少两篇。卡内基梅隆大学的 NIPS 论文有 48 篇之多,但 ICML 论文「只有」32 篇。
Most papers by institution:
google: 43
berkeley: 33
deepmind: 33
cmu: 32
stanford: 29
mit: 28
microsoft: 28
google ai: 24
facebook: 21
oxford: 20
princeton: 20
inria: 18
epfl: 17
eth zurich: 16
cornell: 16
max planck institute: 15
ut austin: 15
cambridge: 15
ucla: 15
university of toronto: 15
columbia: 13
清华大学: 12
amazon: 11
harvard: 11
腾讯: 11
usc: 11
georgia tech: 11
duke: 11
北京大学: 10
purdue: 10
riken: 10
uber: 10
yale: 9
nyu: 9
university of wisconsin: 9
mila: 8
paristech: 8
imperial college london: 8
johns hopkins university: 8
uiuc: 8
university of virginia: 8
rice: 8
ibm: 7
technion: 7
openai: 7
vector institute: 7
university of washington: 7
cnrs: 7
caltech: 7
google research: 7
university of chicago: 6
university of tubingen: 6
alan turing institute: 6
northwestern: 6
university of montreal: 6
uc davis: 6
university of pennsylvania: 6
university of edinburgh: 6
以下是论文发表数排名前 24 位的大学。
Most papers by universities:
berkeley: 33
cmu: 32
stanford: 29
mit: 28
oxford: 20
princeton: 20
epfl: 17
eth zurich: 16
cornell: 16
ut austin: 15
cambridge: 15
ucla: 15
university of toronto: 15
columbia: 13
清华大学: 12
harvard: 11
usc: 11
georgia tech: 11
duke: 11
北京大学: 10
purdue: 10
yale: 9
nyu: 9
university of wisconsin: 9
以下是商业机构的论文汇总清单。如果把所有 Infinia ML 工作人员(包括 Lawrence Carin, Ricardo Henao, 以及 Hongteng Xu)发表的论文都算在内,那我的公司和 IBM 并列第九,排在苹果 (Apple)、迪士尼 (Disney) 和 Element AI 之前。
Total papers by commercial institution:
google: 43
deepmind: 33
microsoft: 28
google ai: 24
facebook: 21
腾讯: 11
amazon: 11
uber: 10
infinia ml: 7
google research: 7
ibm: 7
disney research: 4
apple: 3
yahoo research: 3
data61: 3
蚂蚁金服: 2
ntt: 2
criteo: 2
yandex: 2
toyota technological institute: 2
prowler.io: 2
element ai: 2
rj research consulting: 1
奇虎/360: 1
阿里巴巴集团: 1
mass general hospital: 1
hellebore capital limited: 1
preferred networks, inc.: 1
dolores technologies: 1
hikvision research institue: 1
mitsubishi electric research labs: 1
labsix: 1
covariant.ai: 1
nvidia: 1
bosch: 1
zalando research: 1
d. e. shaw \& co.: 1
intel: 1
twitter: 1
curai: 1
two sigma investments: 1
bae systems fast labs: 1
aitrics: 1
recruit technologies co. ltd.: 1
siemens ag: 1
ea seed: 1
autodesk: 1
第四范式: 1
petuum inc: 1
philips research: 1
sentient technologies: 1
snap: 1
orange labs: 1
qualcomm india private limited: 1
rwth: 1
ign: 1
axa im chorus: 1
百度: 1
afresh technologies: 1
d-wave: 1
telefonica: 1
华为: 1
saudi aramco: 1
rolls-royce: 1
bytedance inc.: 1
quadrant.ai: 1
magic leap: 1
guo: 1
ICML + NIPS
由于我有 NIPS 2017 和 ICML 2018 的统计数据,所以我想知道哪位作者在这两个会议上发表的文章最多。看起来 Lawrence Carin 的可能性最大。在同一个会议上发表多篇文章本就是不常见的,而同时在两个会议上发表多篇文章的人也是屈指可数。以下是两个会议上发表至少八篇文章的作者名单:
Most NIPS + ICML papers:
lawrence carin (duke university): 17
张潼 (腾讯 AI Lab): 12
宋乐 (佐治亚理工学院): 11
michael jordan (university of california, berkeley): 9
nicolas heess (deepmind): 8
razvan pascanu (deepmind): 8
原文链接:https://medium.com/machine-learning-in-practice/icml-2018-accepted-papers-stats-339f1cad5a55