都说ICCV的论文录用率非常低,实际在今年4303篇论文的投稿中,最终有1077篇论文被接收。相较于2017年28.9%的接收率,今年25.02%的录用率虽略有下降,但与其他AI领域的国际顶会相比论文录用率基本持平。
作为视觉领域的国际顶会,ICCV 2019的一举一动都牵动着CVer的心。
除了投稿数量翻倍,今年的参会人数也是直线上升,据大会官网消息,目前已有7000多名参会者注册报名,可谓相当火爆!
今年的会议为期7天,将于27日正式开幕,2日结束。ICCV大会官网目前已经放出了会议议程,其中60场主题丰富的Workshop、12个Tutorials和Doctoral Consortium等一系列活动都将同期举行。
其中,在10月29日举行的Neural Architects Workshop尤为亮眼。届时,计算机视觉领域奠基人Alan Yuille、马尔奖获得者Ross Girshick、Faster RCNN和ResNet作者任少卿等知名专家学者将会聚一堂,为大家带来精彩的主题报告。
而最受期待的最佳论文和最佳学生论文奖也将会在10月29日揭晓。同时,Azriel Rosenfeld 终身成就奖、Distinguished researcher award(杰出研究员奖)、Mark Everingham 奖、Helmholtz prize 经典论文奖届时也将陆续公布。
最终的大奖将花落谁家呢?有没有很期待呢?
剧透来了!本公号会在接下来的几天将会对ICCV2019录用的优秀论文进行解读,同时也会跟进报道本次大会的盛况,欢迎感兴趣的小伙伴及时关注最新动态哦!
接下来,我们就先来回顾下过去五年ICCV的会议情况。
详解ICCV
不同于在美国每年召开一次的CVPR和只在欧洲召开的ECCV,ICCV在世界范围内每两年召开一次,ICCV的论文录用质量是三大会议中公认级别最高的。
根据AMiner对AI会议的最新排名统计,ICCV位居排行榜第五位,H5指数为127,10H值为23938。目前在中国计算机学会推荐国际学术会议的排名和清华计算机学科推荐列表中,ICCV均为人工智能领域的A类会议。
通过对AMiner平台中ICCV近五年来收录论文数据地进一步挖掘,(详情可查https://www.aminer.cn/conference/53a72d7620f7420be8c6646b),从词云可以看出,ICCV的关键词主要集中在人体姿态估计、目标检测、语义分割、单一图像、视觉跟踪、深度神经网络、卷积神经网络等方向。
通过对五年来ICCV接收论文中所有学者信息的提取,我们分析了这些学者的性别比例、国籍分布与语言分布情况。可以看出,ICCV的投稿学者以男性为主,占比88.7%。从学者分布情况来看,投稿学者主要来自美国、中国,分别占比30.88%、29.25%,其次是日本和意大利,占比4.41%、3.76%。
从投稿学者发表所属机构来看,五年来在ICCV会议中,香港中文大学以65篇论文数量排在首位,卡耐基梅隆大学与中国科学院均以55篇位列第二,清华大学和微软分列第三、第四,分别各发表33篇、30篇。
近五年高引论文TOP10
近五年来ICCV的高引论文TOP1是Facebook RGB大神Ross B. Girshick发表的《Fast R-CNN》一文,引用量高达5695次。
2014年R-CNN横空出世,首次将卷积神经网络带入目标检测领域。受SPPnet启发,Ross在2015年发表了Fast R-CNN,它的构思精巧,流程更为紧凑,大幅提高目标检测速度。
在同样的最大规模网络上,Fast R-CNN和R-CNN相比,训练时间从84小时减少为9.5小时,测试时间从47秒减少为0.32秒。在PASCAL VOC 2007上的准确率相差无几,约在66%-67%之间。
高引论文TOP2是发表于2015年的《Delving Deep into Rectifiers:Surpassing Human-Level Performance on ImageNet Classification》,引用量5027次。
这篇文章出自当时还在微软亚洲研究院的何恺明、孙剑以及来自西安交通大学和中国科学技术大学的实习生张祥雨和任少卿。如今,何凯明去了Facebook;张祥雨作为孙剑首个深度学习的博士也随孙剑加入了旷视,成为旷视研究院base model组负责人;而任少卿已成为自动驾驶公司Momenta合伙人兼研发总监,而他也会在今年的Workshop中亮相。
这篇文章的研究成果基于深度卷积神经网络(CNN)的计算机视觉系统,是视觉识别挑战中第一个超越人类视觉能力的计算机系统,在ImageNet 1000挑战中首次超越了人类进行对象识别分类的能力,在ImageNet 2012分类数据集中的错误率已降低至4.94%。
排名第三的是发表于2017年的《Mask R-CNN》一文,引用量2423次。作者同样是何恺明、Ross B. Girshick与Georgia Gkioxari、 Piotr Dollár。
Mask R-CNN是一个小巧、灵活的通用对象实例分割框架(object instance segmentation),它不仅可对图像中的目标进行检测,还可以对每一个目标给出一个高质量的分割结果。它在Faster R-CNN基础之上进行扩展,并行地在bounding box recognition分支上添加一个用于预测目标掩模(object mask)的新分支。该网络还很容易扩展到其他任务中,比如估计人的姿势,也就是关键点识别(person keypoint detection)。该框架在COCO的一些列挑战任务重都取得了最好的结果,包括实例分割(instance segmentation)、候选框目标检测(bounding-box object detection)和人关键点检测(person keypoint detection)。
历年最佳论文
通过AMiner 的Best Papers vs. Top Cited Papers in Computer Science 页面(https://www.aminer.cn/bestpaper/ICCV),可以看到ICCV历年来的最佳论文。
ICCV2017年的最佳论文正是排在高引论文第三位的《Mask R-CNN》。
更牛的是本届最佳学生论文奖《Focal Loss for Dense Object Detection》一文也有何恺明的参与。
该篇论文的第一作者 Tsung-Yi Lin 博士毕业于康乃尔大学纽约理工学院,这是他在 Facebook 工作时进行的研究。Tsung-Yi Lin 最著名的工作是他在微软期间提出的 Coco 数据集(论文:《Microsoft coco:Common objects in context》)。
ICCV2015的最佳论文奖授予了由微软剑桥研究院(Microsoft Research, Cambridge UK)、卡内基梅隆大学和意大利布鲁诺凯斯勒研究中心(Fondazione Bruno Kessler)合作的论文《深度神经决策森林》(Deep Neural Decision Forests)。
该论文提出将分类树模型和深度神经网络的特征学习相结合进行端到端训练的深度学习方法。该方法使用决策森林(decision forest)作为最终的预测模型,提出了一套完整的、联合的、全局的深度学习参数优化方法。在手写数据库MNIST和图像分类数据库ImageNet的实验中都取得了超越当前最好方法的结果。
ICCV2013最佳论文《From Large Scale Image Categorization to Entry-Level Categories》
作者:Vicente Ordonez,Jia Deng, Yejin Choi, Alexander C. Berg, Tamara L. Berg
ICCV2011最佳论文《Relative attributes》
作者:Devi Parikh,Kristen Grauman
ICCV上的其他奖项
Azriel Rosenfeld 终身成就奖
该奖用于奖励在长期职业生涯中为计算机视觉领域作出突出贡献的杰出研究者。
ICCV2017 的Azriel Rosenfeld 终身成就奖颁发给了MIT的Tomaso Poggio教授。Tomaso Poggio是MIT大脑和认知科学系Eugene McDermott教授,生物和计算学习中心联合主任,计算机科学和人工智能实验室成员,是AAAI Founding Fellow。
杰出研究员奖(Distinguished researcher award)
基于主要研究贡献及影响激发其他研究,该奖项用于奖励对计算机视觉发展作出重大贡献的研究者。
2017年杰出研究奖授予了ETH Zentrum 教授 Luc Van Gool 与 Facebook 研究科学家、计算摄影学团队创始人Richard Szeliski。
Luc van Gool是ETH Zurich大学教授,研究领域为计算机视觉和图像处理。Richard Szeliski是Facebook的研究科学家、计算摄影组主任。
Mark Everingham奖
该奖项用于奖励为计算机视觉社区作出无私而重要贡献的研究员,包括个人和团队。
2017年的Everingham prize颁发给了Caffe团队和ICVSS组织者。深度学习框架Caffe,它的作者贾扬清目前任职于阿里巴巴,曾在Facebook、谷歌大脑工作过,也是TensorFlow的作者之一。
Helmholtz prize经典论文奖
该奖项主要颁发给对计算机视觉研究有重大意义、十年前的的论文,以表彰他们在计算机视觉领域作出的基础贡献。
2017年的经典论文主要有以下7篇:
Space-time interest points I Laptev and T Lindeberg,I Laptev and T Lindeberg
Recognizing action at a distance,A Efros, A Berg, G Mori, J Malik,
Video Google:A text retrieval approach to object matching in videos,J Sivic, A Zisserman,
Recognising panoramas,M Brown, D Lowe,
Discovering objects and their location in images,J Sivic, B Russell, A Efros, A Zisserman, W Freeman
The pyramid match kernel:Discriminative classification with sets of image features,K Grauman, T Darrell
Actions as space-time shapes,M Blank, L Gorelick, E Shechtman, M Irani, R Basri