据大会官方统计,今年共有 18310 位作者提交了 6773 篇论文,总共有 5804 份有效投稿,最终 1645 篇论文被接收,其中包括 157 篇 Oral,整体接收率为 28%,与上届持平。
国内科研机构和企业在 ECCV 2022 上斩获颇丰,以商汤为例,入围论文共 70 篇,包含 6 篇 Oral、64 篇 Poster。同时,商汤还主办了两个 Workshop 及相关竞赛,均在 ECCV 期间举行并发布结果。
昨晚,大会公布了一系列奖项,威斯康星大学麦迪逊分校、Butlr 的研究者摘得最佳论文奖,还有 2 篇论文获得了最佳论文荣誉提名奖。与往届一样,大会还公布了经典论文 Koenderink 奖和 PAMI Everingham 奖。
最佳论文奖
本届最佳论文由来自威斯康星大学麦迪逊分校、Butlr 的研究者摘得。
图源:Twitter@CSProfKGD
论文地址:https://arxiv.org/pdf/2207.09684.pdf
代码地址:https://github.com/zhenxingjian/Partial_Distance_Correlation
这篇论文由四位研究者共同完成,他们分别是 Xingjian Zhen 、Zihang Meng 、 Rudrasis Chakraborty 以及 Vikas Singh ,其中两位是华人作者。
Xingjian Zhen 为威斯康星大学麦迪逊分校计算机科学博士生。在此之前,他于 2017 年获得清华大学电子工程系的学士学位。其研究兴趣是计算机视觉,深度学习,微分几何,统计学和医学成像。此外,他还在 NeurIPS、ICCV、CVPR、 AAAI 等发表过多篇文章。
个人主页:https://zhenxingjian.github.io/homepage/
Zihang Meng 为 Meta AI(原 Facebook AI)研究科学家。在此之前,他在威斯康星大学麦迪逊分校获得计算机科学博士学位,师从 Vikas Singh 教授。他于 2017 年获得浙江大学电子信息工程学士学位。目前的研究方向是机器学习及其在计算机视觉中的应用。
个人主页:https://pages.cs.wisc.edu/~zihangm/
Rudrasis Chakraborty 为 Butlr 软件公司的高级机器学习科学家,主要从事统计学、微分几何和深度学习的交叉研究。
Vikas Singh 为 Zihang Meng 的博士生导师。Singh 为威斯康星大学麦迪逊分校生物统计系的教授,主要研究方向是图像分析,包括计算机视觉,机器学习和医学图像分析。
摘要:比较神经网络模型的功能行为,无论是在训练期间的单个网络,还是训练一段时间后的两个网络(或更多网络),这些是了解模型正在学习什么(以及它们没有学习什么)的重要步骤,同时也是确定规范化或提高效率的重要策略。
最近的研究已经取得了一些进展,例如研究者将视觉 transformers 与 CNN 进行比较,但系统地比较功能,特别是在不同的网络之间,仍然存在很多困难,通常的做法是一层一层地进行比较。
CCA(canonical correlation analysis)等方法在原则上适用,但迄今为止用的人很少。本文回顾了统计学中一个鲜为人知的概念,称为距离相关(及其部分变体),它被设计用来评估不同维度特征空间之间的相关性。该研究描述了将其部署到大规模模型的必要步骤,这为一系列应用打开了大门,包括调节一个深度模型,学习解耦表示,以及优化不同的模型,这些模型在应对对抗攻击时,鲁棒性更好。
最佳论文荣誉提名奖
与此同时,ECCV 2022 也公布了最佳论文荣誉提名奖,共有 2 篇论文获奖。
论文 1:Pose-NDF: Modelling Human Pose Manifolds with Neural Distance Fields
图源:Twitter@CSProfKGD
论文地址:https://virtualhumans.mpi-inf.mpg.de/posendf/
机构:图宾根大学、马克斯 · 普朗克研究所、Meta Reality Labs
摘要:本文提出了一种基于神经距离场 (NDFs) 的人体姿态连续模型:Pose-NDF。众所周知,姿态或动作先验对于生成逼真的新姿态非常重要,对从有噪声或局部观察重建精确的姿态也非常重要。Pose-NDF 学习一系列各种可能的姿态作为神经隐式函数的零水平集(zero level set),将 3D 建模隐式曲面的思想扩展到高维域 SO(3)^K,其中人体姿态由单个数据点定义,由 K 个四元数表示。由此得到的高维隐函数可以对输入姿态进行微分,因此可以通过在 3 维超球体集合上使用梯度下降将任意姿态投射到流形(manifold)上。
与之前基于 VAE 的人体姿态先验(将姿态空间转换为高斯分布)相比,该研究对真实姿态流形进行建模,以保留姿态之间的距离。该研究证明 PoseNDF 在各种下游任务中优于 SOTA 方法,包括从对真实世界的人体动作捕捉数据进行去噪、从遮挡数据中恢复姿态到从图像中重建 3D 姿态。此外,该研究表明,与基于 VAE 的方法相比,Pose-NDF 可生成更多样化的姿态。
论文 2:A Level Set Theory for Neural Implicit Evolution under Explicit Flows
图源:Twitter@CSProfKGD
论文地址:https://arxiv.org/pdf/2204.07159.pdf
机构:加州大学圣地亚哥分校
摘要:基于坐标的神经网络参数化隐式表面已经成为几何的有效表示,它们高效充当了参数水平集,其中零水平集定义了感兴趣的表面。研究者提出了一个框架,允许将为三角形网格定义的变形操作应用于这类表面。这些操作中的一些可以被视为在显式表面引起瞬时流场的能量最小化问题。他们的方法通过扩展水平集的经典理论,利用流场来实现参数化隐式表面变形。
此外,通过形式化与水平集理论的关联,研究者还为现有的可微表面提取和渲染方法得出一个统一的观点。他们认为这些方法偏离了理论,并展示了自身方法对表面平滑、平均曲率流、逆渲染和用户定义的隐式几何编辑等应用的改进。
经典论文:Koenderink 奖
Koenderink 奖旨在表彰计算机视觉领域的基础性贡献研究,获奖论文均为发表时间超过十年并经受住时间检验的研究。
本届的获奖论文是《Indoor Segmentation and Support Inference from RGBD Images》,于 2012 年发表,被引数超过了 4500。当时几位作者分别来自纽约大学、伊利诺伊大学厄巴纳 - 香槟分校和微软剑桥研究院。
该论文的获奖理由是「激励广泛的社区投入研究工作,为一个至今仍具有挑战性的计算机视觉问题开发出了新颖的解决方案。」
图源 Twitter@CSProfKGD
摘要:研究者提出了一种从 RGBD 图像中解释室内场景主要表面、对象和支撑关系的方法,将典型、通常杂乱无章的室内场景解析为地板、墙壁、支撑表面和对象区域。他们的主要兴趣之一是更好地了解 3D 提示如何以最佳方式为结构化 3D 解释提供信息。
此外,研究者创建了一个新颖的整数规划公式来推断物理支撑关系,提供了一个包含 1449 张 RGBD 图像的新数据集,捕获了 464 个具有详细注释的不同场景。实验证明了他们所提方法在复杂场景中推断支撑关系的能力,并验证了 3D 场景提示和推断支持能够实现更好的对象分割效果。
论文地址:https://cs.nyu.edu/~silberman/papers/indoor_seg_support.pdf
PAMI Everingham 奖
该奖项旨在纪念 Mark Everingham,鼓励其他人向他学习,推进整个计算机视觉社区进一步发展。PAMI Everingham 奖授予对计算机视觉社区做出无私贡献的研究者或研究团队,由 IEEE 计算机协会模式分析与机器智能(PAMI)技术委员会颁发。
本届获奖者是圣母大学计算机科学与工程副教授 Walter J. Scheirer,以表彰其对计算机视觉社区的长期杰出服务和奉献。
图源:Twitter@CSProfKGD
Walter J. Scheirer 的研究兴趣主要围绕识别问题展开,包括识别问题解决方案的表示和算法。他还对适用于视觉与语言的特征和基于学习的方法特别感兴趣,摆脱了识别任务长期以来的分割。这衍生出了一些有趣且非常规的方法,它们可以应用于 CV、ML 和人类生物识别等更广泛的 AI 领域。目前,他的工作专注于开集识别、视觉识别的极值理论模型以及受生物启发的学习算法。
Walter J. Scheirer
此外,大会还公布了 2021 和 2022 年度 ECVA 年轻研究者奖,分别由图宾根大学计算机科学教授 Zeynep Akata 和洛桑联邦理工学院计算机科学助理教授 Amir Zamir 摘得。