Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Xue Bin Peng获SIGGRAPH 2022最佳博士论文,太极胡渊鸣获提名

今年,SIGGRAPH 2022 首次设置了最佳论文奖,共有五篇。此外,备受瞩目的最佳博士论文也于近日揭晓。
近日,SIGGRAPH 公布了今年大会的一系列奖项。

ACM SIGGRAPH 是计算机图形学顶级国际学术会议,创立于 1974 年,已经发展成为由对计算机图形学和交互技术感兴趣的研究人员、艺术家、开发人员、电影制作人、科学家和商业人士组成的国际社区。

图片

今年的 SIGGRAPH 将于 8 月 8 日至 11 日在温哥华举行,同时也可线上参会。

最引人注目的是,SIGGRAPH 2022 首次引入了最佳论文和最佳论文荣誉奖项。获奖论文从数百篇论文中选出,需要在研究上具有突破,并对计算机图形学和交互技术的未来研究做出创新性贡献。

SIGGRAPH 最佳论文奖

1、Image Features Influence Reaction Time: A Learned Probabilistic Perceptual Model for Saccade Latency

图片

  • 论文链接:https://www.immersivecomputinglab.org/wp-content/uploads/2022/05/siggraph_2022_saccade_latency-2.pdf
  • 机构:纽约大学、普林斯顿大学、英伟达
  • 获奖理由:该研究提出了一个受神经学启发的感知模型来预测人眼反应延迟期,作为在屏幕上被观察图像特征的函数。该模型可以作为预测和改变电子竞技与 AR/VR 应用中反应延迟的指标。

2、CLIPasso: Semantically Aware Object Sketching

图片

  • 论文链接:https://arxiv.org/abs/2202.05822
  • 机构:洛桑联邦理工学院(EPFL)、特拉维夫大学、赫兹利亚跨学科研究中心(Reichman University)
  • 获奖理由:该研究提出了一种在不同抽象级别绘制对象的方法——CLIPasso。其中将草图定义为一组笔画,为了适应基于 CLIP 的感知损失,该研究使用可微光栅化器来优化笔画的参数。抽象程度是通过改变笔画的数量来控制的。

3、Instant Neural Graphics Primitives with a Multiresolution Hash Encoding

图片

  • 论文链接:https://nvlabs.github.io/instant-ngp/assets/mueller2022instant.pdf
  • 机构:英伟达
  • 获奖理由:神经网络作为图形基元的高质量表征出现,如符号距离函数、光场、纹理等。这项研究提出的方法可以在几秒钟内训练这些原语,在几毫秒内将其呈现,同时允许在图形算法的内部循环中使用它们。

4、Spelunking the Deep: Guaranteed Queries on General Neural Implicit Surfaces

图片

  • 论文链接:https://arxiv.org/abs/2202.02444
  • 机构:多伦多大学
  • 获奖理由:这项研究针对神经元隐式曲面,开发了光线投射、最近点、交点检测、空间层次构建等几何查询方法。其关键工具是范围分析,它自动计算神经网络输出的局部边界。即使在随机初始化的网络上,结果查询也能保证准确性。

5、DeepPhase: Periodic Autoencoders for Learning Motion Phase Manifolds

  • 项目链接:https://github.com/sebastianstarke/AI4Animat
  • 机构:爱丁堡大学、麻省理工学院
  • 获奖理由:学习身体动作的时空结构是角色动作合成的一个基本问题。这项研究提出了 Periodic Autoencoder,可以从非结构化的运动数据学习身体运动的时空结构。该网络产生一个多维相流形,有助于增强神经特征控制器和运动匹配的各种任务,包括不同的运动、基于风格的运动、舞蹈音乐或足球运球。

图片

图片

SIGGRAPH 最佳博士论文奖

此前,ACM SIGGRAPH 官方还公布了今年的最佳博士论文奖,由加州大学伯克利分校的博士 Xue Bin (Jason) Peng 摘得。Xue Bin Peng 已成为加拿大西蒙菲莎大学助理教授,同时他也是英伟达的一名研究科学家。

值得一提的是,他在 2017 年作为加拿大不列颠哥伦比亚大学硕士生时就获得过 SIGGRAPH SCA 最佳学生论文奖。

图片

左为他当时的导师 Michiel van de Panne,右为 Xue Bin (Jason) Peng。

此次,他的获奖博士论文题目为《Acquiring Motor Skills Through Motion Imitation and Reinforcement Learning》,其提出了一种机器人模仿学习的动作模仿技术。

图片

论文链接:https://digitalassets.lib.berkeley.edu/techreports/ucb/incoming/EECS-2021-267.pdf

下面简单介绍一下论文的内容。

作者提出了动作模仿技术,使智能体能够通过模仿演示学习大量高度动态和运动行为。智能体无需为每个感兴趣的技能设计控制器或奖励函数,只需接受预期技能所需要的一些运动示例片段即可。这样一来,作者提出的框架就可以合成一个紧密复刻目标行为的控制器。

在过程中,作者首先提出一个动作模仿框架,使模拟智能体能够模仿参考动作片段中的复杂行为,包括步行和奔跑等常见的运动技能以及杂技和武术等更复杂的运动行为。智能体学习产生稳健和栩栩如生的行为,它们在外观上与现实中演员做出的动作几乎难以区分。

最后,作者又开发了相关模型,它们能够重复使用并组合从动作模仿中学得的技能,以解决具有挑战性的下游任务。除了为模拟智能体开发控制器外,作者的方法还可以为现实世界运行的机器人合成控制器。他通过为双足和四足机器人的各种敏捷运动技能开发控制器,证明了自己方法的有效性。

此外,来自麻省理工学院(MIT)人工智能实验室,开源计算机图形库「太极」(Taichi)的作者胡渊鸣(Yuanming Hu)获得了最佳博士论文奖的荣誉提名。胡渊鸣 2017 年自清华姚班毕业,在 MIT 一年时间就完成硕士论文。博士毕业后胡渊鸣选择回国创业,成立了太极图形(Taichi Graphics)公司,任联合创始人、CEO。

图片

他的博士论文《The Taichi High-Performance and Differentiable Programming Language for Sparse and Quantized Visual Computing》介绍了专为开发高性能视觉计算系统而设计的命令式并行编程语言「太极」。

使用 Taichi,我们可以在稀疏计算上使用 1/10 的代码轻松实现 4.55 倍的性能提升,轻松开发 10 个可微分物理模拟器,并在单个 GPU 上模拟前所未有的 2.35 亿物质点法(MPM)粒子。

图片

论文链接:https://yuanming.taichi.graphics/publication/2021-taichi-thesis/taichi-thesis.pdf

此外,来自加拿大不列颠哥伦比亚大学的 Michiel van de Panne 获得了计算机图形学成就奖(他也是 Xue Bin Peng 的硕士导师)。MIT 的 Justin Solomon 获重要新研究员奖。

以及四位 ACM SIGGRAPH Academy 的新会员:Marc Alexa、Paolo Cignoni、Hans-Peter Seidel 和 Peter Shirley。

SIGGRAPH 其他奖项

计算机图形学成就奖

  • 获奖者:Michiel van de Panne
  • 机构:加拿大不列颠哥伦比亚大学

图片

个人主页:https://scholar.google.com/citations?user=lJwPbcUAAAAJ&hl=zh-CN

Michiel van de Panne 为加拿大不列颠哥伦比亚大学计算机科学教授,主要研究领域为深度强化学习、人体动作、机器人、运动规划、计算机动画、机器学习计算机图形学。

杰出新研究员奖

  • 获奖者:Justin Solomon
  • 机构:MIT

图片

个人主页:https://scholar.google.com/citations?user=pImSVwoAAAAJ&hl=zh-CN

Justin Solomon 为 MIT 助理教授,著有《Numerical Algorithms》一书。Solomon 主要研究领域为计算机图形学、几何处理、机器学习。博士毕业于斯坦福大学,师从 Leonidas Guibas 教授。

杰出教育者奖

  • 获奖者:Edward Angel
  • 机构:新墨西哥大学

Edward Angel 是新墨西哥大学(UNM)计算机科学系的名誉教授,是 UNM 第一位 Presidential Teaching Fellow,也是 ARTS Lab 的负责人。他于 1964 年获得加州理工学院博士学位,曾在加州大学伯克利分校、南加州大学和罗切斯特大学担任学术职务。 

图片

个人主页:https://www.cs.unm.edu/~angel/

Edward Angel 的研究兴趣是计算机图形学和科学可视化。他教授了 100 多门专业短期课程,包括在 SIGGRAPH 和 SIGGRAPH Asia 开设的 MOOC。

此外,杰出服务奖颁给了 Barbara Helfer,为 Immersion 公司的项目和质量保证经理。擅长项目管理、医学模拟软件和硬件、网络操作和应用、电视和远程教育。

数字艺术终身成就杰出艺术家奖颁给了 Vera Molnár,Molnár1924 年出生于匈牙利,是计算机和算法艺术的先驱之一。Molnár 是 2022 年第 59 届威尼斯双年展宣布的 213 位艺术家之一。

从业者奖颁给了 Pol Jeremias 以及 Iñigo Quilez。Pol Jeremias 是一名计算机图形工程师。他目前是 Netflix 的实时制作工具总监,以帮助创造动画电影制作工具的未来。Iñigo Quilez 在皮克斯创建了 Wondermoss,在业余时间创建了 Shadertoy.com。

参考内容:
https://www.siggraph.org/announcing-the-acm-siggraph-award-winners/
https://blog.siggraph.org/2022/07/siggraph-2022-technical-papers-awards-best-papers-and-honorable-mentions.html/
理论最佳论文奖
相关数据
深度强化学习技术

强化学习(Reinforcement Learning)是主体(agent)通过与周围环境的交互来进行学习。强化学习主体(RL agent)每采取一次动作(action)就会得到一个相应的数值奖励(numerical reward),这个奖励表示此次动作的好坏。通过与环境的交互,综合考虑过去的经验(exploitation)和未知的探索(exploration),强化学习主体通过试错的方式(trial and error)学会如何采取下一步的动作,而无需人类显性地告诉它该采取哪个动作。强化学习主体的目标是学习通过执行一系列的动作来最大化累积的奖励(accumulated reward)。 一般来说,真实世界中的强化学习问题包括巨大的状态空间(state spaces)和动作空间(action spaces),传统的强化学习方法会受限于维数灾难(curse of dimensionality)。借助于深度学习中的神经网络,强化学习主体可以直接从原始输入数据(如游戏图像)中提取和学习特征知识,然后根据提取出的特征信息再利用传统的强化学习算法(如TD Learning,SARSA,Q-Learnin)学习控制策略(如游戏策略),而无需人工提取或启发式学习特征。这种结合了深度学习的强化学习方法称为深度强化学习。

计算机图形技术

图像数据处理、计算机图像(英语:Computer Graphics)是指用计算机所创造的图形。更具体的说,就是在计算机上用专门的软件和硬件用来表现和控制图像数据。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

运动规划技术

运动规划(也被称为导航问题或钢琴搬运工的问题)是机器人的一个术语,用于将期望的运动任务分解成离散的运动,以满足运动的限制,并可能优化运动的某些方面。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

神经元技术

(人工)神经元是一个类比于生物神经元的数学计算模型,是神经网络的基本组成单元。 对于生物神经网络,每个神经元与其他神经元相连,当它“兴奋”时会向相连的神经元发送化学物质,从而改变这些神经元的电位;神经元的“兴奋”由其电位决定,当它的电位超过一个“阈值”(threshold)便会被激活,亦即“兴奋”。 目前最常见的神经元模型是基于1943年 Warren McCulloch 和 Walter Pitts提出的“M-P 神经元模型”。 在这个模型中,神经元通过带权重的连接接处理来自n个其他神经元的输入信号,其总输入值将与神经元的阈值进行比较,最后通过“激活函数”(activation function)产生神经元的输出。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

模仿学习技术

模仿学习(Imitation Learning)背后的原理是是通过隐含地给学习器关于这个世界的先验信息,就能执行、学习人类行为。在模仿学习任务中,智能体(agent)为了学习到策略从而尽可能像人类专家那样执行一种行为,它会寻找一种最佳的方式来使用由该专家示范的训练集(输入-输出对)。

暂无评论
暂无评论~