Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

英伟达摘两篇最佳论文、浙大周昆获时间检验奖,SIGGRAPH 2024奖项出炉

今日,图形学领域最具权威的和影响力的国际顶会 ACM SIGGRAPH 发布了本年度的最佳论文、荣誉提名和时间检验奖。

图片

自 50 年前举办第一次会议以来, Technical Papers program 一直是 SIGGRAPH 的核心。众多研究传播和讨论了动画、模拟、成像、几何、建模、渲染、人机交互、触觉、制造、机器人、可视化、音频、光学、编程语言、沉浸式体验和视觉计算机器学习等方面创新学术工作。

继 SIGGRAPH 2022 和 SIGGRAPH 2023 之后,SIGGRAPH 2024 继续接收两个综合论文 track 的投稿:期刊(ACM Transactions on Graphics)和会议。

其中,每年的最佳论文和荣誉提名奖授予那些「计算机图形学和交互技术未来研究做出新贡献的突出性研究。

SIGGRAPH 2024 从数百篇投稿论文中评选出了 5 篇最佳论文、12 篇最佳论文荣誉提名以及 4 篇时间检验奖论文。PS:大家熟悉的高斯泼贱就是去年的最佳论文之一。

佳论文及荣誉提名奖

论文 1:From Microfacets to Participating Media: A Unified Theory of Light Transport With Stochastic Geometry
  • 作者:Dario Seyb, Eugene d’Eon, Benedikt Bitterli, Wojciech Jarosz
  • 机构:达特茅斯学院、英伟达
  • 论文地址:https://darioseyb.com/pdf/stochastic-implicit-light-transport.pdf

图片

论文简介:该研究推导出随机隐式表面上的光传输理论、并提出一个能够表达确定性几何、微表面、参与介质,以及令人兴奋的新连续体的几何模型。该模型原生支持空间相关性,这是大多数现有随机模型所缺少的。

论文 2:Walkin’ Robin: Walk on Stars With Robin Boundary Conditions
  • 作者:Bailey Miller, Rohan Sawhney, Keenan Crane, Ioannis Gkioulekas
  • 机构:CMU、英伟达
  • 论文地址:http://www.rohansawhney.io/WoStRobin.pdf

图片

论文简介:该研究开发了一种无网格蒙特卡罗方法,用于求解边值问题,例如具有狄利克雷、诺依曼和罗宾边界条件的泊松方程。与传统的 PDE 求解器不同,该方法不需要体积网格划分或全局求解。它具有稳健性、并行性、可扩展至复杂的几何形状,并且允许依赖于视图的评估。

论文 3:Repulsive Shells
  • 作者:Josua Sassen, Henrik Schumacher, Martin Rumpf, Keenan Crane
  • 机构:波恩大学、巴黎 - 萨克雷高等师范学校、佐治亚大学、CMU

论文简介:形状空间是对几何数据进行非线性插值、外推和平均的强大工具,但以前的形状空间允许几何图形以非物理方式自相交。该研究引入了一个形状空间,其中几何形状自然地避免相交,并且可以在细化下收敛时防止碰撞。

论文 4:Lightning-Fast Method of Fundamental Solutions
  • 作者:Jiong Chen, Florian Schäfer, Mathieu Desbrun
  • 机构:INRIA、佐治亚理工学院、巴黎综合理工学院
  • 论文地址:http://www.geometry.caltech.edu/pubs/CSD24.pdf
图片

论文简介:该研究提出了一种基于逆 Cholesky 分解的变分预处理器,以提高求解边界积分方程离散化密集系统的效率,有效解决基于边界的方法中常见的可扩展性问题。

论文 5:Robust Containment Queries Over Collections of Rational Parametric Curves via Generalized Winding Numbers
  • 作者:Jacob Spainhour, David Gunderman, Kenneth Weiss
  • 机构:科罗拉多大学博尔德分校、印第安纳大学医学院、劳伦斯利弗莫尔国家实验室
  • 论文地址:https://arxiv.org/pdf/2403.17371

图片

论文简介:该研究使用数值稳定算法将广义缠绕数理论扩展到有理参数曲线的非结构化集合,从而允许在任意位置对非水密和自相交形状进行稳健且准确的 containment 分类。

荣誉提名

论文 1:Solid Knitting

  • 作者:Yuichi Hirose、Mark Gillespie、Angelica M. Bonilla Fominaya、James McCann
  • 机构:CMU
  • 链接:https://markjgillespie.com/Research/solid-knitting/index.html

论文 2:PEA-PODs: Perceptual Evaluation of Algorithms for Power Optimization in XR Displays

  • 作者:Kenneth Chen、Thomas Wan、Nathan Matsuda、Ajit Ninan、 Alexandre Chapiro、Qi Sun
  • 机构:纽约大学、Meta
  • 链接:https://www.immersivecomputinglab.org/wp-content/uploads/2024/06/pea_pod_paper.pdf

论文 3:CLAY: A Controllable Large-scale Generative Model for Creating High-quality 3D Assets

  • 作者:Longwen Zhang、Ziyu Wang、Qixuan Zhang、Qiwei Qiu、Anqi Pang、Haoran Jiang、Wei Yang、Lan Xu、Jingyi Yu
  • 机构:上海科技大学、影眸科技、华中科技大学
  • 链接:https://github.com/CLAY-3D/OpenCLAY

论文 4:DressCode: Autoregressively Sewing and Generating Garments From Text Guidance

  • 作者:Kai He、Kaixin Yao、Qixuan Zhang、Jingyi Yu、Lingjie Liu、Lan Xu
  • 机构:上海科技大学、宾夕法尼亚大学、影眸科技
  • 链接:https://arxiv.org/html/2401.16465v1

论文 5:Bilateral Guided Radiance Field Processing

  • 作者:Yuehao Wang、Chaoyi Wang、Bingchen Gong、Tianfan Xue
  • 机构:香港中文大学
  • 链接:https://arxiv.org/pdf/2406.00448

论文 6:Fabric Tessellation: Realizing Freeform Surfaces by Smocking

  • 作者:Aviv Segall、Jing Ren、Amir Vaxman、Olga Sorkine-Hornung
  • 机构:苏黎世联邦理工学院、爱丁堡大学
  • 链接:https://igl.ethz.ch/projects/3dsmocking/3dsmocking_paper.pdf

论文 7:Capacitive Touch Sensing on General 3D Surfaces

  • 作者:Gianpaolo Palma、Narges Pourjafarian、Jürgen Steimle、Paolo Cignoni
  • 机构:CNR ISTI、萨尔大学
  • 链接:https://s2024.conference-program.org/presentation/?id=papers_637&sess=sess112

论文 8:SMERF: Streamable Memory Efficient Radiance Fields for Real-time Large-scene Exploration

  • 作者:Daniel Duckworth、Peter Hedman、Christian Reiser、Peter Zhizhin、 Jean-François Thibert、Mario Lučić、Richard Szeliski、Jonathan T. Barron
  • 机构:谷歌 DeepMind、谷歌研究院、谷歌 AR/VR 团队
  • 链接:https://s2024.conference-program.org/presentation/?id=papers_727&sess=sess111

论文 9:Spin-It Faster: Quadrics Solve All Topology Optimization Problems That Depend Only on Mass Moments

  • 作者:Christian Hafner、Mickaël Ly、Chris Wojtan
  • 机构:奥地利科学技术学院 (ISTA) 
    链接:https://s2024.conference-program.org/presentation/?id=papers_728&sess=sess118

论文 10:Ray Tracing Harmonic Functions

  • 作者:Mark Gillespie、Denise Yang、Mario Botsch、Keenan Crane
  • 机构:CMU、Pixar、多特蒙德工业大学
  • 链接:https://s2024.conference-program.org/presentation/?id=papers_786&sess=sess128

论文 11:Seamless Parametrization in Penner Coordinates

  • 作者:Ryan Capouellez、Denis Zorin
  • 机构:纽约大学
  • 链接:https://s2024.conference-program.org/presentation/?id=papers_787&sess=sess107

论文 12:Theory of Human Tetrachromatic Color Experience and Printing

  • 作者:Jessica Lee、Nicholas Jennings、Varun Srivastava, Ren Ng
  • 机构:加州大学伯克利分校
  • 链接:https://s2024.conference-program.org/presentation/?id=papers_1147&sess=sess135

时间检验奖

ACM SIGGRAPH 时间检验奖颁发给过去十年对计算机图形学和交互技术产生重大且长远影响的论文。今年是设立该奖项的第二年,考虑了 2012 年至 2014 年期间在 SIGGRAPH 会议上发表的论文。

以下四篇论文获得了 SIGGRAPH 2024 时间检验奖:

论文 1:3D Shape Regression for Real-Time Facial Animation (2013)

图片

  • 作者:Chen Cao、Yanlin Weng、Stephen Lin、Kun Zhou(周昆)
  • 机构:浙江大学、微软亚研
  • 链接:https://dl.acm.org/doi/10.1145/2461912.2462012

摘要:本文介绍了一种使用单目 RGB 相机进行实时、精确 3D 面部跟踪和动作捕捉的开创性方法,开辟了在移动设备上创建逼真面部动画的方法。

周昆,2002 年获浙江大学工学博士学位,现为浙江大学计算机学院教授、国际计算机学会会士 (ACM Fellow),国际电气电子工程师协会会士 (IEEE Fellow)。

周昆的研究领域为计算机图形学、计算机视觉人机交互虚拟现实。在 ACM 和 IEEE 汇刊上发表论文 100 余篇,论文引用 1 万余次,获得发明专利 60 余项。他曾获得 2009 年 NVIDIA Professor Partnership Award、2010 年中国计算机图形学杰出奖、2011 年中国青年科技奖、2011 年麻省理工学院《技术评论》全球杰出青年创新人物奖 (MIT TR35 Award)、2016 年陈嘉庚青年科学奖、2021 年科学探索奖、2022 年亚洲图形学会杰出技术贡献奖。

论文 2:Femto-Photography: Capturing and Visualizing the Propagation of Light (2013) 
  • 作者:Andreas Velten、Di Wu, Adrián Jarabo、Belén Masiá、Christopher Barsi、Chinmaya Joshi、Everett Lawson、Moungi Bawendi、Diego Gutierrez、Ramesh Raskar
  • 机构:MIT 媒体实验室、威斯康星大学麦迪逊分校、清华大学、萨拉戈萨大学等
  • 链接:https://dl.acm.org/doi/10.1145/2461912.2461928

摘要:本文介绍了一种用于捕捉光传输的系统。该系统可以制作反射和散射等常见现象的慢动作视频,从而为计算机图形学的核心概念创建前所未有的可视化效果。

论文3: Robust Inside-Outside Segmentation Using Generalized Winding Numbers (2013)
图片
  • 作者:Alec Jacobson、Ladislav Kavan、Olga Sorkine-Hornung
  • 机构:苏黎世联邦理工学院、宾夕法尼亚大学
  • 链接:https://dl.acm.org/doi/10.1145/2461912.2461916

摘要:本文定义了一个用于识别 3D 网格内部体积的稳健算子,并已经成为处理网格的标准工具箱的关键组件,例如用于网格之间的布尔运算和四面体化算法。

论文4: How do Humans Sketch Objects? (2012)图片
  • 作者:Mathias Eitz、James Hays、Marc Alexa
  • 机构:柏林工业大学、bulangdaxue
  • 链接:https://dl.acm.org/doi/10.1145/2185520.2185540

摘要:本文介绍了一个独一无二的数据库,其中包含 20,000 个物体草图,并演示了如何使用该数据库。该数据库在推动草图生成、清理、识别和检索等广泛领域的研究方面发挥了重要作用。

博客地址:
https://blog.siggraph.org/2024/06/siggraph-2024-technical-papers-awards-best-papers-honorable-mentions-and-test-of-time.html/
产业SIGGRAPH 2024
1
相关数据
清华大学机构

清华大学(Tsinghua University),简称“清华”,由中华人民共和国教育部直属,中央直管副部级建制,位列“211工程”、“985工程”、“世界一流大学和一流学科”,入选“基础学科拔尖学生培养试验计划”、“高等学校创新能力提升计划”、“高等学校学科创新引智计划”,为九校联盟、中国大学校长联谊会、东亚研究型大学协会、亚洲大学联盟、环太平洋大学联盟、清华—剑桥—MIT低碳大学联盟成员,被誉为“红色工程师的摇篮”。 清华大学的前身清华学堂始建于1911年,因水木清华而得名,是清政府设立的留美预备学校,其建校的资金源于1908年美国退还的部分庚子赔款。1912年更名为清华学校。1928年更名为国立清华大学。1937年抗日战争全面爆发后南迁长沙,与北京大学、南开大学组建国立长沙临时大学,1938年迁至昆明改名为国立西南联合大学。1946年迁回清华园。1949年中华人民共和国成立,清华大学进入了新的发展阶段。1952年全国高等学校院系调整后成为多科性工业大学。1978年以来逐步恢复和发展为综合性的研究型大学。

http://www.tsinghua.edu.cn/
相关技术
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
计算机图形技术

图像数据处理、计算机图像(英语:Computer Graphics)是指用计算机所创造的图形。更具体的说,就是在计算机上用专门的软件和硬件用来表现和控制图像数据。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

收敛技术

在数学,计算机科学和逻辑学中,收敛指的是不同的变换序列在有限的时间内达到一个结论(变换终止),并且得出的结论是独立于达到它的路径(他们是融合的)。 通俗来说,收敛通常是指在训练期间达到的一种状态,即经过一定次数的迭代之后,训练损失和验证损失在每次迭代中的变化都非常小或根本没有变化。也就是说,如果采用当前数据进行额外的训练将无法改进模型,模型即达到收敛状态。在深度学习中,损失值有时会在最终下降之前的多次迭代中保持不变或几乎保持不变,暂时形成收敛的假象。

虚拟现实技术

虚拟现实,简称虚拟技术,也称虚拟环境,是利用电脑模拟产生一个三维空间的虚拟世界,提供用户关于视觉等感官的模拟,让用户感觉仿佛身历其境,可以及时、没有限制地观察三维空间内的事物。用户进行位置移动时,电脑可以立即进行复杂的运算,将精确的三维世界视频传回产生临场感。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

插值技术

数学的数值分析领域中,内插或称插值(英语:interpolation)是一种通过已知的、离散的数据点,在范围内推求新数据点的过程或方法。求解科学和工程的问题时,通常有许多数据点借由采样、实验等方法获得,这些数据可能代表了有限个数值函数,其中自变量的值。而根据这些数据,我们往往希望得到一个连续的函数(也就是曲线);或者更密集的离散方程与已知数据互相吻合,这个过程叫做拟合。

蒙特卡罗方法技术

蒙特卡罗方法,也称统计模拟方法,是1940年代中期由于科学技术的发展和电子计算机的发明,而提出的一种以概率统计理论为指导的数值计算方法。是指使用随机数来解决很多计算问题的方法。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

图生成技术

根据给定信息信息生成图表。

暂无评论
暂无评论~