Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

材质界的ImageNet,大规模6维材质实拍数据库OpenSVBRDF发布|SIGGRAPH Asia

在计算图形学领域,材质外观刻画了真实物体与光线之间的复杂物理交互,通常可表达为随空间位置变化的双向反射分布函数(Spatially-Varying Bidirectional Reflectance Distribution Function,缩写为 SVBRDF)。它是视觉计算中不可或缺的组成部分,在文化遗产、电子商务、电子游戏和视觉特效等领域中有着广泛的应用。

在过去的二十年里,特别是深度学习流行后,学术界与工业界对高精度、多样化数字材质外观的需求不断增加。但由于技术上的挑战,采集大型数据库仍然十分困难,目前公开可用的材质外观实拍数据库的数量非常有限。

为此,浙江大学计算机辅助设计与图形系统全国重点实验室和杭州相芯科技有限公司的研究团队联合提出了一种新型集成系统,用于鲁棒、高质量和高效地采集平面各向异性材质外观。利用该系统,研究团队构建了 OpenSVBRDF 公开材质数据库

                               图 1:OpenSVBRDF 数据库中的部分材质样例展示。每一行同属一个材质类别。

这是第一个大规模 6 维 SVBRDF 的实测数据库,共有 1,000 个高质量平面样本,空间分辨率为 1,024×1,024,等效为超过 10 亿个实测 BRDF,涵盖了包括木材、织物和金属在内的 9 种类别。

数据库主页:https://opensvbrdf.github.io/

目前,数据库对非商业应用完全免费。只需要提交基本信息在网站上申请账号,通过审核后,即可直接下载包括 GGX 纹理贴图在内的相关数据和代码。相关研究论文《OpenSVBRDF: A Database of Measured Spatially-Varying Reflectance》已被计算机图形学顶级国际会议 ACM SIGGRAPH ASIA 2023 (Journal Track) 长文接收。

图片

论文主页:https://svbrdf.github.io/

技术挑战

直接采样方法在不同的光照和观察角度的组合下对物理材质进行密集测量 [Lawrence et al. 2006]。这么做虽然能够获得高质量且鲁棒的采集结果,但其效率很低,需要高昂的时间和存储成本。还有一种选择是基于先验知识的重建方法,可以从稀疏的采样数据中重建材质。这样虽然提高了效率,但当先验条件不满足时,其质量不尽人意 [Nam et al. 2018]。此外,当前SOTA光路复用技术,虽然达到了较高的采集效率和重建质量,但在处理如拉丝金属和抛光木皮等高度复杂材质时,算法还不够鲁棒 [Kang et al. 2018]。
图片
图 2:现有材质采集研究的代表工作。从左到右分别是 [Lawrence et al. 2006],[Nam et al. 2018] 以及 [Kang et al. 2018]。其中 [Kang et al. 2018] 为该团队在 2018 年发表于 ACM SIGGRAPH 的早期工作。

硬件

为高效扫描材质外观,研究团队搭建了一个接近半立方体的近场光照多路复用设备,其尺寸约为 70cm×70cm×40cm。样本被放置在一块透明的亚克力板上,可以通过抽屉滑轨快速滑入 / 滑出,来实现高吞吐率。该设备由 2 台机器视觉相机和 16,384 个高亮度 LED 组成,两台相机分别从大约 90 度(主视角)和 45 度(次视角)的角度拍摄样本,LED 分布在设备的 6 个面上。自主研发的高性能控制电路负责对每个 LED 进行独立亮度控制,并在硬件层面实现了光源投射和相机曝光的高精度同步。

图片

                                图 3:采集设备外观及两个视角下的照片。

采集重建

本系统创新性地结合了当前基于网络预测和基于微调两大类流行方法的优点,既能通过可微分光照图案优化来增加物理采集效率,又能通过微调来进一步提升最终结果质量,从而首次实现了对于平面 SVBRDF 的高鲁棒性、高质量以及高效率的采集重建。

具体来说,为了重建物理样本,研究者首先通过在均匀照明下匹配密集 SIFT 特征来建立两个相机视角之间的高精度对应关系。对于物理采集,首先将光照图案作为自编码器的一部分进行优化,实现高效采集。该自编码器自动学习如何基于两个视角的测量值来重建复杂外观,并将结果表示为中间神经表达。随后,根据主视角相机在 63 个等效线性光源下拍摄的照片,通过绘制图像误差对神经表达进行微调,以提高最终结果的质量和鲁棒性。图 3 展示了整个系统的处理流程。更多详细信息请参阅原文论文。

图片

                               图 4:整个系统的采集重建流程。

结果

研究人员共采集重建了 9 个类别,共计 1,000 个样本的外观,为了方便基于物理的标准绘制管线(PBR)直接使用,该研究还将神经表达拟合到了业界标准的各向异性 GGX BRDF 模型参数。图 5 展示了材质重建结果的分项参数 / 属性。每个样本存储了 193 张原始 HDR 照片(总大小 15GB)、中间神经表达(290MB),以及 6 张贴图,包括表示 GGX 参数的纹理贴图和透明度贴图(总大小 55MB)。神经表达和纹理贴图的空间分辨率均为 1,024×1,024。

图片

                                  图 5:材质重建结果分项属性(包括神经表达、漫反射率、高光反射率、粗糙度等)。

为了证明重建结果的正确性,研究人员将主视角下的照片(下图第一行)和神经表达绘制结果(下图第二行)进行了比较。定量误差(以 SSIM/PSNR 表达)标注在绘制图片的底部。由下图结果可见,本系统实现了高质量材质重建(SSIM>=0.97, PSNR>=34db)。

图片

                                 图 6:实拍照片和神经表达绘制结果在主视角下的对比。

为了进一步证明重建结果的视角域泛化性,研究人员将点光源照射下、两个视角所拍摄的照片和使用 GGX 拟合参数绘制的结果进行了比较,验证了重建结果的跨视角正确性。

图片

                                图 7:实拍照片和各向异性 GGX 拟合参数绘制结果在两个视角下的对比。

研究人员还展示了该数据库在材质生成、材质分类以及材质重建三方面的应用。具体细节请参考原始论文。

图片

                                     图 8:利用 OpenSVBRDF 训练 MaterialGAN 来实现材质生成与插值

图片

                                    图 9:利用 OpenSVBRDF 训练主动光照以提升材质分类精度。

图片

                                  图 10:利用 OpenSVBRDF 来提高基于单点采样(左)和光路多路复用(右)的 BRDF 重建质量。

展望

研究人员将努力扩展现有数据库,增加展现多样性外观的材质样本。未来,他们还计划建立同时包含材质外观和几何形状的大规模高精度实测物体数据库。此外,研究人员将基于 OpenSVBRDF 设计在材质估计、分类和生成等方向上的公开 Benchmark,通过客观定量的标准测试,为推动相关研究的未来发展提供坚实的数据保障。
产业OpenSVBRDF
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

计算机图形技术

图像数据处理、计算机图像(英语:Computer Graphics)是指用计算机所创造的图形。更具体的说,就是在计算机上用专门的软件和硬件用来表现和控制图像数据。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

插值技术

数学的数值分析领域中,内插或称插值(英语:interpolation)是一种通过已知的、离散的数据点,在范围内推求新数据点的过程或方法。求解科学和工程的问题时,通常有许多数据点借由采样、实验等方法获得,这些数据可能代表了有限个数值函数,其中自变量的值。而根据这些数据,我们往往希望得到一个连续的函数(也就是曲线);或者更密集的离散方程与已知数据互相吻合,这个过程叫做拟合。

先验知识技术

先验(apriori ;也译作 先天)在拉丁文中指“来自先前的东西”,或稍稍引申指“在经验之前”。近代西方传统中,认为先验指无需经验或先于经验获得的知识。先验知识不依赖于经验,比如,数学式子2+2=4;恒真命题“所有的单身汉一定没有结婚”;以及来自纯粹理性的推断“本体论证明”

5G技术

第五代移动通信系统(5th generation mobile networks),简称5G,是4G系统后的延伸。美国时间2018年6月13日,圣地牙哥3GPP会议订下第一个国际5G标准。由于物理波段的限制,5G 的网络也将会与其他通信技术并用,包含长距离的其他传统电信波段。

机器视觉技术

机器视觉(Machine Vision,MV)是一种为自动化检测、过程控制和机器人导航等应用提供基于图像的自动检测和分析的技术和方法,通常用于工业领域。

相芯科技机构

相芯科技创立于2016年,以“元宇宙搭建者”为发展愿景,以“创造更真实的数字世界”为使命,专注于计算机图形学和人工智能技术的深度融合,致力于XR技术的创新和应用。其中全球独创的虚拟数字人引擎和超写实数字物平台,在逾千家国内外企业得到应用

http://www.faceunity.com
推荐文章
暂无评论
暂无评论~