2023/05/09 15:50

CVPR 2023 | LED阵列+LCD面板=3072个投影仪：浙大-相芯联合团队实现复杂物体高质量数字化建模

如何数字化真实世界中的复杂物体是计算机图形学与计算机视觉中的经典问题，在文化遗产、电子商务和电影特效等诸多领域有着广泛的应用。高精度数字化结果由三维几何与高维外观组成，能在虚拟世界中高保真地重现出本体在任意光照和视角下的「流光溢彩」。
为了提升数字化采集中的信噪比，浙江大学计算机辅助设计与图形系统全国重点实验室和杭州相芯科技有限公司的研究团队首次提出了能同时采集几何与外观信息的轻量级高维结构光光源，通过 LED 阵列与 LCD 面板组合，等效构建了 3072 个分辨率约为 320x320 的投影仪，仅用单个相机即可实现 0.27mm 的几何重建精度以及 SSIM=0.94 的外观重建精度，在复杂物体重建实验中超越了 SOTA。相关研究论文已被 CVPR 2023 接收。

论文主页：https://svbrdf.github.io/

使用新型结构光的采集过程及重建结果展示。

背景

结构光在高质量数字化中被广泛应用，通过对空间域编解码获取几何信息，通过对角度域编解码获取外观信息。结构光能有效地探测物理域并获取与目标高度相关的测量值，最终获得高信噪比的精确重建结果。

对于几何扫描，空间结构光方法将精心设计的光照图案投射到三维空间中来区分不同光线，从而实现精确的三角化测量。主流的高精度几何扫描仪都基于这一原理，已形成了相当成熟的商用市场。代表性的产品包括加拿大 Creaform 的 HandySCAN 3D（下图 1）、卢森堡 Artec3D 的 Spider 和中国先临的 EinScan。

对于外观采集，角度结构光方法编程控制每个光源在不同时刻的亮度，相机测量值可等效为 BRDF（双向反射分布函数）切片与光照图案在角度域上的点积，并以此为依据对复杂外观进行精准推断。代表性工作包括专业级高密度光源采集系统 [Kang et al. 2019]（图 1），以及机器之心之前报道过的手持式可微分材质扫描仪 [Ma et al. 2021]。

图 1：基于结构光采集的代表性产品 / 系统。左图为加拿大 Creaform 的 HandySCAN 3D 几何扫描仪，右图为本团队发表于 SIGGRAPH Asia 的专业级非平面外观采集系统 [Kang et al. 2019]。

挑战

虽然结构光已经能单独采集高精度几何或者外观，但如何将其应用到高质量几何与外观的联合采集依然存在困难。

一方面，直接同时使用空间和角度结构光会导致硬件设备笨重 [Weinmann et al. 2011]，并且这两类光源会竞争安装位置，导致几何与外观采样覆盖的完整性无法兼得。

另一方面，现有的联合采集工作通常只使用一种结构光采集几何或材质，对剩余未知量进行被动光照采集，导致了次优的重建结果。例如 [Holroyd et al. 2010] 使用投影仪获取高质量几何，但不得不依靠强先验来求解角度域上采样不足的外观。[Kang et al. 2019] 在角度域内密集采样外观，然而其被动式几何重建的质量受限于对象表面空间特征分布的丰富程度。

硬件

为了解决上述挑战，团队首先提出了用于高质量联合采集三维几何和高维外观的统一结构光光源。这个轻量级的光源原型由 LED 阵列和 LCD 遮罩组成，本质上是可以视为一个受限的光场投影仪，它可主动探测空间和角度域（下图 2）。

对于几何采集，每个 LED 将一组遮罩图案（mask pattern）投射到空间中以编码形状信息。对于外观采集，相同的 LED 阵列在编程后产生不同的光照图案（light pattern），穿过被设置成全透明的 LCD 遮罩来采样随光照角度变化的外观。该原型有助于捕捉足够多的物理信息，即使从单个视角也能高保真地恢复出每个像素的深度和外观。

图 2：团队自研的结构光硬件原型（图左），包括 64x48 的 LED 阵列、一个 1920x1080 分辨率的 LCD 遮罩（通过对普通液晶显示器拆卸后得到）和一台相机。使用单个 LED 能投影一组遮罩图案来采集三维几何（图中），而多个 LED 能投影光照图案穿过全透明遮罩来采集高维外观（图右）。

具体来说，LED 阵列共有 64x48 个高亮 RGB LED，总功率约 240W。LCD 面板分辨率为 1920x1080，拆卸自一台使用普通 IPS 液晶显示器。相机为一台 4500 万像素的 Canon EOS R5。整个采集系统由自研电路进行控制：电路负责对每个 LED 进行独立亮度设置，并在硬件层面对光源投射和相机曝光进行高精度同步。

软件

为了高效高质量地联合采集几何与外观，需要确定使用什么样的遮罩图案与光照图案来编程 LCD 与 LED。对此，研究人员建立了可微分联合采集管线来自动优化遮罩与光照图案，从而充分利用新型结构光的硬件采样能力。

对于几何采集，研究人员为每个 LED 独立学习出一组遮罩图案（18 张），这里的目标是最小化沿任意相机射线的深度不确定性。研究人员还利用了造成遮罩图案投影轻微失焦的物理卷积过程，来编码更丰富的空间信息进行深度消歧。通过使用多个 LED 投影不同的遮罩图案，能改善最终几何结果的完整性和精度。

对于外观采集，光照图案（32 张）作为自编码器的一部分进行优化，该自编码器学习如何捕捉复杂外观的本质 [Kang et al. 2019]。随后使用上述光照图案来获取测量值，并以此为依据优化出高维外观。在这个过程中，已重建的三维几何也会被考虑（用来模拟阴影等由于几何所造成的现象），从而提高外观结果的质量。有关详情请参见论文原文。

图 3：整个系统的采集重建流程.

结果

研究人员使用自研原型系统采集重建了多种复杂物体的几何与外观。下图 4 对比了实拍照片、本系统的几何与外观重建结果以及相关 SOTA 方法的结果。

图 4：实拍照片、本系统的采集重建结果以及相关 SOTA 方法之间的比较。外观质量用 SSIM 衡量，几何质量以精度（缩写为 A）和完整性（缩写为 C）比例来表示。数值越大，质量越高。

本系统生成的外观结果使用工业界标准的各向异性 GGX BRDF 参数纹理来表示，可以由任意基于物理的绘制器（PBR）读取并绘制出全新光照和视角下的图片。下图 5 展示了外观重建结果的分项参数。

图 5：外观重建结果的分项参数（漫反射率、高光反射率、法向量和粗糙度）。

展望

研究人员希望该研究能够抛砖引玉，启发一系列高维结构光方向上的未来工作（例如发展质量可控的自适应采集策略，与最先进光场投影技术结合来研制首个手持式几何与外观联合扫描仪等等），从而进一步推动高质量物体数字化的发展。

参考文献

1.Kang, K., Xie, C., He, C., Yi, M., Gu, M., Chen, Z., Zhou, K. and Wu, H., 2019. Learning efficient illumination multiplexing for joint capture of reflectance and shape. ACM Trans. Graph., 38 (6), pp.165-1.

2.Ma, X., Kang, K., Zhu, R., Wu, H. and Zhou, K., 2021. Free-form scanning of non-planar appearance with neural trace photography. ACM Transactions on Graphics (TOG), 40 (4), pp.1-13.

3.Weinmann, M., Schwartz, C., Ruiters, R. and Klein, R., 2011, May. A multi-camera, multi-projector super-resolution framework for structured light. In 2011 International Conference on 3D Imaging, Modeling, Processing, Visualization and Transmission (pp. 397-404). IEEE.

4.Holroyd, M., Lawrence, J. and Zickler, T., 2010. A coaxial optical scanner for synchronous acquisition of 3D geometry and surface reflectance. ACM Transactions on Graphics (TOG), 29 (4), pp.1-12.

理论数字化建模

相关数据

计算机图形技术

图像数据处理、计算机图像（英语：Computer Graphics）是指用计算机所创造的图形。更具体的说，就是在计算机上用专门的软件和硬件用来表现和控制图像数据。

来源：维基百科

参数技术

在数学和统计学裡，参数（英语：parameter）是使用通用变量来建立函数和变量之间关系（当这种关系很难用方程来阐述时）的一个数量。

来源：维基百科

计算机视觉技术

计算机视觉（CV）是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

来源：机器之心

上采样技术

在数字信号处理中，上采样、扩展和内插是与多速率数字信号处理系统中的重采样过程相关的术语。上采样可以与扩展同义，也可以描述整个扩展和过滤（插值）过程。

来源：维基百科

本体技术

在计算机科学和信息科学中，本体包括表示、正式命名和定义概念，数据，实体之间的类别，属性和关系，并在一个，多个或所有域实例中。

来源：wiki

结构光技术

结构光是将已知图案（通常是栅格或水平条）投射到场景上的过程。这些物体在撞击表面时变形的信息来在视觉系统中计算场景中物体的深度和表面信息，如在结构光3D扫描器中使用的。结构光是一组由投影仪和摄像头组成的系统结构。用投影仪投射特定的光信息到物体表面后及背景后，由摄像头采集。根据物体造成的光信号的变化来计算物体的位置和深度等信息，进而复原整个三维空间。

来源：wiki

相芯科技机构

相芯科技创立于2016年，以“元宇宙搭建者”为发展愿景，以“创造更真实的数字世界”为使命，专注于计算机图形学和人工智能技术的深度融合，致力于XR技术的创新和应用。其中全球独创的虚拟数字人引擎和超写实数字物平台，在逾千家国内外企业得到应用

http://www.faceunity.com