基于人工神经网络 (ANN) 的人工智能工具正在越来越多的环境中被引入,帮助人类更快、更有效地解决许多问题。虽然这些算法中的大多数都在传统的数字设备和计算机上运行,但科学家一直在探索在替代平台(例如衍射光学设备)上运行它们的潜力。
科学家已经探索了一系列传统数字硬件的替代方法来实现人工神经网络,包括光学神经网络和衍射深度神经网络。在微波和太赫兹频率下工作的欺骗性表面等离子体激元(Spoof surface plasmon polariton,SSPP)波导可以提供低串扰、低辐射损耗和易于集成,并且在开发人工神经网络的替代技术中具有潜在用途。
东南大学的研究人员报告了一种可编程的表面等离子体神经网络,它基于 SSPP 平台,可以检测和处理微波。该方法使用与变容二极管集成的平行耦合 SSPP 单元。单元的权重系数可以通过调节变容二极管的电压来调整,神经网络的激活函数可以通过检测输入强度并将阈值反馈给放大器来编程。
该研究以「Programmable surface plasmonic neural networks for microwave detection and processing」为题,于 2023 年 4 月 20 日发布在《Nature Electronics》。
人工神经网络 (ANN) 是受人脑信号处理启发的计算网络模型。它们已被证明在计算机视觉、语音识别、自然语言处理、图像去噪、化学和医学等领域提供强大的功能。这种深度神经网络 (DNN) 架构包括卷积神经网络和递归神经网络。网络算法的工作也结合了不同人工智能电路和芯片的开发,以提高计算速度和降低功耗。例如,最近开发了一种硬件实现的忆阻器人工智能芯片,它集成了 8 个 2048 单元忆阻器阵列,并提供高效的并行计算。
纳米光子电路也可用于实施人工神经网络。这些光学神经网络使用集成光波导、有源光学器件和光子张量核心来执行必要的矩阵乘法。基于惠更斯原理和每个神经元可调谐相变的全光衍射 DNN 架构也已被开发出来,可以以光速计算并可以操纵电磁波。受这种方法的启发,科学家已经创建了一种基于多层信息超表面的可重新编程的衍射 DNN,它可以调制电磁波用于智能计算,并可用于无线通信。
然而,这种衍射 DNN 是没有非线性激活函数的线性模型,这限制了它们的潜在应用。具有非线性的光学神经网络已通过算法或结构硬件创建,但这些提供有限的可编程性和性能。
欺骗性表面等离子体激元(SSPP)是微波和太赫兹频率的表面波,受结构化金属表面限制并模仿天然表面等离子体激元的特性。SSPP 具有很强的场增强作用,可以通过操纵色散行为自由控制电磁波。薄而灵活的 SSPP 波导已经开发出来,可以集成等离子体装置。并且,SSPP 信号可以在密集网络中传输,其中通道之间的串扰受到抑制。
此外,科学家还创建了 SSPP 设备,包括耦合器、功率分配器和滤波器。特别是,SSPP 耦合器可以通过改变 SSPP 波导上变容二极管的偏置电压来实时自由地控制 SSPP 信号。因此,SSPP 波导有可能在大规模和可重新编程的 ANN 中用作强大的互连。
由东南大学崔铁军院士领导的研究团队最近开发了一种基于 SSPP 的新型可编程神经网络,这种新提出的表面等离子体神经网络 (SPNN) 架构,可以检测和处理微波,这可能对无线通信等技术应用有促进作用。
图示:可编程 SSPP 单元、超单元和部分连接的 SPNN。(来源:论文)
「在用于实施人工神经网络的数字硬件研究中,光学神经网络和衍射深度神经网络最近成为有前途的解决方案。」该研究的研究人员之一 Ma Qian 说,「以前针对光学神经网络的研究表明,同时进行高级可编程性和非线性计算可能很难实现。因此,这些 ONN 设备通常仅限于没有可编程性的特定任务,或者仅适用于简单的识别任务。(即线性问题)」
这些研究人员近期工作的主要目标是进一步提高神经网络在复杂非线性问题上的性能,同时使它们适用于广泛的应用。他们提出的架构 SPNN 可以针对不同的权重配置进行编程,这意味着它在理论上应该可以很好地概括不同的任务。
该团队多年来一直致力于开发可编程 SSPP 器件,并探索其在电磁调节方面的应用。受之前发现的启发,他们着手开发一种基于这些等离子设备之一的具有可编程权重和激活功能的神经网络。原则上,他们提出的架构可以实现惊人的处理速度,接近光速。
「SPNN 是以逐层方式创建的,其中每一层都由多个可编程的 SSPP 超级单元组成。」Ma Qian 解释道,「每个具有四进四出全连接网络的超级单元是由八个可编程 SSPP 单元组成的。我们设计了三维复合结构,巧妙地实现了全连接的特性。」
研究人员用来创建平台的每个可编程超级电池都由一个 SSPP 功率分配器和一个耦合器组成。这种独特的设计使其能够稳健地操纵电磁波,然后使用它们来实现等离子体神经网络。
图示:模拟的 SSPP 单元离散度和传输参数。(来源:论文)
「神经网络的权重参数是通过改变加载在耦合器上的变容二极管的电压来调整的。」Ma Qian 说,「更重要的是,可以通过使用检测器检测输入强度并将阈值反馈给放大器来定制激活函数。SPNN 可以执行图像分类任务,也可以用于创建无线通信系统来解码和恢复图像。」
该团队的 SPNN 架构最显著的特点是其可编程权重和激活函数,这可以使其更容易应用于广泛的任务。之前的一些工作使用相变材料实现了可编程神经网络,但发现这种方法会导致动态范围有限。
「虽然衍射深度神经网络可以灵活地调制和处理电磁波,但它们缺乏非线性激活函数也限制了它们处理更复杂问题的潜力,例如异或(XOR)逻辑运算。」Ma Qian 说。
「我们提出的基于数字表面等离子体器件的可编程 SPNN 可能会为该领域带来一些新思路。可编程 SSPP 器件可以控制电磁波,架构简单,成本低,效率高,这对于构建可编程神经网络具有潜力。此外,我们可以在检测端口和放大器偏置电路之间使用闭环反馈系统来实现可编程激活功能。」
未来,该研究团队开发的SPNN可用于大规模检测和处理微波,从而有可能为5G和6G无线通信开辟新的可能性。与过去推出的一些基于 ANN 的微波检测解决方案相比,SPNN 可以直接以接近光速的速度调制电磁波。
他们的论文中表明,相同的架构在其他任务上也表现良好,例如以高精度对手写数字进行分类。在接下来的工作中,他们计划在其他任务上评估 SPNN,同时增加其复杂性,以便它可以解决更高级的问题。
「这项工作中实现的原型是基于一个 4×4 的完全神经网络,它相对较低,」Ma Qian 补充道, 「SPNN 结构类似于电路系统,这意味着可以在不增加设备占地面积的情况下扩大 SPNN 层的规模。例如,可以创建立方体结构形式以减小部分连接系统的物理尺寸,从而在三维空间中实现超高空间效用。此外,我们还可以通过提高工作频段来缩小网络规模。」
论文链接:https://www.nature.com/articles/s41928-023-00951-x
相关报道:https://techxplore.com/news/2023-05-programmable-surface-plasmonic-neural-network.html