2025/03/18 11:59

用LLM做半导体设计，IBM&MIT提出受神经启发的LLM推理网络SOLOMON

编辑丨coisini

尽管大型语言模型（LLM）擅长复杂推理，但在适应特定领域时仍面临挑战，尤其是在需要空间推理和解决结构化问题的领域。半导体布局设计就是一个典型例子，AI 工具必须理解几何约束并确保组件的精确布局。

基于此，来自 IBM TJ 沃森研究中心和 MIT-IBM 沃森人工智能实验室的研究人员提出了一种受神经启发的 LLM 推理网络 ——SOLOMON，旨在增强领域特定的适应性。与传统方法不同，SOLOMON 采用多智能体推理系统，动态处理空间约束和几何关系。

论文地址：https://arxiv.org/pdf/2502.04384

SOLOMON 框架集成了思维评估机制，通过迭代优化输出，提高解决问题的准确性。SOLOMON 利用提示工程（prompt engineering）来引导 LLM 生成解决方案，使其能够以最少的重新训练适应半导体布局任务。

如下图所示，SOLOMON 架构受到两种理论的启发：类脑通用人工智能（Brain-like AGI）和自由能原理（Free Energy Principle, FEP）。

类脑通用人工智能启发研究团队利用多个大型语言模型（LLM）的思维池来发现最佳推理计划。研究团队还应用了自由能原理的核心观点，即人类注意力集中于最小化目标与感知之间的差异，从而选择相关信息并避免常见陷阱。

SOLOMON 的关键组件包括：

思维生成器（Thought Generators）：由一组多样化的大型语言模型（LLMs）组成，负责为目标任务生成多种思维。思维生成器通过「思维树（Tree-of-Thoughts）」构建了一个高效的并行搜索引擎，并作为思维评估器（Thought Assessor）的自适应检索增强生成（RAG）系统。

思维评估器（Thought Assessor）：一个基于 LLM 的系统，用于分析提出的「思维」以生成精炼的输出。它对思维生成器的输出进行上下文学习，并遵循自由能原理。

导向子系统（Steering Subsystem）：一个由人工操作的组件，用于控制思维生成器和思维评估器的注意力。

与微调不同，SOLOMON 架构无需持续重新训练，在专业应用中更为高效。

为了评估 SOLOMON 的有效性，研究团队在 25 个半导体布局任务上进行了实验，采用五个基线 LLM 进行了比较，包括 GPT-4o、Claude-3.5-Sonnet 和 Llama-3 等，旨在评估模型在生成几何结构时保持空间准确性的能力。SOLOMON 在减少运行时错误和扩展不准确性方面表现出改进，展示了更好的空间推理能力，提高了布局精度并减少了生成设计中的错误。

总的来说，SOLOMON 的一个关键优势在于其能够纠正几何设计中的逻辑不一致和算术错误。SOLOMON 为将 AI 应用于特定领域问题解决（尤其是半导体布局设计）提供了一种结构化且高效的方法。

感兴趣的读者可以阅读论文原文，了解更多研究内容。

相关报道：https://www.marktechpost.com/2025/02/16/this-ai-paper-from-ibm-and-mit-introduces-solomon-a-neuro-inspired-reasoning-network-for-enhancing-llm-adaptability-in-semiconductor-layout-design/

产业LLM硬件AI for Science

相关技术

感知

感知技术

知觉或感知是外界刺激作用于感官时，脑对外界的整体的看法和理解，为我们对外界的感官信息进行组织和解释。在认知科学中，也可看作一组程序，包括获取信息、理解信息、筛选信息、组织信息。与感觉不同，知觉反映的是由对象的各样属性及关系构成的整体。

来源：维基百科

人工智能技术

在学术研究领域，人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体（intelligent agent）

来源：Russell, S., & Norvig, P. (2003). Artificial Intelligence: A Modern Approach.

逻辑技术

人工智能领域用逻辑来理解智能推理问题；它可以提供用于分析编程语言的技术，也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑（Propositional Logic ）以及一阶逻辑（FOL）等谓词逻辑。

来源：机器之心

IBM 沃森技术

沃森是能够使用自然语言来回答问题的人工智能系统，由IBM公司的首席研究员David Ferrucci所领导的DeepQA计划小组开发并以该公司创始人托马斯·J·沃森的名字命名。

来源：维基百科

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用，如语音识别，机器翻译，词性标注，句法分析和资讯检索。由于字词与句子都是任意组合的长度，因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题)，也使得在语料库中估算字串的机率变得很困难，这也是要使用近似的平滑n元语法(N-gram)模型之原因。

来源：维基百科

通用人工智能技术

通用人工智能（AGI）是具有一般人类智慧，可以执行人类能够执行的任何智力任务的机器智能。通用人工智能是一些人工智能研究的主要目标，也是科幻小说和未来研究中的共同话题。一些研究人员将通用人工智能称为强AI（strong AI）或者完全AI（full AI），或称机器具有执行通用智能行为（general intelligent action）的能力。与弱AI（weak AI）相比，强AI可以尝试执行全方位的人类认知能力。

来源：wikipedia

推理网络技术

推理网络是一种执行复杂推理任务的方法，它通常基于从各种来源中获得的大量的以及不同形式的证据。推理网络被广泛的应用在法律，医学，以及情报分析，人工智能等众多领域。这些任务的复杂性通常可以通过现在被称为推理网络的图形结构来获取和表示。

来源：Inference Networks: Bayes and Wigmore

强生机构

强生公司成立于1886年，是全球最具综合性、业务分布范围广的医疗健康企业之一，业务涉及制药、医疗器材及消费品三大领域。强生坚信健康是活力人生、繁荣社区和不断进步的基础。正因如此，130多年来，公司始终致力于推进健康事业，让人们在每个年龄段和每个人生阶段都保持健康。

http://www.jnj.com/

算术技术

算术（英语：arithmetic）是数学最古老且最简单的一个分支，几乎被每个人使用着，从日常生活上简单的算数到高深的科学及工商业计算都会用到。一般而言，算术这一词指的是记录数字某些运算基本性质的数学分支。

来源：维基百科