用LLM做半导体设计,IBM&MIT提出受神经启发的LLM推理网络SOLOMON

2025-03-18 11:59:00
刘大牛
转自文章
240
图片

编辑丨coisini

尽管大型 语言模型 (LLM)擅长复杂推理,但在适应特定领域时仍面临挑战,尤其是在需要空间推理和解决结构化问题的领域。半导体布局设计就是一个典型例子,AI 工具必须理解几何约束并确保组件的精确布局。

基于此,来自 IBM TJ 沃森研究中心和 MIT- IBM 沃森 人工智能 实验室的研究人员提出了一种受神经启发的 LLM 推理网络 ——SOLOMON,旨在增强领域特定的适应性。与传统方法不同,SOLOMON 采用多智能体推理系统,动态处理空间约束和几何关系。

图片

论文地址:https://arxiv.org/pdf/2502.04384

SOLOMON 框架集成了思维评估机制,通过迭代优化输出,提高解决问题的准确性。SOLOMON 利用提示工程(prompt engineering)来引导 LLM 生成解决方案,使其能够以最少的重新训练适应半导体布局任务。

如下图所示,SOLOMON 架构受到两种理论的启发:类脑通用 人工智能 (Brain-like AGI)和自由能原理(Free Energy Principle, FEP)。

图片

类脑通用 人工智能 启发研究团队利用多个大型 语言模型 (LLM)的思维池来发现最佳推理计划。研究团队还应用了自由能原理的核心观点,即人类注意力集中于最小化目标与 感知 之间的差异,从而选择相关信息并避免常见陷阱。

SOLOMON 的关键组件包括:

思维生成器(Thought Generators):由一组多样化的大型 语言模型 (LLMs)组成,负责为目标任务生成多种思维。思维生成器通过「思维树(Tree-of-Thoughts)」构建了一个高效的并行搜索引擎,并作为思维评估器(Thought Assessor)的自适应检索增 强生 成(RAG)系统。

思维评估器(Thought Assessor):一个基于 LLM 的系统,用于分析提出的「思维」以生成精炼的输出。它对思维生成器的输出进行上下文学习,并遵循自由能原理。

导向子系统(Steering Subsystem):一个由人工操作的组件,用于控制思维生成器和思维评估器的注意力。

与微调不同,SOLOMON 架构无需持续重新训练,在专业应用中更为高效。

为了评估 SOLOMON 的有效性,研究团队在 25 个半导体布局任务上进行了实验,采用五个基线 LLM 进行了比较,包括 GPT-4o、Claude-3.5-Sonnet 和 Llama-3 等,旨在评估模型在生成几何结构时保持空间准确性的能力。SOLOMON 在减少运行时错误和扩展不准确性方面表现出改进,展示了更好的空间推理能力,提高了布局精度并减少了生成设计中的错误。

图片

总的来说,SOLOMON 的一个关键优势在于其能够纠正几何设计中的 逻辑 不一致和 算术 错误。SOLOMON 为将 AI 应用于特定领域问题解决(尤其是半导体布局设计)提供了一种结构化且高效的方法。

图片

感兴趣的读者可以阅读论文原文,了解更多研究内容。

相关报道:https://www.marktechpost.com/2025/02/16/this-ai-paper-from-ibm-and-mit-introduces-solomon-a-neuro-inspired-reasoning-network-for-enhancing-llm-adaptability-in-semiconductor-layout-design/

产业 LLM 硬件 AI for Science
发表评论
评论通过审核后显示。
文章分类
联系我们
联系人: 透明七彩巨人
Email: weok168@gmail.com