ICLR 2025 Oral|突破深度学习求解PDE的瓶颈,清华提出空间调控新范式GridMix
- 2025-03-20 18:44:00
- 刘大牛 转自文章
- 606
保留了空间调控的 细粒度局部性,确保建模精度;
同时通过共享基函数提取 全局结构信息,有效缓解了过拟合风险。
论文标题:GridMix: Exploring Spatial Modulation for Neural Fields in PDE Modeling 论文地址:https://openreview.net/forum?id=Fur0DtynPX 项目主页:https://github.com/LeapLabTHU/GridMix.git
本文研究聚焦于偏微分方程(PDE)建模任务,其核心是近似算子
。该算子根据底层 PDE,将输入空间
中的函数映射到输出空间
。此处
表示定义域为且值域为
的平方可积函数构成的无限维空间。我们重点研究以下两类典型任务:
动态系统建模:旨在捕捉物理系统在预测时间范围内的动态演化过程。具体表现为建模系统从状态
到状态
的转移过程,其中
表示时间步长。
几何感知预测:根据系统的几何构型预测其状态。
上;而对于动力学建模,所有样本使用相同的训练空间域
,测试时则采用与训练域不同的空间域来评估模型性能。需特别说明的是,
和
均为完整域
的子集。
和
分别对输入和输出函数进行参数化建模。这些神经调控场作为基础模型,通过不同调制参数实现对不同函数的重构。具体而言,INR 参数
和
在各自函数空间中共享,而调制参数和则是每个函数特有的。这些调制参数通过超网络
和
从低维调控向量
和
中生成:
,
。经训练后,每个函数可由低维调控向量经过共享 INR 重构,其重构误差代表了表示质量。在第二阶段(预测阶段),CORAL 通过处理网络
学习调控编码
与
之间的映射关系。
是网络权重和偏置,
为固定的放缩因子,
,
是空间坐标
下的第层中间表示结果。
表示第 i 层的调制参数。需要注意的是,这种全局调控参数
在不同空间坐标之间是共享的。这一特性限制了神经调控场表示复杂函数空间的能力。正如先前的研究所展示的,全局调控无法捕捉局部细节,因为调控参数的任何变化都会导致重构函数的全局扰动。
图 2. 不同调控方式
,其中H和W分别表示网格的空间分辨率(以二维空间为例)。我们可以从该网格特征中提取位置相关的调控参数
。具体步骤如下:给定空间位置
,首先提取围绕该位置的相邻网格点(在二维情况下为四个点)上的特征,其次通过双线性插值计算
。空间调控对应的平移调控方法可表示为:
图 3. 重建效果对比:观测数据的空间域在训练集之外
。这里
表示 M 个网格基函数,
为第 i 层的线性组合系数。这些系数通过超网络 h 从低维调控向量 z 中估计得到。网格基函数在不同的函数实例中共享,并与神经调控场一同优化。GridMix 具有以下特点:
局部细节捕捉:GridMix 保留了网格调控的局部特性,通过引入额外的可学习参数增强了模型在局部细节重建的表达能力;
全局结构建模:GridMix 通过共享基函数对调控空间起到正则化作用。相比一般空间调控需要为每个函数额外学习个
独立参数,GridMix 将参数维度降低至基函数的个数。这种维度压缩有效减少了过拟合的风险,提升了模型对全局结构的重建能力,以及在不同空间域上的泛化能力。
图 5. 稀疏空间域下的 Shallow-Water 可视化结果
几何感知推理
在几何感知推理中,模型根据给定的几何结构(例如翼型(NACA-Euler)、水管(Pipe)和弹性材料(Elasticity))预测系统的状态。相较于全局调控方法,GridMix 在所有任务中均实现了性能提升。
图 6. 几何感知推理任务
提出了一种新颖的空间调控方式 ——GridMix,它自然地融合了全局调控的全局结构建模和空间调控的局部细节捕捉能力;
在动态系统建模和几何感知推理等任务中充分验证了 GridMix 的卓越性能,特别是在稀疏空间域和时间外推场景下优势显著。
| 联系人: | 透明七彩巨人 |
|---|---|
| Email: | weok168@gmail.com |