目录
一、背景
数据驱动建模通常与理论驱动建模相对,但它们的集成也被认为是一种重要的方法,称为灰盒或混合建模。机器学习中的灰盒/混合建模在学习鲁棒模型方面具有相当大的前景,具有改进的外推能力,超出了它们在训练期间接触到的分布。此外,就模型可解释性而言,它可以带来显著的好处,因为模型的部分在语义上基于具体的领域知识。
将物理模型集成到机器学习中已经在各种情况下被考虑过(例如[44,40]和本文的第4节),但现有的大多数研究都集中在预测或预测任务上,不能直接适用于其他任务。更重要的是,对基于物理和数据驱动的组件的精心编排没有加以考虑。
这篇文章的目标是整合不完整的物理模型到深度生成模型。在本文的VAE中,解码器由基于物理的模型和可训练的神经网络组成,其中一些潜在变量以物理模型的参数为语义基础。这种VAE,如果经过适当的训练,从理论上讲是可以部分解释的。此外,本文提出了一个正则化的学习框架,以确保物理模型的有意义的使用,并在物理集成的VAEs中保留潜在变量的语义。经验表明,本文的方法可以学习一个具有更好的泛化性的模型,更重要的是,可以在非分布情况下进行稳健的外推。
二、Physics-integrated VAEs模型框架
首先假设物理模型可以用合理的代价来解析或数值求解,并且(近似)解对于解所依赖的量是可微的。另外,为了便于讨论,假设一个VAE解码器由两部分组成:物理模型
2.1、潜在变量和先验
考虑两种潜在变量:
其中
2.2、解码器
解码器包含两种类型的函数:
(1)in-equation augmentation solve
(2)out-equation augmentation
(3)它们的任意组合,即,
2.3、编码器
编码器包含两部分:
2.4、Evidence lower bound
三、正则化:在物理模型和可训练模型之间取得平衡
本文提出了一个正则化的学习目标,用于物理集成的VAEs。它包括两种类型的正则器。第一个是正则化函数近似器(如神经网络)不必要的灵活性;第二个是接地编码器输出物理参数。
3.1、可训练函数的过剩灵活性正规化
作者认为,如果物理集成VAE的可训练成分(即
为了确保
首先给出“纯物理”简化版本的定义:解码器用一个基函数
有了模型,然后为了最小化两个版本之间的差异即最小化两个后验预测分布的差异,即最小化下面的式子:
解析计算上式通常是棘手的。因此,取其上界,具体如下。
用
3.2、基于物理数据增强的接地物理编码器
作者认为,为了正确学习物理集成的VAEs,只最小化
该方案思想是使用物理模型作为数据扩充的信息源,这有助于将PI-VAE中的识别网络
首先为了弥补这种差异,作者安排了一个物理编码器
然后,作者希望在给定相关
但是,一般来说,真实数据x和增强数据
综上所述,作者定义了一对正则器来设置
定义:设sg[·]为停止梯度算子。基于物理的数据增强的正则化定义为最小化
对应的计算示意图如下图所示:
3.3、整体规划的学习目标
本文提出的物理集成VAEs的整体正则化学习目标如下:
文章出处登录后可见!