QUICK REVIEW

[論文レビュー] GNOT: A General Neural Operator Transformer for Operator Learning

Zhongkai Hao, Zhengyi Wang|arXiv (Cornell University)|Feb 28, 2023

Model Reduction and Neural Networks被引用数 36

ひとこと要約

GNOTは、非規則なメッシュ、複数の入力関数、そして多スケール問題に対処するための異種正規化注意力と幾何学的ゲーティング機構を備えた、スケーラブルなTransformerベースのニューラル演算子を導入し、さまざまなPDE関連データセットで顕著な改善を達成します。

ABSTRACT

Learning partial differential equations' (PDEs) solution operators is an essential problem in machine learning. However, there are several challenges for learning operators in practical applications like the irregular mesh, multiple input functions, and complexity of the PDEs' solution. To address these challenges, we propose a general neural operator transformer (GNOT), a scalable and effective transformer-based framework for learning operators. By designing a novel heterogeneous normalized attention layer, our model is highly flexible to handle multiple input functions and irregular meshes. Besides, we introduce a geometric gating mechanism which could be viewed as a soft domain decomposition to solve the multi-scale problems. The large model capacity of the transformer architecture grants our model the possibility to scale to large datasets and practical problems. We conduct extensive experiments on multiple challenging datasets from different domains and achieve a remarkable improvement compared with alternative methods. Our code and data are publicly available at \url{https://github.com/thu-ml/GNOT}.

研究の動機と目的

irregular meshes、複数の入力、および多スケール領域にわたるPDEの効率的な演算子学習の必要性を動機づける。
挑戦的な実用条件の下で演算子を学習するための柔軟なTransformerベースのアーキテクチャ（GNOT）を提案する。
多様なデータセットでのスケーラビリティと精度を実現する仕組み（異種正規化注意力と幾何MoEゲーティング）を開発する。

提案手法

任意の入力埋め込みに対する異種正規化クロスアテンションブロックを備えたGeneral Neural Operator Transformer（GNOT）を導入する。
コアのトランスフォーマーモジュールとしてクロスアテンションに続く自己注意ブロックを用いる。
混合専門家に基づく幾何学的ゲーティング機構を実装し、ソフトな領域分解と多スケール学習の改善を図る。
境界形状、領域分布関数、パラメータベクトルなど多様な入力を別々のMLPエンコーダでエンコードし、条件付き埋め込みを得る。
大規模な点列を扱えるよう、O((N+sum N_l)n_e^2) の複雑さを実現する線形アテンション variante を採用する。
Omega上の離散化された入力と解のメッシュに対してMSE損失でエンドツーエンド訓練を行う。

実験結果

リサーチクエスチョン

RQ1GNOTは不規則なメッシュと複数の入力タイプに渡ってPDE解法演算子を正確に学習できるか？
RQ2異種正規化注意力は既存のニューラル演算子と比較して多様な入力をより適切に統合できるか？
RQ3幾何学的ゲーティング（MoE）は多スケール問題に有効で、スケーラビリティに影響を与えるか？
RQ4異なる領域におけるベースライン（MIONet、FNO、Geo-FNO、GK-Transformer、OFormer）と比較してGNOTの性能はどうか？

主な発見

データセット	タイプ	MIONet	FNO(-interp)	GK-Transformer	Geo-FNO	OFormer	私たちの手法	チャレンジサブセット
Darcy2d	A	-	-	5.45e-2	1.09e-2	1.09e-2	1.24e-2	1.05e-2
NS2d (part)	-	–	–	1.56e-1	1.40e-1	1.56e-1	1.71e-1	1.38e-1
NS2d (full)	-	–	–	8.20e-2	7.92e-2	8.20e-2	6.46e-2	4.43e-2
Elasticity	A	-	9.65e-2	5.08e-2	2.01e-2	2.20e-2	1.83e-2	8.65e-3
NS2d-c (u)	A,C	$u$	2.74e-2	6.56e-2	1.52e-2	1.41e-2	2.33e-2	6.73e-3
NS2d-c (v)	A,C	$v$	5.51e-2	1.15e-1	3.15e-2	2.98e-2	4.83e-2	1.55e-2
NS2d-c (p)	A,C	$p$	2.74e-2	1.11e-2	1.59e-2	1.62e-2	2.43e-2	7.41e-3
NACA	A,C	-	1.32e-1	4.21e-2	1.61e-2	1.38e-2	1.83e-2	7.57e-3
Inductor2d (Az)	A,C	$A_{z}$	3.10e-2	–	2.56e-1	–	2.23e-2	1.21e-2
Heat (part)	A,B,C	part	1.74e-1	–	–	–	4.13e-2
Heat (full)	A,B,C	full	1.45e-1	–	–	–	2.56e-2
Heatsink (T)	A,B,C	$T$	4.67e-1	–	–	–	2.53e-1
Heatsink (u)	A,B,C	$u$	3.52e-1	–	–	–	1.42e-1
Heatsink (v)	A,B,C	$v$	3.23e-1	–	–	–	1.81e-1
Heatsink (w)	A,B,C	$w$	3.71e-1	–	–	–	1.88e-1

GNOTは複数のデータセットにおいてベースラインを大きく上回り、Elasticity、Inductor2d、Heatsinkなどのタスクで予測誤差を約40-50%低減した。
NS2dではデータを増やすことで誤差が13.7%から4.42%に低減、Heatでは4.13%から2.58%に低減。
データとモデルサイズの増加に伴いGNOTはスケールし、埋め込み容量が大きいほど性能が良くなる傾向があり、報告されたスケーリング実験でデータ効率がほぼ直線的。
NACA、Elasticity、NS2d-cデータセットのアブレーションでは、クロスアテンションの後に自己注意ブロック（cross + self）が常に最良の性能を示した。
MoEベースの幾何ゲーティングで3つのエキスパートを使用することは、Heatのようなマルチサブドメイン問題に有利であり、8を超えるエキスパートは性能を低下させる可能性がある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。