Skip to main content
QUICK REVIEW

[논문 리뷰] Molecular Representations in Implicit Functional Space via Hyper-Networks

Zehong Wang, Xiaolong Han|arXiv (Cornell University)|2026. 01. 29.
Machine Learning in Materials Science인용 수 0
한 줄 요약

본 논문은 MolField를 제안하는데, 각 분자는 연속 3D 필드로 모델링되는 함수 공간 표현법으로 다루며, 이를 통해 목표에 독립적인 학습이 가능하도록 표준 임의 신경 표현으로 학습된 함수 공간 하이 네트워크를 통해 학습한다.

ABSTRACT

Molecular representations fundamentally shape how machine learning systems reason about molecular structure and physical properties. Most existing approaches adopt a discrete pipeline: molecules are encoded as sequences, graphs, or point clouds, mapped to fixed-dimensional embeddings, and then used for task-specific prediction. This paradigm treats molecules as discrete objects, despite their intrinsically continuous and field-like physical nature. We argue that molecular learning can instead be formulated as learning in function space. Specifically, we model each molecule as a continuous function over three-dimensional (3D) space and treat this molecular field as the primary object of representation. From this perspective, conventional molecular representations arise as particular sampling schemes of an underlying continuous object. We instantiate this formulation with MolField, a hyper-network-based framework that learns distributions over molecular fields. To ensure physical consistency, these functions are defined over canonicalized coordinates, yielding invariance to global SE(3) transformations. To enable learning directly over functions, we introduce a structured weight tokenization and train a sequence-based hyper-network to model a shared prior over molecular fields. We evaluate MolField on molecular dynamics and property prediction. Our results show that treating molecules as continuous functions fundamentally changes how molecular representations generalize across tasks and yields downstream behavior that is stable to how molecules are discretized or queried.

연구 동기 및 목표

  • 이산 분자 표현(시퀀스, 그래프, 포인트 클라우드)에서 연속 분자 필드로의 함수 공간 이동을 동기 부여한다.
  • 주 표현 객체로서 고유한 SE(3)-불변의 분자 함수를 정의한다.
  • 고유 임의 신경 표현(C-INR), 구조화된 가중치 토크나이제이션(SWT), 함수 공간 하이 네트워크(FSHN)로 MolField를 개발한다.
  • 함수 공간 표현이 다양한 작업에 일반화되고 이산화 및 조회 스키마에 대한 강건성을 보이는지 보여준다.]
  • method: [

제안 방법

  • C-INR을 사용해 3D 공간에 대한 연속 함수로 분자를 표현하고, 고유 좌표를 통해 SE(3) 불변성을 보장한다.
  • 쿼리를 고정된 고유 좌표계로 매핑하기 위해 회전 등변(features)으로부터 고유 프레임 Q(X)을 구성한다.
  • 변환기 기반 파라미터 처리를 가능하게 하기 위해 Structured Weight Tokenization을 통해 C-INR 파라미터를 노출한다.
  • 잠재 변수 z에 조건화된 C-INR 파라미터를 생성하는 Function Space Hyper-Network를 학습시키며, 끝-to-end로 분자 함수의 분포를 모델링한다.
  • 작업별 손실(MD: SDF + Eikonal; Property: 회귀를 위한 축적 INR 토큰; Generation: 밀도 매칭)로 학습하고 INR 및 하이 네트워크를 역전파한다.
  • 추론 시 함수 공간에서 분자 함수를 생성하고 다운스트림 작업에 대해 인스턴스별 최적화 없이 조회한다.

실험 결과

연구 질문

  • RQ1분자는 3D 공간에서 SE(3)-불변의 연속 함수로 표현되는 것이 이산 구조보다 효과적인가?
  • RQ2하이 네트워크를 통한 분자 함수의 분포 학습이 분자 다이나믹스 및 특성 예측 작업의 일반화를 개선하는가?
  • RQ3고유 임시 표현과 구조화된 토큰화가 강건하고 비이산 학습을 가능하게 하는가?
  • RQ4함수 공간 표현이 분자 다이나믹스에서 데이터 효율성과 장기 예측 성능을 개선하는가?
  • RQ5INR 재구성 정확도와 다운스트림 특성 예측 정확도 사이에 측정 가능한 연관성이 있는가?

주요 결과

  • MolField는 여러 궤적에 걸친 분자 다이나믹스 표면 재구성에서 평균 성능 최상위를 달성한다.
  • MolField는 QM9에서 공간-특성 대상에 대해 MAE를 낮추는 경향을 보이며, 특히 HOMO 관련 및 극극성(polArizability) 관련 특성에서 경쟁력을 유지한다.
  • 삭제 연구를 통해 C-INR, SWT 또는 FSHN 구성요소를 제거하면 성능이 저하되어 공동 설계의 중요성을 강조한다.
  • MolField는 적은 학습 데이터로도 성능을 유지하며 데이터 효율이 향상되었음을 보여주며, 이는 보상되는 함수 공간 사전으로 인한 효과이다.
  • MolField의 장기 예측은 각 궤적별 임의 네트보다 더 정확하고 안정적이며, 시간적 일반화가 향상되었음을 시사한다.
  • 함수 충실도(INR 재구성 손실)와 다운스트림 특성 오차 간의 상관관계가 있으며, 분자 생성에 INR을 전처리하는 것이 이 관계를 강화한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.