데이터 효율적이기 위해 EDFs 개념을 사용하지만, 이전 논문과 달리 생성형 모델로 EBM이 아닌, Diffusion(Noise Conditioned Score Network) 모델을 사용함.

FLOW : bi-equivariant 수식 정의 → score based model → reverse process를 학습해야함 → reverse 를 위해선 forward process가 필요 → SE(3) manifold 상에서 정의

Equivariant or Invariant

P(T x | T o) → equivariant

P( x | T o) → invariant

P(T x | T o1, T o2, T) → invariant

P(T x | T o1, T o2, T o3) → equivariant

P(T x | o)

Contribution 1. Change Generative Model

지난 연구(EDFs - EBM)에서는 생성형 모델로 EBM(energy-based model)을 사용했는데, 적은 demo에도 불구하고 해당 모델을 학습하는데에 오랜시간이 걸렸다. 따라서 생성형 모델을 diffusion model로 바꿈으로써 training time을 줄였다. (end-to-end trainability, data-efficiency, and generalizability을 유지하면서)

Reason 1.

EBM 모델은 확률 분포를 직접적으로 정의하지 않고, 에너지 함수로 표현된 "낮은 에너지 상태"에 도달하기 위해 MCMC(마르코프 연쇄 몬테카를로)와 같은 복잡한 샘플링 방법을 사용한다. MCMC 샘플링은 많은 반복 계산이 필요하고, 특히 고차원 데이터에서는 수렴(목표 분포에 도달)하는 데 시간이 많이 걸린다.

반면에, diffusion model의 경우 노이즈를 점진적으로 추가하여 데이터를 무작위화하고, 이를 역으로 복원하는 과정을 학습한다. 이 과정은 직접적으로 목표 분포를 학습하는 것보다 더 효율적이고 안정적이다.

Contribution 2. Faster Sampling

Sampling 과정이 빨라져서 학습시간 줄어든다.

Reason 2. EDF구현을 특징 추출기와 필드 모델로 분리하였기 때문에 , 각 샘플링 단계마다 무거운 계산을 반복하지 않아도 됨. 특징 추출기 (deep SE(3)-equivariant GNN)에서는 계산량이 많지만, denoising 초기단계에서 한 번만 실행하여 전체 장면의 특징을 한 번만 추출한다. 필드 모델에서는 샘플링 단계마다 실행되지만 미리 추출된 특징을 사용해 빠르게 필드 값을 계산해서 계산량이 적다.