(Diffusion)3D Neural Field Generation using Triplane Diffusion Review
CV Paper List
3D Neural Field Generation using Triplane Diffusion
Abstract
본 논문은 3D-aware generation of neural fiels에 Diffusion 모델을 적용시킨다.
-
3D-aware generation은 생성 과정에서 3차원 정보를 고려하여 생성하는 방법입니다.
-
Neural fiels는 신경망의 출력 값으로 이뤄진 공간적인 데이터 구조를 의미한다. 여기서 공간적인 데이터 구조는 출력값의 2D 혹은 3D 공간을 의미한다.
1. Introduction
3D-aware generative adversarial networks (GANs)의 생성 방법을 Diffusion model을 사용하여 성능을 개선시켰다.
3D-aware GANs는 2D generator를 사용하여 높은 성능의 3D shape 생성에 성공하였다.
본 논문은 3D-aware GANs의 아이디어를 발전시켜, 3D scenes과 radiance fields를 축에 정렬axis-aligned된 2D feature 평면의 집합으로 인코딩하는 “triplane representations”를 생성하는 것을 학습하는 것을 제안한다.
- Triplane은 3D 데이터를 표현하기 위해 세 개의 평면으로 구성된 표현 방법을 의미하며 그림에서 확인 할 수 있다. 본 논문에서 소개하는 Neural field-based diffusion framework for 3D representation learning은 두 단계로 진행된다.
-
3D scenes 훈련 데이터셋은 장면별로 triplane features 세트와 단일 shared feature 디코더로 분해된다.
-
분해된 triplane에 대해 2D Diffusion 모델을 훈련합니다.
훈련된 Diffusion 모델은 추론 시에 새롭고 다양한 3D 장면을 생성하는 데 사용될 수 있다.
Triplane을 다중 채널 2D 이미지로 해석하여 생성과 렌더링을 분리함으로써, 현재의 (그리고 미래의) state-of-art 2D Diffusion 모델 백본을 거의 그대로 활용할 수 있다.