DF3DV-1K: A Large-Scale Dataset and Benchmark for Distractor-Free Novel View Synthesis
Paper ID: 2604.13416 β’ 9 Upvotes
Computer Vision NeRF 3D Gaussian Splatting Dataset RAG Vision Benchmark Evaluation
π ν΅μ¬ μμ½
λ°©ν΄ μμ(distractor)κ° ν¬ν¨λ μ€μ νκ²½μμλ κΉ¨λν λ·°λ₯Ό μμ±ν μ μλ λκ·λͺ¨ λ²€μΉλ§ν¬ λ°μ΄ν°μ
DF3DV-1K μ μ
π μμΈ λ΄μ©
μ΅κ·Ό Radiance Field κΈ°μ μ λ°μ μλ λΆκ΅¬νκ³ , μ€μ νκ²½μ 볡μ‘ν λ°©ν΄ μμκ° ν¬ν¨λ λκ·λͺ¨ λ°μ΄ν°μ
μ λΆμ‘±ν μ€μ μ
λλ€. μ΄λ₯Ό ν΄κ²°νκΈ° μν΄ μ°κ΅¬μ§μ 1,048κ°μ μ₯λ©΄κ³Ό μ½ 9λ§ μ₯μ μ΄λ―Έμ§λ₯Ό ν¬ν¨νλ DF3DV-1K λ°μ΄ν°μ
μ ꡬμΆνμ΅λλ€. μ΄ λ°μ΄ν°μ
μ κΉ¨λν μ΄λ―Έμ§μ λ°©ν΄ μμκ° ν¬ν¨λ μ΄λ―Έμ§λ₯Ό μμΌλ‘ μ 곡νμ¬ λͺ¨λΈμ κ°κ±΄μ±μ νκ°ν μ μκ² ν©λλ€. μ°κ΅¬μ§μ μ΄λ₯Ό ν΅ν΄ κΈ°μ‘΄ 9κ°μ§ λ°©λ²λ‘ κ³Ό 3D Gaussian Splattingμ λ²€μΉλ§νΉνμ¬ μ±λ₯μ λΉκ΅νμ΅λλ€. λν, νμ° λͺ¨λΈ κΈ°λ°μ 2D μΈνΈμλ₯Ό κ²°ν©νμ¬ λ·° ν©μ± νμ§μ κ°μ νλ μμ© μ¬λ‘λ μ μνμ΅λλ€.
π μ£Όμ λ΄μ© (Key Points)
- 1,048κ° μ₯λ©΄, 89,924μ₯μ μ΄λ―Έμ§λ₯Ό ν¬ν¨νλ λκ·λͺ¨ μ€μΈκ³ λ°μ΄ν°μ DF3DV-1K ꡬμΆ
- λ°©ν΄ μμ μ κ±°(distractor-free) μ±λ₯ νκ°λ₯Ό μν μ κ΅ν λ²€μΉλ§ν¬ λ° 41κ° μ₯λ©΄μ νλ μ΄μ λ μλΈμ (DF3DV-41) μ 곡
- Diffusion κΈ°λ° 2D μΈνΈμλ₯Ό νμ©ν Radiance Field νμ§ κ°μ κ°λ₯μ± μ μ¦
π‘ μ€λ¬΄μ κ°μΉ (Relevance)
μ€μ μΉ΄λ©λΌλ‘ 촬μλ 볡μ‘ν νκ²½(κ°κ΅¬, μ‘λμ¬λ λ±)μμ νΉμ λ¬Όμ²΄λ§ κΉ¨λνκ² λ λλ§ν΄μΌ νλ AR/VR λ° λμ§νΈ νΈμ κΈ°μ κ°λ°μ μ§μ μ μΈ λμμ μ€λλ€.
β μΆμ² μ‘μ (Actionable Items)
- μ 곡λ λ°μ΄ν°μ μ μ¬μ©νμ¬ νμ¬ μ¬μ© μ€μΈ NeRF/3DGS λͺ¨λΈμ λ°©ν΄ μμ μ κ±° μ±λ₯ ν μ€νΈ
- DF3DV-41 μλΈμ μ νμ©νμ¬ λͺ¨λΈμ κ·Ήν μν©(challenging scenarios)μ λν κ°κ±΄μ± κ²μ¦
- Diffusion κΈ°λ° μΈνΈμ κΈ°λ²μ κΈ°μ‘΄ λ·° ν©μ± νμ΄νλΌμΈμ κ²°ν©νμ¬ νμ§ κ°μ μ€ν