PyoSignal Logo
PyoSignal
Back to Research

DF3DV-1K: A Large-Scale Dataset and Benchmark for Distractor-Free Novel View Synthesis

Paper ID: 2604.13416 β€’ 9 Upvotes
Computer Vision NeRF 3D Gaussian Splatting Dataset RAG Vision Benchmark Evaluation
DF3DV-1K: A Large-Scale Dataset and Benchmark for Distractor-Free Novel View Synthesis

πŸ“ 핡심 μš”μ•½

λ°©ν•΄ μš”μ†Œ(distractor)κ°€ ν¬ν•¨λœ μ‹€μ œ ν™˜κ²½μ—μ„œλ„ κΉ¨λ—ν•œ λ·°λ₯Ό 생성할 수 μžˆλŠ” λŒ€κ·œλͺ¨ 벀치마크 데이터셋 DF3DV-1K μ œμ•ˆ

πŸ“– 상세 λ‚΄μš©

졜근 Radiance Field 기술의 λ°œμ „μ—λ„ λΆˆκ΅¬ν•˜κ³ , μ‹€μ œ ν™˜κ²½μ˜ λ³΅μž‘ν•œ λ°©ν•΄ μš”μ†Œκ°€ ν¬ν•¨λœ λŒ€κ·œλͺ¨ 데이터셋은 λΆ€μ‘±ν•œ μ‹€μ •μž…λ‹ˆλ‹€. 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ 연ꡬ진은 1,048개의 μž₯λ©΄κ³Ό μ•½ 9만 μž₯의 이미지λ₯Ό ν¬ν•¨ν•˜λŠ” DF3DV-1K 데이터셋을 κ΅¬μΆ•ν–ˆμŠ΅λ‹ˆλ‹€. 이 데이터셋은 κΉ¨λ—ν•œ 이미지와 λ°©ν•΄ μš”μ†Œκ°€ ν¬ν•¨λœ 이미지λ₯Ό 쌍으둜 μ œκ³΅ν•˜μ—¬ λͺ¨λΈμ˜ 강건성을 평가할 수 있게 ν•©λ‹ˆλ‹€. 연ꡬ진은 이λ₯Ό 톡해 κΈ°μ‘΄ 9κ°€μ§€ 방법둠과 3D Gaussian Splatting을 λ²€μΉ˜λ§ˆν‚Ήν•˜μ—¬ μ„±λŠ₯을 λΉ„κ΅ν–ˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ, ν™•μ‚° λͺ¨λΈ 기반의 2D μΈν•Έμ„œλ₯Ό κ²°ν•©ν•˜μ—¬ λ·° ν•©μ„± ν’ˆμ§ˆμ„ κ°œμ„ ν•˜λŠ” μ‘μš© 사둀도 μ œμ‹œν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ£Όμš” λ‚΄μš© (Key Points)

  • 1,048개 μž₯λ©΄, 89,924μž₯의 이미지λ₯Ό ν¬ν•¨ν•˜λŠ” λŒ€κ·œλͺ¨ 싀세계 데이터셋 DF3DV-1K ꡬ좕
  • λ°©ν•΄ μš”μ†Œ 제거(distractor-free) μ„±λŠ₯ 평가λ₯Ό μœ„ν•œ μ •κ΅ν•œ 벀치마크 및 41개 μž₯면의 νλ ˆμ΄μ…˜λœ μ„œλΈŒμ…‹(DF3DV-41) 제곡
  • Diffusion 기반 2D μΈν•Έμ„œλ₯Ό ν™œμš©ν•œ Radiance Field ν’ˆμ§ˆ κ°œμ„  κ°€λŠ₯μ„± μž…μ¦

πŸ’‘ 싀무적 κ°€μΉ˜ (Relevance)

μ‹€μ œ μΉ΄λ©”λΌλ‘œ 촬영된 λ³΅μž‘ν•œ ν™˜κ²½(가ꡬ, μž‘λ™μ‚¬λ‹ˆ λ“±)μ—μ„œ νŠΉμ • 물체만 κΉ¨λ—ν•˜κ²Œ λ Œλ”λ§ν•΄μ•Ό ν•˜λŠ” AR/VR 및 λ””μ§€ν„Έ 트윈 기술 κ°œλ°œμ— 직접적인 도움을 μ€λ‹ˆλ‹€.

βœ… μΆ”μ²œ μ•‘μ…˜ (Actionable Items)

  • 제곡된 데이터셋을 μ‚¬μš©ν•˜μ—¬ ν˜„μž¬ μ‚¬μš© 쀑인 NeRF/3DGS λͺ¨λΈμ˜ λ°©ν•΄ μš”μ†Œ 제거 μ„±λŠ₯ ν…ŒμŠ€νŠΈ
  • DF3DV-41 μ„œλΈŒμ…‹μ„ ν™œμš©ν•˜μ—¬ λͺ¨λΈμ˜ κ·Ήν•œ 상황(challenging scenarios)에 λŒ€ν•œ 강건성 검증
  • Diffusion 기반 μΈν•Έμ„œ 기법을 κΈ°μ‘΄ λ·° ν•©μ„± νŒŒμ΄ν”„λΌμΈμ— κ²°ν•©ν•˜μ—¬ ν™”μ§ˆ κ°œμ„  μ‹€ν—˜