The FID Lottery: Quantifying Hidden Randomness in Generative-Model Evaluation
Paper ID: 2606.20536 β’ 2 Upvotes
Generative Models Evaluation Metric Reproducibility Computer Vision Vision Evaluation
π ν΅μ¬ μμ½
FID μμΉλ λͺ¨λΈμ μ±λ₯λΏλ§ μλλΌ νμ΅/μνλ§ μμ 무μμμ±μ ν¬κ² μμ‘΄νλ―λ‘, λ¨μΌ μμΉ λ³΄κ³ κ° μλ μ€μ°¨ λ²μλ₯Ό ν¬ν¨ν νκ° νλ‘ν μ½μ΄ νμν©λλ€.
π μμΈ λ΄μ©
μ΄λ―Έμ§ μμ± λͺ¨λΈ νκ°μ νμ€μΈ FIDλ λκ° λ¨μΌ λͺ¨λΈκ³Ό λ¨μΌ μλμ λν μμΉλ‘λ§ λ³΄κ³ λμ΄ μ¬νμ± λ¬Έμ κ° μ‘΄μ¬ν©λλ€. λ³Έ λ
Όλ¬Έμ FIDλ₯Ό νμ΅ μλμ μμ± μλλΌλ λ μΆμ κ°μ§ νλ₯ λ³μλ‘ μ·¨κΈνμ¬ μλ°± κ°μ SiT λ€νΈμν¬λ₯Ό ν΅ν΄ λ³λμ±μ μ λννμ΅λλ€. μ°κ΅¬ κ²°κ³Ό, λͺ¨λΈ μ¬νμ΅μ λ°λ₯Έ FID λ³νκ° λ¨μ μν μ¬μΆμΆλ³΄λ€ ν¨μ¬ ν¬λ©°, μ΄λ μ΄κΈ°ν, λ°μ΄ν° μμ, νμ΅ λ
Έμ΄μ¦μ μν΄ λ°μν¨μ λ°νλμ΅λλ€. λν λͺ¨λΈ ν¬κΈ°λ₯Ό ν€μλ FIDμ λ³λ κ³μ(CoV)λ μΌμ μμ€ μ μ§λλ©°, μ΄ μ’μ μλκ° ν¨μ¬ μ μ μ°μ°μΌλ‘λ λμ μ±λ₯μ λΌ μ μμμ νμΈνμ΅λλ€. μ΄λ₯Ό λ°νμΌλ‘ μ μλ€μ μ€μ°¨ λ²μλ₯Ό ν¬ν¨ν μλ‘μ΄ FID νκ° νλ‘ν μ½μ μ μν©λλ€.
π μ£Όμ λ΄μ© (Key Points)
- λͺ¨λΈ μ¬νμ΅ μ λ°μνλ FID λ³λμ±μ΄ μνλ§ μμ λ³λμ±λ³΄λ€ μ½ 3.2λ°° λ νΌ
- λͺ¨λΈ ν¬κΈ° μ¦κ°κ° FIDμ μλμ λ³λμ±(CoV)μ νκΈ°μ μΌλ‘ μ€μ΄μ§ λͺ»ν¨
- νμ΅ μλ(μ΄κΈ°ν, λ°μ΄ν° μμ λ±)μ λ°λ₯Έ μ±λ₯ νΈμ°¨κ° μλΉνλ©° μ΄λ μ°μ° ν¨μ¨μ μν₯μ λ―ΈμΉ¨
π‘ μ€λ¬΄μ κ°μΉ (Relevance)
λͺ¨λΈ μ±λ₯ λΉκ΅ μ λ¨μΌ FID μμΉμ λ§€λͺ°λμ§ λ§κ³ , μ¬νμ±μ μν΄ μ¬λ¬ μλμ λν ν΅κ³μ μ μμ±μ νμΈν΄μΌ ν¨μ μμ¬ν©λλ€.
β μΆμ² μ‘μ (Actionable Items)
- λͺ¨λΈ μ±λ₯ λΉκ΅ μ λ¨μΌ μμΉκ° μλ μ¬λ¬ μλμ λν νκ· κ³Ό νμ€νΈμ°¨(Error Bar)λ₯Ό ν¨κ» κΈ°λ‘νκΈ°
- λ λͺ¨λΈ κ°μ FID μ°¨μ΄κ° μ€νμ λ³λμ± λ²μ(μ½ 1.3% CoV) λ΄μ μλ€λ©΄ μ±λ₯ μ°¨μ΄κ° μλ κ²μΌλ‘ κ°μ£ΌνκΈ°
- μ΅μ μ μ±λ₯μ μν΄ Classifier-Free Guidance(CFG) νλμ ν¬ν¨ν νκ° νλ‘ν μ½ μ μ©νκΈ°