FlowBender: Feedback-Aware Training for Self-Correcting Conditional Flows
Paper ID: 2606.20404 β’ 15 Upvotes
Generative Models Diffusion/Flow Self-Correction Computer Vision Vision Inference Optimization Safety
π ν΅μ¬ μμ½
νΌλλ°± 루νλ₯Ό νμ΅ κ³Όμ μ ν΅ν©νμ¬ μ‘°κ±΄λΆ μμ± λͺ¨λΈμ μ λ°λμ νμ§μ λμμ λμ΄λ self-correcting νλ μμν¬
π μμΈ λ΄μ©
μ‘°κ±΄λΆ νμ° λ° νλ‘μ° λͺ¨λΈμ μ
λ ₯λ μ μ½ μ‘°κ±΄μ μλ²½ν μ€μνμ§ λͺ»νλ λ¬Έμ κ° λΉλ²ν λ°μν©λλ€. κΈ°μ‘΄ λ°©μμ 쑰건μ μ μ μΈ ννΈλ‘λ§ μ·¨κΈνκ±°λ, μΆλ‘ μ μλ κ°μ΄λμ€λ₯Ό μ¬μ©νμ¬ νμ§κ³Ό μ λ°λ μ¬μ΄μ νΈλ μ΄λμ€νκ° λ°μνμ΅λλ€. λ³Έ λ
Όλ¬Έμ λͺ¨λΈμ΄ μ€μ€λ‘μ μ λ ¬ μ€μ°¨(alignment error)λ₯Ό νμ©νλλ‘ νμ΅νλ FlowBender νλ μμν¬λ₯Ό μ μν©λλ€. νμ΅ κ³Όμ μμ νΌλλ°±μ μ
λ ₯μΌλ‘ λ°μ μ μ μ μ±
μ νμ΅νλ©°, λ―ΈλΆ κ°λ₯ν μ°μ°μμ λΉλ―ΈλΆ μ°μ°μ λͺ¨λμ μ μ© κ°λ₯ν λ³ν λͺ¨λΈμ μ 곡ν©λλ€. μ€ν κ²°κ³Ό, μ΄λ―Έμ§ λ³ν λ° 3D ν
μ€μ²λ§ λ± λ€μν μμ
μμ κΈ°μ‘΄ λ°©μλ³΄λ€ λμ μΆ©μ€λμ νλΉμ±μ λμμ λ¬μ±νμ΅λλ€.
π μ£Όμ λ΄μ© (Key Points)
- νΌλλ°± κΈ°λ° νμ 루ν(Closed-loop) νμ΅μ ν΅ν μ λ ¬ μ€μ°¨μ μ§μ μ μΈ νμ©
- λ―ΈλΆ κ°λ₯ν μ°μ°μ(Gradient-based) λ° λΉλ―ΈλΆ μ°μ°μ(Zero-order)λ₯Ό λͺ¨λ μ§μνλ λ²μ©μ±
- μΆλ‘ ν¨μ¨μ±μ μν Prior-step shortcut λμ μΌλ‘ μ°μ° λΉμ© μ΅μν
π‘ μ€λ¬΄μ κ°μΉ (Relevance)
μ μ½ μ‘°κ±΄(μ: νΉμ κΉμ΄κ°, μμΆ ν¬λ§·)μ μ격ν μ§μΌμΌ νλ μμ± μμ
μμ νμ§ μ ν μμ΄ μ λ°λλ₯Ό λμΌ μ μλ μ€μ©μ μΈ λ°©λ²λ‘ μ
λλ€.
β μΆμ² μ‘μ (Actionable Items)
- κΈ°μ‘΄ μ‘°κ±΄λΆ λͺ¨λΈμ νΌλλ°± 루ν ꡬν κ°λ₯μ± κ²ν
- λ―ΈλΆ λΆκ°λ₯ν μ μ½ μ‘°κ±΄(JPEG λ±)μ λν Zero-order variant μ μ© μ€ν
- νμ΅ μ νΌλλ°± μ νΈμ λ Έμ΄μ¦ μμ€μ λ°λ₯Έ μλ ΄μ± ν μ€νΈ