Agentic Abstention: Do Agents Know When to Stop Instead of Act?
Paper ID: 2606.28733 β’ 115 Upvotes
LLM Agent Decision Making Prompt Engineering Cost Optimization Agent Reasoning Evaluation Distillation
π ν΅μ¬ μμ½
μμ΄μ νΈκ° λΆκ°λ₯νκ±°λ λͺ¨νΈν μμ
μ λν΄ λ¬΄μλ―Έν λ°λ³΅μ λ©μΆκ³ μ μ ν μμ μ μ€λ¨(Abstention)νλ λ₯λ ₯μ μ°κ΅¬νκ³ κ°μ νλ λ°©λ²λ‘ μ μ
π μμΈ λ΄μ©
LLM μμ΄μ νΈλ 볡μ‘ν νκ²½μμ λ€νμ°¨ μνΈμμ©μ ν΅ν΄ λͺ©νλ₯Ό λ¬μ±νμ§λ§, λͺ©νκ° λΆκ°λ₯νκ±°λ λͺ¨νΈν κ²½μ°μλ κ³μν΄μ λꡬλ₯Ό νΈμΆνλ λ¬Έμ κ° λ°μν©λλ€. λ³Έ λ
Όλ¬Έμ μμ΄μ νΈκ° λΆνμ€μ± μμμ μΈμ νλμ λ©μΆ°μΌ νλμ§λ₯Ό κ²°μ νλ 'Agentic Abstention' λ¬Έμ λ₯Ό μ μν©λλ€. μ°κ΅¬μ§μ μΉ μΌν, ν°λ―Έλ, μ§μμλ΅ λ± λ€μν νκ²½μμ 13κ°μ μμ΄μ νΈ μμ€ν
μ λμμΌλ‘ λκ·λͺ¨ μ€νμ μ§ννμ΅λλ€. μ€ν κ²°κ³Ό, λͺ¨λΈμ κ·λͺ¨κ° ν¬κ±°λ μΆλ‘ λ₯λ ₯μ΄ λλλΌλ μ μ ν μμ μ μ€λ¨νλ λ₯λ ₯μ μ€νλ € λ¨μ΄μ§ μ μμμ νμΈνμ΅λλ€. μ΄λ₯Ό ν΄κ²°νκΈ° μν΄ μνΈμμ© κΆ€μ μ μ¬μ¬μ© κ°λ₯ν μ€λ¨ κ·μΉμΌλ‘ μ μ νλ 컨ν
μ€νΈ μμ§λμ΄λ§ λ°©λ²λ‘ μΈ CONVOLVEλ₯Ό μ μν©λλ€. κ²°κ³Όμ μΌλ‘ CONVOLVEλ λͺ¨λΈ νλΌλ―Έν° μ
λ°μ΄νΈ μμ΄λ μμ΄μ νΈμ μ μ μ€λ¨ μ±λ₯μ ν¬κ² ν₯μμμΌ°μ΅λλ€.
π μ£Όμ λ΄μ© (Key Points)
- μμ΄μ νΈμ μμ°¨μ μμ¬κ²°μ λ¬Έμ λ‘μμ 'Agentic Abstention' κ°λ μ μ
- λͺ¨λΈ κ·λͺ¨ λ° μ€μΊν΄λ©μ΄ μ μ μ€λ¨(Timely Abstention)μ λ―ΈμΉλ 볡ν©μ μν₯ λΆμ
- κΆ€μ μ¦λ₯(Trajectory Distillation) κΈ°λ°μ 컨ν μ€νΈ μμ§λμ΄λ§ κΈ°λ² 'CONVOLVE' μ μ
π‘ μ€λ¬΄μ κ°μΉ (Relevance)
μμ΄μ νΈκ° 무ν 루νμ λΉ μ§κ±°λ λΆνμν API νΈμΆλ‘ λΉμ©μ λλΉνλ κ²μ λ°©μ§νκΈ° μν μ€λ¬΄μ κ°μ΄λλΌμΈμ μ 곡ν©λλ€.
β μΆμ² μ‘μ (Actionable Items)
- νμ¬ μ΄μ μ€μΈ μμ΄μ νΈμ 'μ€λ¨ μμ 'μ λν λ‘κ·Έλ₯Ό λΆμνμ¬ λΆνμν λ°λ³΅ νμ μΈ‘μ
- μ€ν¨κ° λͺ νν μλ리μ€λ₯Ό ν¬ν¨ν ν μ€νΈμ μ ꡬμΆνμ¬ μμ΄μ νΈμ μ€λ¨ μ±λ₯ νκ°
- CONVOLVEμ κ°μ 컨ν μ€νΈ μμ§λμ΄λ§ κΈ°λ²μ μ μ©νμ¬ ν둬ννΈ κΈ°λ° μ€λ¨ κ·μΉ μ€ν