LegalHalluLens: Typed Hallucination Auditing and Calibrated Multi-Agent Debate for Trustworthy Legal AI
Paper ID: 2606.18021 β’ 1 Upvotes
Multi-Agent Hallucination Legal-AI Evaluation Agent RAG
π ν΅μ¬ μμ½
λ²λ₯ AIμ νκ°(Hallucination)μ μ νλ³λ‘ λΆμνκ³ , μ΄λ₯Ό κΈ°λ°μΌλ‘ μ λ°ν λ©ν° μμ΄μ νΈ ν λ‘ μ μννμ¬ μ λ’°μ±μ λμ΄λ κ°μ¬ νλ μμν¬
π μμΈ λ΄μ©
λ²λ₯ μν¬νλ‘μ°μ λμ
λ AIμ νκ°μ¨μ λμ§λ§, κΈ°μ‘΄μ ν΅ν© μ§νλ μ€λ₯μ ꡬ체μ μΈ μ νμ΄λ λ°©ν₯μ±μ νμ
νκΈ° μ΄λ €μ μ€λ¬΄μ λμμ΄ λΆκ°λ₯ν©λλ€. μ΄λ₯Ό ν΄κ²°νκΈ° μν΄ λ³Έ λ
Όλ¬Έμ LegalHalluLens νλ μμν¬λ₯Ό μ μν©λλ€. μ΄ νλ μμν¬λ λ²λ₯ μ λ§₯λ½μ λ§μΆ 4κ°μ§ μ νλ³ νκ° νλ‘νμΌλ§, λλ½κ³Ό νμ μμ± νΈν₯μ κ΄λ¦¬νλ RDI(Risk Direction Index), κ·Έλ¦¬κ³ μ νλ³λ‘ 보μ λ λ©ν° μμ΄μ νΈ ν λ‘ νμ΄νλΌμΈμ ν¬ν¨ν©λλ€. μ€ν κ²°κ³Ό, ν΅ν© μ§νμ κ°λ €μ‘λ μ νλ³ μ€λ₯ μ°¨μ΄λ₯Ό μλ³νμμΌλ©°, μ μλ ν λ‘ νμ΄νλΌμΈμ μ μ νλΌλ―Έν°λ‘λ μμ© API μμ€μ μ±λ₯μ 보μμ΅λλ€. κ²°κ³Όμ μΌλ‘ μ΄ νλ μμμ λ²λ₯ AIμ ν¬λͺ
ν κ°μ¬μ μ λ’°ν μ μλ μμ΄μ νΈ μ€κ³λ₯Ό μ§μν©λλ€.
π μ£Όμ λ΄μ© (Key Points)
- λ²λ₯ νΉν 4λ μ ν(μμΉ, μκ°, μ무/κΆλ¦¬, μ¬μ€) κΈ°λ°μ νκ° νλ‘νμΌλ§ κΈ°μ
- λλ½κ³Ό νμ μμ± μ¬μ΄μ νΈν₯μ λ¨μΌ μ€μΉΌλΌλ‘ κ΄λ¦¬νλ RDI(Risk Direction Index) λμ
- μΈ‘μ λ μ€λ₯ μ νμ λ°λΌ Skeptic(νμλ‘ μ)κ³Ό λΉλμΉ κ²μ΄νΈλ₯Ό μ μ©νλ μ λ° λ©ν° μμ΄μ νΈ ν λ‘
π‘ μ€λ¬΄μ κ°μΉ (Relevance)
λ¨μν 'μ νλ'λΌλ μ§νμ μμ‘΄νμ§ μκ³ , λ²λ₯ λλ©μΈμμ μΉλͺ
μ μΈ νΉμ μ€λ₯ μ νμ μλ³νκ³ μ΄λ₯Ό μμ΄μ νΈ λ‘μ§μ λ°μνλ μ€λ¬΄μ λ°©λ²λ‘ μ μ μν©λλ€.
β μΆμ² μ‘μ (Actionable Items)
- λλ©μΈ νΉν λ°μ΄ν°μ (μ: κ³μ½μ)μ νμ©ν μ νλ³ μ€λ₯ λΆμ νμ΄νλΌμΈ ꡬμΆ
- λ¨μ ν λ‘ μ΄ μλ, νΉμ μ€λ₯ μ νμ νκ²ν νλ 'Skeptic' μμ΄μ νΈ μν μ μ μ€ν
- λͺ¨λΈμ μ±λ₯ μ§νλ₯Ό RDIμ κ°μ λ°©ν₯μ± μ§νλ‘ λ³ννμ¬ νκ° μ²΄κ³ κ΅¬μΆ