GateMem: Benchmarking Memory Governance in Multi-Principal Shared-Memory Agents
Paper ID: 2606.18829 โข 13 Upvotes
LLM-Agent Memory-Governance Security RAG Agent Benchmark Evaluation
๐ ํต์ฌ ์์ฝ
๋ค์ค ์ฌ์ฉ์ ํ๊ฒฝ์ ๊ณต์ ๋ฉ๋ชจ๋ฆฌ ์์ด์ ํธ๋ฅผ ์ํ ๊ฑฐ๋ฒ๋์ค(์ ๊ทผ ์ ์ด ๋ฐ ์ญ์ ) ์ค์ฌ์ ๋ฒค์น๋งํฌ ์ ์
๐ ์์ธ ๋ด์ฉ
๊ธฐ์กด LLM ์์ด์ ํธ ๋ฉ๋ชจ๋ฆฌ ๋ฒค์น๋งํฌ๋ ๋จ์ผ ์ฌ์ฉ์ ํ๊ฒฝ์ ์น์ค๋์ด ์์ด, ๋ณ์์ด๋ ์ฌ๋ฌด์ค ๊ฐ์ ๋ค์ค ์ฌ์ฉ์ ๊ณต์ ํ๊ฒฝ์์์ ๋ฉ๋ชจ๋ฆฌ ๊ด๋ฆฌ ๋ฌธ์ ๋ฅผ ๊ฐ๊ณผํ๊ณ ์์ต๋๋ค. ๋ณธ ๋
ผ๋ฌธ์ ์ฌ๋ฌ ์ฌ์ฉ์๊ฐ ๊ณตํต ๋ฉ๋ชจ๋ฆฌ ํ์ ์ฌ์ฉํ๋ฉฐ ๊ฐ์์ ์ญํ ๊ณผ ๊ถํ์ ๋ฐ๋ผ ์ ๊ทผํ๋ ์ํฉ์ ํ๊ฐํ๊ธฐ ์ํด GateMem ๋ฒค์น๋งํฌ๋ฅผ ๋์
ํฉ๋๋ค. GateMem์ ์ ๋ณด์ ์ ์ฉ์ฑ(Utility), ๊ถํ ๊ฒฝ๊ณ์ ๋ฐ๋ฅธ ์ ๊ทผ ์ ์ด(Access Control), ๊ทธ๋ฆฌ๊ณ ๋ช
์์ ์ญ์ ์์ฒญ์ ๋ฐ๋ฅธ ๋ง๊ฐ(Forgetting) ๋ฅ๋ ฅ์ ์ข
ํฉ์ ์ผ๋ก ํ๊ฐํฉ๋๋ค. ์๋ฃ, ์ฌ๋ฌด, ๊ต์ก ๋ฑ ๋ค์ํ ๋๋ฉ์ธ์ ์๋๋ฆฌ์ค๋ฅผ ํตํด ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๊ฒ์ฆํ ๊ฒฐ๊ณผ, ํ์ฌ์ ์์ด์ ํธ๋ค์ ์ ์ฉ์ฑ๊ณผ ๋ณด์์ฑ ์ฌ์ด์ ๊ท ํ์ ์ก๋ ๋ฐ ์ด๋ ค์์ ๊ฒช๊ณ ์์ต๋๋ค. ํนํ RAG ๋ฐฉ์์ ๋น์ฉ์ ๋ฎ์ง๋ง ๊ถํ์ด ์๋ ์ ๋ณด ์ ์ถ์ด๋ ์ญ์ ๋ ์ ๋ณด ๋
ธ์ถ ๋ฌธ์ ๊ฐ ๋ฐ์ํจ์ ํ์ธํ์ต๋๋ค.
๐ ์ฃผ์ ๋ด์ฉ (Key Points)
- ๋ค์ค ์ฌ์ฉ์(Multi-principal) ํ๊ฒฝ์ ๋ฐ์ํ ๊ณต์ ๋ฉ๋ชจ๋ฆฌ ๊ฑฐ๋ฒ๋์ค ๋ฒค์น๋งํฌ 'GateMem' ๊ฐ๋ฐ
- ์ ๋ณด ์ ์ฉ์ฑ, ์ ๊ทผ ์ ์ด(Access Control), ๋ฅ๋์ ๋ง๊ฐ(Active Forgetting)์ ์ธ ๊ฐ์ง ํต์ฌ ์งํ ํตํฉ ํ๊ฐ
- ํ์กดํ๋ RAG ๋ฐ ์ธ๋ถ ๋ฉ๋ชจ๋ฆฌ ๋ฐฉ์์ด ๋ณด์ ๋ฐ ์ญ์ ์์ฒญ ์ดํ์์ ์ทจ์ฝํจ์ ์ ์ฆ
๐ก ์ค๋ฌด์ ๊ฐ์น (Relevance)
ํ์
ํด์ด๋ ๊ณต์ ๋น์ ์์ด์ ํธ ๊ฐ๋ฐ ์, ๋จ์ํ ์ ๋ณด ๊ฒ์(RAG)์ ๋์ด ์ฌ์ฉ์๋ณ ๊ถํ ๊ด๋ฆฌ์ ๊ฐ์ธ์ ๋ณด ์ญ์ ๊ฐ ์ค๋ฌด์ ์ผ๋ก ์ผ๋ง๋ ์ด๋ ค์ด์ง ์์ฌํฉ๋๋ค.
โ ์ถ์ฒ ์ก์ (Actionable Items)
- ์์ด์ ํธ ์ค๊ณ ์ ๋จ์ RAG ์ธ์ ๊ถํ ๊ณ์ธต(Role-based Access Control)์ด ์ ์ฉ๋ ๋ฉ๋ชจ๋ฆฌ ๋ ์ด์ด ์ค๊ณ ์คํ
- ์ฌ์ฉ์์ '์ญ์ ์์ฒญ' ์ ๋ฒกํฐ DB ๋ฐ ์บ์์์ ๋ฐ์ดํฐ๊ฐ ์์ ํ ์ ๊ฑฐ๋๋์ง ๊ฒ์ฆํ๋ ํ ์คํธ ์ผ์ด์ค ๊ตฌ์ถ
- Long-context ํ๋กฌํํ ๊ณผ RAG ๋ฐฉ์ ๊ฐ์ ๋ณด์์ฑ vs ๋น์ฉ ํจ์จ์ฑ ํธ๋ ์ด๋์คํ ๋ถ์