Large Language Models Explore by Latent Distilling
Paper ID: 2604.24927 โข 50 Upvotes
LLM Decoding Generative AI Diversity Semantic Exploration RAG Reasoning Benchmark Inference Distillation
๐ ํต์ฌ ์์ฝ
LLM์ ์๋ฏธ๋ก ์ ๋ค์์ฑ์ ๋์ฌ ์ถ๋ก ๋ฐ ์์ฑ ์ฑ๋ฅ์ ํฅ์์ํค๋ ์๋ก์ด ๋์ฝ๋ฉ ๊ธฐ๋ฒ์ผ๋ก, ๊ธฐ์กด ์ํ๋ง์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ณ ์ค์ ์ ํ๋ฆฌ์ผ์ด์
์ ๊ฒฌ๊ณ ์ฑ์ ๋์ผ ์ ์์ต๋๋ค.
๐ ์์ธ ๋ด์ฉ
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๋ค์ํ ์๋ต ์์ฑ์ ์ค์ํ์ง๋ง, ๊ธฐ์กด ํ๋ฅ ์ ์ํ๋ง์ ํ๋ฉด์ ์ธ ์ดํ ๋ณํ์ ๊ทธ์ณ ์๋ฏธ๋ก ์ ํ์์ ์ ํํ๋ ๋ฌธ์ ๊ฐ ์์ต๋๋ค. ๋ณธ ๋
ผ๋ฌธ์ ์์ฑ ๊ณผ์ ์์ ์๋ฏธ๋ก ์ ๋ค์์ฑ์ ๋ช
์์ ์ผ๋ก ์ฅ๋ คํ๋ ๋์ฝ๋ฉ ์ ๊ทผ ๋ฐฉ์์ธ Exploratory Sampling (ESamp)์ ์ ์ํฉ๋๋ค. ESamp๋ LLM์ ์์ ๋ ์ด์ด์์ ๊น์ ๋ ์ด์ด ํํ์ ์์ธกํ๋ ๊ฒฝ๋ Distiller๋ฅผ ํ๋ จํ๊ณ , ์ด ์์ธก ์ค๋ฅ๋ฅผ ์ฐธ์ ์ฑ ์ ํธ๋ก ์ฌ์ฉํ์ฌ ๋ ํ์๋ ์๋ฏธ ํจํด์ผ๋ก ๋์ฝ๋ฉ์ ์ ๋ํฉ๋๋ค. ๋น๋๊ธฐ ํ๋ จ-์ถ๋ก ํ์ดํ๋ผ์ธ์ผ๋ก ๊ตฌํ๋์ด ์ต์
์ ๊ฒฝ์ฐ 5% ๋ฏธ๋ง์ ์ค๋ฒํค๋๋ฅผ ๋ณด์
๋๋ค. ๊ฒฝํ์ ๊ฒฐ๊ณผ์ ๋ฐ๋ฅด๋ฉด ESamp๋ ์ถ๋ก ๋ชจ๋ธ์ Pass@k ํจ์จ์ฑ์ ํฌ๊ฒ ๋์ด๊ณ , ์ํ, ๊ณผํ, ์ฝ๋ ์์ฑ ๋ฒค์น๋งํฌ์์ ๊ฐ๋ ฅํ ์ผ๋ฐํ๋ฅผ ๋ณด์ด๋ฉฐ, ์ฐฝ์์ ๊ธ์ฐ๊ธฐ์์ ๋ค์์ฑ๊ณผ ์ผ๊ด์ฑ ๊ฐ์ ํธ๋ ์ด๋์คํ๋ฅผ ํด์ํฉ๋๋ค.
๐ ์ฃผ์ ๋ด์ฉ (Key Points)
- ์๋ฏธ๋ก ์ ๋ค์์ฑ์ ๋ช ์์ ์ผ๋ก ์ฅ๋ คํ๋ ์๋ก์ด LLM ๋์ฝ๋ฉ ๊ธฐ๋ฒ์ธ Exploratory Sampling (ESamp) ์ ์.
- ๊ฒฝ๋ Distiller๋ฅผ ํ์ฉํ์ฌ LLM์ ๊น์ด๋ณ ํํ ์ ํ์ ๋ชจ๋ธ๋งํ๊ณ ์์ธก ์ค๋ฅ๋ฅผ ์ฐธ์ ์ฑ ์ ํธ๋ก ์ฌ์ฉ.
- ์ถ๋ก , ์ฝ๋ ์์ฑ, ์ฐฝ์์ ๊ธ์ฐ๊ธฐ ๋ฑ ๋ค์ํ ํ์คํฌ์์ Pass@k ํจ์จ์ฑ ๋ฐ ์์ฑ ํ์ง์ ํฌ๊ฒ ํฅ์์ํด.
๐ก ์ค๋ฌด์ ๊ฐ์น (Relevance)
๊ฐ๋ฐ์๋ค์ ์ด ๊ธฐ๋ฒ์ ํตํด LLM์ด ๋ ์ฐฝ์์ ์ด๊ณ ๊ฒฌ๊ณ ํ๋ฉฐ, ์์ธก ๋ถ๊ฐ๋ฅํ ์๋๋ฆฌ์ค์์๋ ๋์ ์ฑ๋ฅ์ ๋ฐํํ๋ ์ ํ๋ฆฌ์ผ์ด์
์ ๊ตฌ์ถํ ์ ์์ต๋๋ค. ํนํ ์ฝ๋ ์์ฑ์ด๋ ๋ณต์กํ ์ถ๋ก ํ์คํฌ์์ LLM์ ์ ์ฌ๋ ฅ์ ์ต๋ํ ํ์ฉํ๋ ๋ฐ ๊ธฐ์ฌํ ์ ์์ต๋๋ค.
โ ์ถ์ฒ ์ก์ (Actionable Items)
- ๊ธฐ์กด LLM ๋์ฝ๋ฉ ์ ๋ต(์: Top-p, Top-k)๊ณผ ESamp๋ฅผ ๋น๊ตํ์ฌ ํน์ ๋๋ฉ์ธ์์์ ์ฑ๋ฅ ํฅ์ ํญ์ ์ธก์ ํด๋ณผ ๊ฒ.
- ์ฝ๋ ์์ฑ ์๋๋ฆฌ์ค์์ ESamp๋ฅผ ์ ์ฉํ์ฌ ์์ฑ๋ ์ฝ๋์ ๋ค์์ฑ๊ณผ ์ ํ์ฑ, ๊ทธ๋ฆฌ๊ณ ๋ฒ๊ทธ ๊ฐ์ ํจ๊ณผ๋ฅผ ํ๊ฐํด๋ณผ ๊ฒ.
- ์ฐฝ์์ ๊ธ์ฐ๊ธฐ ๋๋ ์คํ ๋ฆฌ ์์ฑ ํ์คํฌ์์ ESamp๊ฐ ์์ฑํ๋ ํ ์คํธ์ ์ฐธ์ ์ฑ๊ณผ ์ผ๊ด์ฑ์ ๋ถ์ํ๊ณ ์ฌ์ฉ์ ํผ๋๋ฐฑ์ ์์งํด๋ณผ ๊ฒ.