No Resource, No Benchmarks, No Problem? Evaluating and Improving LLMs for Code Generation in No-Resource Languages
Paper ID: 2606.16827 โข 0 Upvotes
Code Generation Domain-Specific Language Fine-tuning LLM Optimization Benchmark Evaluation
๐ ํต์ฌ ์์ฝ
๋ฐ์ดํฐ๊ฐ ๊ฑฐ์ ์๋ ํน์ ๋ชฉ์ ์ฉ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด๋ฅผ ์ํด LLM์ ์ฑ๋ฅ์ ํจ์จ์ ์ผ๋ก ๋์ด์ฌ๋ฆฌ๋ ๋ฐฉ๋ฒ๋ก ์ ์
๐ ์์ธ ๋ด์ฉ
์ต๊ทผ LLM ๊ธฐ๋ฐ ์ฝ๋ ์์ฑ ์ฐ๊ตฌ๋ ๋ฐ์ดํฐ๊ฐ ํ๋ถํ ์ธ์ด์ ์ง์ค๋์ด ์์ด, ์ฐ์
ํ์ฅ์ ๋
์์ ์ธ ๋๋ฉ์ธ ํนํ ์ธ์ด(No-resource languages) ๋์์๋ ํ๊ณ๊ฐ ์์ต๋๋ค. ๋ณธ ์ฐ๊ตฌ๋ ๋ฐ์ดํฐ๊ฐ ๊ฑฐ์ ์๋ ์ธ์ด๋ฅผ ์ํ 3์ข
์ ๋ฒค์น๋งํฌ๋ฅผ ๊ตฌ์ถํ๊ณ , ํ๋กฌํํธ ๊ธฐ๋ฒ๋ถํฐ ์ถ๊ฐ ์ฌ์ ํ์ต(Further Pre-training)๊น์ง ๋ค์ํ ํ์ต ์ ๋ต์ ์คํํ์ต๋๋ค. ์คํ ๊ฒฐ๊ณผ, ์ถ๊ฐ ์ฌ์ ํ์ต์ด ์ฑ๋ฅ ํฅ์์ ๊ฐ์ฅ ํจ๊ณผ์ ์ด์์ผ๋ ๊ธฐ์กด ์ง์ ์ดํ(Instruction-following) ๋ฅ๋ ฅ์ ์ ํดํ๋ ๋ฌธ์ ๊ฐ ๋ฐ๊ฒฌ๋์์ต๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ฒ ์ด์ค ๋ชจ๋ธ์ ํ๊ฒ ์ธ์ด๋ฅผ ํ์ต์ํจ ํ, ์ง์ ๋ชจ๋ธ์ ๊ฐ์ค์น ์ฐจ์ด(Weight Diff)๋ฅผ ์ ์ดํ๋ ๋ฐฉ์์ ์ ์ํ์ต๋๋ค. ์ด ์ ๊ทผ๋ฒ์ ์ ์ ๋น์ฉ์ผ๋ก๋ ํน์ ์ธ์ด์ ํนํ๋ ์ง์ ์ดํ ๋ชจ๋ธ์ ๊ตฌ์ถํ ์ ์์์ ์
์ฆํ์ต๋๋ค.
๐ ์ฃผ์ ๋ด์ฉ (Key Points)
- ๋ฐ์ดํฐ๊ฐ ๊ฑฐ์ ์๋(No-resource) ํน์ ์ธ์ด์ฉ ์ฝ๋ ์์ฑ ๋ฒค์น๋งํฌ ๊ตฌ์ถ
- ์ถ๊ฐ ์ฌ์ ํ์ต(Further Pre-training)์ ํตํ ๋๋ฉ์ธ ์ง์ ์ฃผ์ ์ ๋ต
- Weight Diff Transfer๋ฅผ ํ์ฉํ ์ง์ ์ดํ ๋ฅ๋ ฅ ์ ์ง ๋ฐ ํจ์จ์ ๋ชจ๋ธ ์ต์ ํ
๐ก ์ค๋ฌด์ ๊ฐ์น (Relevance)
๊ธฐ์
๋ด๋ถ์ ๋
์์ ์ธ DSL(Domain Specific Language)์ด๋ ๋ ๊ฑฐ์ ์ธ์ด๋ฅผ ์ฌ์ฉํ๋ ํ๊ฒฝ์์, ์ ์ ๋ฐ์ดํฐ๋ก๋ ๊ณ ์ฑ๋ฅ ์ฝ๋ ์์ฑ๊ธฐ๋ฅผ ๊ตฌ์ถํ ์ ์๋ ์ค๋ฌด์ ๊ฐ์ด๋๋ฅผ ์ ๊ณตํฉ๋๋ค.
โ ์ถ์ฒ ์ก์ (Actionable Items)
- ํน์ ๋๋ฉ์ธ ์ธ์ด ๋ฐ์ดํฐ์ ๊ตฌ์ถ ๋ฐ ๋ฒค์น๋งํฌ ์ค๊ณ
- Base ๋ชจ๋ธ์ ํ๊ฒ ์ธ์ด ๋ฐ์ดํฐ๋ก ์ถ๊ฐ ์ฌ์ ํ์ต ์ํ
- ํ์ต๋ ๋ชจ๋ธ์ ๊ธฐ์กด Instruction ๋ชจ๋ธ์ ๊ฐ์ค์น ์ฐจ์ด๋ฅผ ์ ์ฉํ์ฌ ์ง์ ์ดํ ๋ฅ๋ ฅ ๋ณต๊ตฌ ํ ์คํธ