JAMER: Project-Level Code Framework Dataset and Benchmark on Professional Game Engines
Paper ID: 2606.19830 β’ 0 Upvotes
GameDev Benchmark CodeGeneration SoftwareEngineering Agent Evaluation Distillation Safety
π ν΅μ¬ μμ½
μ λ¬Έ κ²μ μμ§ νκ²½μμμ νλ‘μ νΈ λ¨μ μ½λ μμ± λ° κ²μ¦μ μν λκ·λͺ¨ λ°μ΄ν°μ
κ³Ό λ²€μΉλ§ν¬ μ μ
π μμΈ λ΄μ©
κΈ°μ‘΄ AI κ²μ κ°λ° μ°κ΅¬λ μμ
μμ±μ΄λ λ¨μ μ½λ©μ μΉμ€λμ΄ μμ΄, μ λ¬Έ μμ§ κΈ°λ°μ νλ‘μ νΈ λ¨μ μμ§λμ΄λ§ μ°κ΅¬λ λΆμ‘±ν μ€μ μ
λλ€. λ³Έ λ
Όλ¬Έμ Game Jam νλ‘μ νΈλ₯Ό νμ©νμ¬ Godot μμ§ κΈ°λ°μ λκ·λͺ¨ λ°μ΄ν°μ
μΈ JamSetκ³Ό λ²€μΉλ§ν¬μΈ JamBenchλ₯Ό ꡬμΆνμ΅λλ€. 24λ§ κ° μ΄μμ μ μ₯μμμ μΆμΆν 8,133κ°μ νλ‘μ νΈλ₯Ό μ μ νμ¬ λ°μ΄ν°μ
μ ꡬμ±νκ³ , 300κ°μ κ²μ¦λ νλ‘μ νΈλ‘ λ²€μΉλ§ν¬λ₯Ό μ€κ³νμ΅λλ€. μ€ν κ²°κ³Ό, νλ‘μ νΈ κ·λͺ¨κ° 컀μ§μλ‘ λͺ¨λΈμ λ°νμ ν΅κ³Όμ¨μ΄ κΈκ²©ν νλ½νλ 'λ₯λ ₯ μ λ²½' νμμ΄ κ΄μ°°λμμ΅λλ€. λν, μ½λ μμ΄μ νΈκ° μ»΄νμΌ μ±κ³΅λ₯ μ λμ΄μ§λ§ λ°νμ λμ νμ§μ κ°μ νμ§ λͺ»νλ€λ μ μ λ°νλμ΅λλ€.
π μ£Όμ λ΄μ© (Key Points)
- Game Jam λ°μ΄ν°λ₯Ό νμ©ν μ΅μ΄μ μ λ¬Έ μμ§ κΈ°λ° νλ‘μ νΈ λ¨μ λ°μ΄ν°μ (JamSet) λ° λ²€μΉλ§ν¬(JamBench) ꡬμΆ
- νμΌ λ¬΄κ²°μ±λΆν° λ°νμ λμκΉμ§ ν¬ν¨νλ κ²°μ λ‘ μ κ²μ¦ νμ΄νλΌμΈ μ€κ³
- νλ‘μ νΈ κ·λͺ¨ μ¦κ°μ λ°λ₯Έ λͺ¨λΈ μ±λ₯ μ ν λ° μν€ν μ² μ€κ³ μλμ νκ³ κ·λͺ
π‘ μ€λ¬΄μ κ°μΉ (Relevance)
λ¨μ μ½λ μ€λν« μμ±μ λμ΄, 볡μ‘ν νμΌ κ΅¬μ‘°μ λ°νμ λμμ΄ μ€μν κ²μ κ°λ° λΆμΌμμ AIμ μ€μ§μ μΈ νλ‘μ νΈ κ΄λ¦¬ λ₯λ ₯μ νκ°νλ κΈ°μ€μ μ μν©λλ€.
β μΆμ² μ‘μ (Actionable Items)
- Godot μμ§ νκ²½μμ λκ·λͺ¨ νλ‘μ νΈ κ΅¬μ‘°λ₯Ό λ€λ£¨λ λ©ν° νμΌ μμ± μ€ν
- μ½λ μμ΄μ νΈ λμ μ μ»΄νμΌ μ±κ³΅λ₯ κ³Ό μ€μ κ²μ νλ μ΄ λμ κ°μ μκ΄κ΄κ³ λΆμ
- νλ‘μ νΈ κ·λͺ¨(νμΌ κ°μ, μμ‘΄μ± λ³΅μ‘λ)μ λ°λ₯Έ λͺ¨λΈ μ±λ₯ μ ν μ§μ νμ