PyoSignal Logo
PyoSignal
Back to Research

AgentSPEX: An Agent SPecification and EXecution Language

Paper ID: 2604.13346 โ€ข 49 Upvotes
Agent LLM Workflow DSL Orchestration Reasoning Benchmark Evaluation
AgentSPEX: An Agent SPecification and EXecution Language

๐Ÿ“ ํ•ต์‹ฌ ์š”์•ฝ

LLM ์—์ด์ „ํŠธ์˜ ๋ณต์žกํ•œ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ๋ช…์‹œ์  ์ œ์–ด ํ๋ฆ„๊ณผ ๋ชจ๋“ˆ์‹ ๊ตฌ์กฐ๋กœ ์ •์˜ํ•˜์—ฌ ๊ฐœ๋ฐœ ๋ฐ ์œ ์ง€๋ณด์ˆ˜๋ฅผ ์šฉ์ดํ•˜๊ฒŒ ํ•˜๋Š” ์ƒˆ๋กœ์šด ์–ธ์–ด AgentSPEX๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ“– ์ƒ์„ธ ๋‚ด์šฉ

ํ˜„์žฌ LLM ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์€ ๋ฐ˜์‘ํ˜• ํ”„๋กฌํ”„ํŒ…์— ์˜์กดํ•˜๊ฑฐ๋‚˜ ํŒŒ์ด์ฌ์— ๊ฐ•ํ•˜๊ฒŒ ๊ฒฐํ•ฉ๋œ ์˜ค์ผ€์ŠคํŠธ๋ ˆ์ด์…˜ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์—์ด์ „ํŠธ์˜ ์ œ์–ด ํ๋ฆ„๊ณผ ์ค‘๊ฐ„ ์ƒํƒœ๋ฅผ ๋ถˆ๋ถ„๋ช…ํ•˜๊ฒŒ ๋งŒ๋“ค๊ณ , ํ–‰๋™ ์ œ์–ด๋ฅผ ์–ด๋ ต๊ฒŒ ํ•˜๋ฉฐ, ์œ ์ง€๋ณด์ˆ˜ ๋ฐ ์ˆ˜์ •์— ์–ด๋ ค์›€์„ ์ดˆ๋ž˜ํ•ฉ๋‹ˆ๋‹ค. ๋ณธ ๋…ผ๋ฌธ์€ ๋ช…์‹œ์ ์ธ ์ œ์–ด ํ๋ฆ„๊ณผ ๋ชจ๋“ˆ์‹ ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง„ LLM ์—์ด์ „ํŠธ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ์œ„ํ•œ AgentSPEX๋ผ๋Š” ์ƒˆ๋กœ์šด ๋ช…์„ธ ๋ฐ ์‹คํ–‰ ์–ธ์–ด๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. AgentSPEX๋Š” ํƒ€์ž… ์Šคํ…, ๋ถ„๊ธฐ, ๋ฃจํ”„, ๋ณ‘๋ ฌ ์‹คํ–‰, ์žฌ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ์„œ๋ธŒ๋ชจ๋“ˆ, ๋ช…์‹œ์  ์ƒํƒœ ๊ด€๋ฆฌ๋ฅผ ์ง€์›ํ•˜๋ฉฐ, ๋„๊ตฌ ์ ‘๊ทผ, ์ƒŒ๋“œ๋ฐ•์Šค ํ™˜๊ฒฝ, ์ฒดํฌํฌ์ธํŒ…, ๊ฒ€์ฆ, ๋กœ๊น…์„ ์ œ๊ณตํ•˜๋Š” ์—์ด์ „ํŠธ ํ•˜๋„ค์Šค ๋‚ด์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ์‹œ๊ฐ์  ํŽธ์ง‘๊ธฐ๋„ ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค. AgentSPEX๋Š” 7๊ฐ€์ง€ ๋ฒค์น˜๋งˆํฌ์—์„œ ํ‰๊ฐ€๋˜์—ˆ์œผ๋ฉฐ, ์‚ฌ์šฉ์ž ์—ฐ๊ตฌ๋ฅผ ํ†ตํ•ด ๊ธฐ์กด ์ธ๊ธฐ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋ณด๋‹ค ๋” ํ•ด์„ ๊ฐ€๋Šฅํ•˜๊ณ  ์ ‘๊ทผํ•˜๊ธฐ ์‰ฌ์šด ์›Œํฌํ”Œ๋กœ์šฐ ์ž‘์„ฑ ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ๊ณตํ•จ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์ฃผ์š” ๋‚ด์šฉ (Key Points)

  • LLM ์—์ด์ „ํŠธ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ์œ„ํ•œ ๋ช…์‹œ์  ์ œ์–ด ํ๋ฆ„๊ณผ ๋ชจ๋“ˆ์‹ ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง„ ์ƒˆ๋กœ์šด ์–ธ์–ด AgentSPEX ์ œ์•ˆ.
  • ํƒ€์ž… ์Šคํ…, ๋ถ„๊ธฐ, ๋ฃจํ”„, ๋ณ‘๋ ฌ ์‹คํ–‰, ์žฌ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ์„œ๋ธŒ๋ชจ๋“ˆ, ๋ช…์‹œ์  ์ƒํƒœ ๊ด€๋ฆฌ ๋“ฑ ๊ณ ๊ธ‰ ์›Œํฌํ”Œ๋กœ์šฐ ๊ธฐ๋Šฅ ์ง€์›.
  • ๋„๊ตฌ ์ ‘๊ทผ, ์ƒŒ๋“œ๋ฐ•์Šค, ์ฒดํฌํฌ์ธํŒ…, ๊ฒ€์ฆ, ๋กœ๊น…์„ ํฌํ•จํ•˜๋Š” ์‚ฌ์šฉ์ž ์ •์˜ ๊ฐ€๋Šฅํ•œ ์—์ด์ „ํŠธ ์‹คํ–‰ ํ•˜๋„ค์Šค ์ œ๊ณต.

๐Ÿ’ก ์‹ค๋ฌด์  ๊ฐ€์น˜ (Relevance)

๊ธฐ์กด LLM ์—์ด์ „ํŠธ ๊ฐœ๋ฐœ์˜ ๊ณ ์งˆ์ ์ธ ๋ฌธ์ œ์ธ ์ œ์–ด์˜ ์–ด๋ ค์›€๊ณผ ์œ ์ง€๋ณด์ˆ˜ ๋ณต์žก์„ฑ์„ ํ•ด๊ฒฐํ•˜์—ฌ, ๊ฐœ๋ฐœ์ž๋“ค์ด ๋”์šฑ ์•ˆ์ •์ ์ด๊ณ  ์˜ˆ์ธก ๊ฐ€๋Šฅํ•œ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ๊ตฌ์ถ•ํ•˜๊ณ  ๊ด€๋ฆฌํ•  ์ˆ˜ ์žˆ๋„๋ก ๋•์Šต๋‹ˆ๋‹ค.

โœ… ์ถ”์ฒœ ์•ก์…˜ (Actionable Items)

  • ๋ณต์žกํ•œ ์ œ์–ด ํ๋ฆ„์ด ํ•„์š”ํ•œ ์ƒˆ๋กœ์šด LLM ์—์ด์ „ํŠธ ํ”„๋กœ์ ํŠธ์— AgentSPEX ๋„์ž…์„ ๊ฒ€ํ† .
  • ๊ธฐ์กด์˜ ๋ฐ˜์‘ํ˜• ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๋‚˜ ํŒŒ์ด์ฌ ๊ฒฐํ•ฉ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ AgentSPEX๋กœ ์ „ํ™˜ํ•˜์—ฌ ์œ ์ง€๋ณด์ˆ˜์„ฑ ๊ฐœ์„  ๊ฐ€๋Šฅ์„ฑ ํ‰๊ฐ€.
  • AgentSPEX์˜ ์‹œ๊ฐ์  ํŽธ์ง‘๊ธฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์—์ด์ „ํŠธ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ์„ค๊ณ„ํ•˜๊ณ  ํŒ€ ๋‚ด ํ˜‘์—… ํšจ์œจ์„ฑ ์ฆ๋Œ€.