PyoSignal Logo
PyoSignal
Back to Model & Benchmarks
SWE-bench Benchmark News benchmark update

mini-SWE-agent scores 65% on SWE-bench Verified in 100 lines of python code. [ Link ]

2025년 7월 27일 오후 03:00 원문 보기
mini-SWE-agent SWE-bench Python

📝 한국어 요약

mini-SWE-agent가 SWE-bench Verified 벤치마크에서 65%의 점수를 기록했습니다. 이 모델은 단 100라인의 Python 코드로 구현되었습니다.

🔑 핵심 포인트

  • mini-SWE-agent의 SWE-bench Verified 점수 65% 달성
  • 단 100라인의 Python 코드로 구현된 효율성
  • SWE-bench Verified 벤치마크 결과 보고

Original Context

mini-SWE-agent scores 65% on SWE-bench Verified in 100 lines of python code. [ Link ]