SWE-bench Benchmark News benchmark update
mini-SWE-agent scores 65% on SWE-bench Verified in 100 lines of python code. [ Link ]
2025년 7월 27일 오후 03:00
원문 보기
mini-SWE-agent SWE-bench Python
📝 한국어 요약
mini-SWE-agent가 SWE-bench Verified 벤치마크에서 65%의 점수를 기록했습니다. 이 모델은 단 100라인의 Python 코드로 구현되었습니다.
🔑 핵심 포인트
- • mini-SWE-agent의 SWE-bench Verified 점수 65% 달성
- • 단 100라인의 Python 코드로 구현된 효율성
- • SWE-bench Verified 벤치마크 결과 보고
Original Context
mini-SWE-agent scores 65% on SWE-bench Verified in 100 lines of python code. [ Link ]