LiveCodeBench Benchmark Leaderboard benchmark snapshot
LiveCodeBench top model: Gemini-2.5-Pro-06-05
2025년 4월 7일 오전 12:00
원문 보기
LiveCodeBench Gemini-2.5-Pro-06-05 avg_pass@1
📝 한국어 요약
LiveCodeBench 벤치마크에서 Gemini-2.5-Pro-06-05 모델이 상위 성적을 기록했습니다. 해당 모델은 4개의 문제를 대상으로 avg_pass@1 25.0%의 성능을 보여주었습니다.
🔑 핵심 포인트
- • Gemini-2.5-Pro-06-05 모델이 LiveCodeBench에서 top model로 기록됨
- • 테스트에 사용된 문제 수는 총 4개임
- • avg_pass@1 지표 기준 25.0%의 성능을 달성함
📊 Metrics
avg pass at 1
25
problem count
4
model
Gemini-2.5-Pro-06-05
Original Context
avg_pass@1=25.0, problems=4