PyoSignal Logo
PyoSignal
Back to Model & Benchmarks
LiveCodeBench Benchmark Leaderboard benchmark snapshot

LiveCodeBench top model: Gemini-2.5-Pro-06-05

2025년 4월 7일 오전 12:00 원문 보기
LiveCodeBench Gemini-2.5-Pro-06-05 avg_pass@1

📝 한국어 요약

LiveCodeBench 벤치마크에서 Gemini-2.5-Pro-06-05 모델이 상위 성적을 기록했습니다. 해당 모델은 4개의 문제를 대상으로 avg_pass@1 25.0%의 성능을 보여주었습니다.

🔑 핵심 포인트

  • Gemini-2.5-Pro-06-05 모델이 LiveCodeBench에서 top model로 기록됨
  • 테스트에 사용된 문제 수는 총 4개임
  • avg_pass@1 지표 기준 25.0%의 성능을 달성함

📊 Metrics

avg pass at 1
25
problem count
4
model
Gemini-2.5-Pro-06-05

Original Context

avg_pass@1=25.0, problems=4