ฟีเจอร์ | GPT-4.5 | GPT-4o |
---|---|---|
ตัวชี้วัดประสิทธิภาพ | ||
GPQA (วิทยาศาสตร์) | 71.4% | 53.6% |
AIME '24 (คณิตศาสตร์) | 36.7% | 9.3% |
MMMLU (หลายภาษา) | 85.1% | 81.5% |
MMMU (หลายรูปแบบ) | 74.4% | 69.1% |
SWE-lancer Diamond (การเขียนโค้ด) | 32.6% | 23.3% |
SWE-Bench Verified (การเขียนโค้ด) | 38.0% | 30.7% |