Функция | GPT-4.5 | GPT-4o |
---|---|---|
Метрики производительности | ||
GPQA (наука) | 71.4% | 53.6% |
AIME '24 (математика) | 36.7% | 9.3% |
MMMLU (мультиязычный) | 85.1% | 81.5% |
MMMU (мультимодальный) | 74.4% | 69.1% |
SWE-lancer Diamond (кодирование) | 32.6% | 23.3% |
SWE-Bench Verified (кодирование) | 38.0% | 30.7% |