Funcionalidade | GPT-4.5 | GPT-4o |
---|---|---|
Indicadores de Performance | ||
GPQA (ciências) | 71.4% | 53.6% |
AIME '24 (matemática) | 36.7% | 9.3% |
MMMLU (multilíngue) | 85.1% | 81.5% |
MMMU (multimodal) | 74.4% | 69.1% |
SWE-lancer Diamond (codificação) | 32.6% | 23.3% |
SWE-Bench Verified (codificação) | 38.0% | 30.7% |