DeepSeek V3
⭐ Стандартный запрос: Бесплатные пользователи получают ежедневное использование при входе, разблокируйте неограниченное использование, пригласив друзей
DeepSeek V3 — это революционная модель ИИ с архитектурой Mixture-of-Experts на 671 миллиард параметров. Выпущенная DeepSeek-AI в декабре 2023 года, она демонстрирует исключительные возможности в математике, программировании и задачах рассуждения. С 37 миллиардами активных параметров на токен и поддержкой длины контекста в 128K, она устанавливает новые стандарты производительности и универсальности ИИ.
✨ Основные возможности
- Продвинутая архитектура MoE с общим числом параметров 671 миллиард
- Расширенная длина контекста до 128K токенов
- Инновационная стратегия балансировки нагрузки без вспомогательных потерь
- Цель обучения с предсказанием нескольких токенов
- Выдающиеся результаты на тестах:
- MMLU: 87.1%
- C-Eval: 90.1%
- GSM8K: 89.3%
- HumanEval: 65.2%