DeepSeek R1 Distill Qwen 32B
DeepSeek
Code Multilingual Thinking Tool Calls
DeepSeek R1 Distill Qwen 32B es un transformador denso de 32.760 millones de parametros de DeepSeek, destilado del modelo de razonamiento R1 mas grande en una arquitectura basada en Qwen. Destaca en razonamiento "chain-of-thought", generacion de codigo y tareas multilingues con capacidades de pensamiento integradas. Comparado con modelos instruct estandar de clase 30B, proporciona un razonamiento logico y matematico mas fuerte. El modelo soporta nueve idiomas y una ventana de contexto de 128K, lo que lo hace adecuado para desarrolladores e investigadores que necesitan inferencia enfocada en razonamiento en configuraciones GPU de gama media.
Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| FP16 | Precisión completa | 61.03 GB | — |
| Q8_0 | Alta | 32.43 GB | — |
| Q6_K | Alta | 25.04 GB | — |
| Q5_K_M | Media | 21.66 GB | — |
| Q4_K_M | Media | 18.49 GB | — |
| Q3_K_M | Baja | 14.84 GB | — |
| Q2_K | Baja | 11.47 GB | — |
| Q2_K_L | Baja | 11.64 GB | — |
Última actualización: 5 de marzo de 2026