Ir al contenido

DeepSeek R1 Distill Qwen 32B

DeepSeek
Code Multilingual Thinking Tool Calls

DeepSeek R1 Distill Qwen 32B es un transformador denso de 32.760 millones de parametros de DeepSeek, destilado del modelo de razonamiento R1 mas grande en una arquitectura basada en Qwen. Destaca en razonamiento "chain-of-thought", generacion de codigo y tareas multilingues con capacidades de pensamiento integradas. Comparado con modelos instruct estandar de clase 30B, proporciona un razonamiento logico y matematico mas fuerte. El modelo soporta nueve idiomas y una ventana de contexto de 128K, lo que lo hace adecuado para desarrolladores e investigadores que necesitan inferencia enfocada en razonamiento en configuraciones GPU de gama media.

Configuración de hardware

Opcional — para recomendaciones de despliegue precisas
Cuantización Calidad Tamaño Ajuste
FP16 Precisión completa 61.03 GB
Q8_0 Alta 32.43 GB
Q6_K Alta 25.04 GB
Q5_K_M Media 21.66 GB
Q4_K_M Media 18.49 GB
Q3_K_M Baja 14.84 GB
Q2_K Baja 11.47 GB
Q2_K_L Baja 11.64 GB
Última actualización: 5 de marzo de 2026