Ir al contenido

Qwen3 32B

Qwen
Code Multilingual Thinking Tool Calls

Qwen3 32B es un transformador denso de 32.000 millones de parametros del equipo Qwen de Alibaba, que combina capacidades de razonamiento con generacion de codigo solida, "tool calling" y soporte multilingue. Ocupa una clase de parametros intermedia que equilibra la profundidad de razonamiento con requisitos practicos de despliegue, superando a muchos modelos mas grandes en benchmarks de matematicas y logica. El modelo soporta 14 idiomas, incluidos ingles, chino y arabe. Con una ventana de contexto de 40K y "flash attention", cabe en una sola GPU de gama alta con cuantizacion Q4 para inferencia autoalojada.

Configuración de hardware

Opcional — para recomendaciones de despliegue precisas
Cuantización Calidad Tamaño Ajuste
Q8_0 Alta 32.43 GB
Q8_K_XL Alta 36.77 GB
Q6_K Alta 25.04 GB
Q6_K_XL Alta 26.97 GB
Q5_K_M Media 21.62 GB
Q5_K_S Media 21.08 GB
Q5_K_XL Media 21.64 GB
Q4_K_M Media 18.4 GB
Q4_K_S Media 17.48 GB
Q4_K_XL Media 18.65 GB
Q4_0 Media 17.42 GB
Q4_1 Media 19.22 GB
Q3_K_M Baja 14.87 GB
Q3_K_S Baja 13.4 GB
Q3_K_XL Baja 15.28 GB
Q2_K Baja 11.5 GB
Q2_K_L Baja 11.67 GB
Q2_K_XL Baja 11.92 GB
Última actualización: 5 de marzo de 2026