Qwen3 32B
Qwen
Code Multilingual Thinking Tool Calls
Qwen3 32B es un transformador denso de 32.000 millones de parametros del equipo Qwen de Alibaba, que combina capacidades de razonamiento con generacion de codigo solida, "tool calling" y soporte multilingue. Ocupa una clase de parametros intermedia que equilibra la profundidad de razonamiento con requisitos practicos de despliegue, superando a muchos modelos mas grandes en benchmarks de matematicas y logica. El modelo soporta 14 idiomas, incluidos ingles, chino y arabe. Con una ventana de contexto de 40K y "flash attention", cabe en una sola GPU de gama alta con cuantizacion Q4 para inferencia autoalojada.
Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| Q8_0 | Alta | 32.43 GB | — |
| Q8_K_XL | Alta | 36.77 GB | — |
| Q6_K | Alta | 25.04 GB | — |
| Q6_K_XL | Alta | 26.97 GB | — |
| Q5_K_M | Media | 21.62 GB | — |
| Q5_K_S | Media | 21.08 GB | — |
| Q5_K_XL | Media | 21.64 GB | — |
| Q4_K_M | Media | 18.4 GB | — |
| Q4_K_S | Media | 17.48 GB | — |
| Q4_K_XL | Media | 18.65 GB | — |
| Q4_0 | Media | 17.42 GB | — |
| Q4_1 | Media | 19.22 GB | — |
| Q3_K_M | Baja | 14.87 GB | — |
| Q3_K_S | Baja | 13.4 GB | — |
| Q3_K_XL | Baja | 15.28 GB | — |
| Q2_K | Baja | 11.5 GB | — |
| Q2_K_L | Baja | 11.67 GB | — |
| Q2_K_XL | Baja | 11.92 GB | — |
Última actualización: 5 de marzo de 2026