Qwen3 32B

Code Multilingual Thinking Tool Calls

Qwen3 32B es un transformador denso de 32.000 millones de parametros del equipo Qwen de Alibaba, que combina capacidades de razonamiento con generacion de codigo solida, "tool calling" y soporte multilingue. Ocupa una clase de parametros intermedia que equilibra la profundidad de razonamiento con requisitos practicos de despliegue, superando a muchos modelos mas grandes en benchmarks de matematicas y logica. El modelo soporta 14 idiomas, incluidos ingles, chino y arabe. Con una ventana de contexto de 40K y "flash attention", cabe en una sola GPU de gama alta con cuantizacion Q4 para inferencia autoalojada.

Configuración de hardware

Fabricante

Producto

Plataforma

Familia

Modelo

VRAM

RAM del sistema (GB) Opcional — para recomendaciones de despliegue precisas

Cuantización	Calidad	Tamaño	Ajuste
Q8_0	Alta	32.43 GB	—
Q8_K_XL	Alta	36.77 GB	—
Q6_K	Alta	25.04 GB	—
Q6_K_XL	Alta	26.97 GB	—
Q5_K_M	Media	21.62 GB	—
Q5_K_S	Media	21.08 GB	—
Q5_K_XL	Media	21.64 GB	—
Q4_K_M	Media	18.4 GB	—
Q4_K_S	Media	17.48 GB	—
Q4_K_XL	Media	18.65 GB	—
Q4_0	Media	17.42 GB	—
Q4_1	Media	19.22 GB	—
Q3_K_M	Baja	14.87 GB	—
Q3_K_S	Baja	13.4 GB	—
Q3_K_XL	Baja	15.28 GB	—
Q2_K	Baja	11.5 GB	—
Q2_K_L	Baja	11.67 GB	—
Q2_K_XL	Baja	11.92 GB	—

Última actualización: 24 de marzo de 2026