Qwen3.6 35B A3B

Code Multilingual Thinking Tool Calls Vision

Qwen3.6 35B A3B es un modelo « Mixture-of-Experts » del equipo Qwen de Alibaba con 35.900 millones de parámetros totales pero solo 3.000 millones activos por token, distribuidos entre 256 expertos mediante un novedoso mecanismo híbrido Gated DeltaNet y Gated Attention. Es nativamente multimodal, procesando texto, imágenes y vídeo, con capacidades integradas de razonamiento y llamada a herramientas en una ventana de contexto de 262K tokens. El modelo soporta más de 200 idiomas y se publica bajo licencia Apache 2.0. Con cuantización Q4 requiere aproximadamente 20 GB de VRAM, lo que lo hace muy práctico para el despliegue autoalojado en GPUs de consumo.

Configuración de hardware

Fabricante

Producto

Plataforma

Familia

Modelo

VRAM

RAM del sistema (GB) Opcional — para recomendaciones de despliegue precisas

Cuantización	Calidad	Tamaño	Ajuste
BF16	Precisión completa	64.62 GB	—
Q8_0	Alta	34.37 GB	—
Q8_K_XL	Alta	35.81 GB	—
Q6_K	Alta	27.06 GB	—
Q6_K_XL	Alta	29.66 GB	—
Q5_K_M	Media	24.64 GB	—
Q5_K_S	Media	23.23 GB	—
Q5_K_XL	Media	24.77 GB	—
Q4_K_M	Media	20.61 GB	—
Q4_K_S	Media	19.46 GB	—
Q4_K_XL	Media	20.82 GB	—
MXFP4_MOE	Media	20.22 GB	—
IQ4_NL	Media	16.8 GB	—
IQ4_XS	Media	16.51 GB	—
Q3_K_M	Baja	15.46 GB	—
Q3_K_S	Baja	14.3 GB	—
Q3_K_XL	Baja	15.69 GB	—
IQ3_S	Baja	12.74 GB	—
IQ3_XXS	Baja	12.3 GB	—
Q2_K_XL	Baja	11.45 GB	—
IQ2_M	Baja	10.73 GB	—
IQ2_XXS	Baja	10.02 GB	—
IQ1_M	Baja	9.36 GB	—

Última actualización: 29 de abril de 2026