Ir al contenido

Qwen3.6 35B A3B

Qwen
Code Multilingual Thinking Tool Calls Vision

Qwen3.6 35B A3B es un modelo « Mixture-of-Experts » del equipo Qwen de Alibaba con 35.900 millones de parámetros totales pero solo 3.000 millones activos por token, distribuidos entre 256 expertos mediante un novedoso mecanismo híbrido Gated DeltaNet y Gated Attention. Es nativamente multimodal, procesando texto, imágenes y vídeo, con capacidades integradas de razonamiento y llamada a herramientas en una ventana de contexto de 262K tokens. El modelo soporta más de 200 idiomas y se publica bajo licencia Apache 2.0. Con cuantización Q4 requiere aproximadamente 20 GB de VRAM, lo que lo hace muy práctico para el despliegue autoalojado en GPUs de consumo.

Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
Cuantización Calidad Tamaño Ajuste
BF16 Precisión completa 64.62 GB
Q8_0 Alta 34.37 GB
Q8_K_XL Alta 35.81 GB
Q6_K Alta 27.06 GB
Q6_K_XL Alta 29.66 GB
Q5_K_M Media 24.64 GB
Q5_K_S Media 23.23 GB
Q5_K_XL Media 24.77 GB
Q4_K_M Media 20.61 GB
Q4_K_S Media 19.46 GB
Q4_K_XL Media 20.82 GB
MXFP4_MOE Media 20.22 GB
IQ4_NL Media 16.8 GB
IQ4_XS Media 16.51 GB
Q3_K_M Baja 15.46 GB
Q3_K_S Baja 14.3 GB
Q3_K_XL Baja 15.69 GB
IQ3_S Baja 12.74 GB
IQ3_XXS Baja 12.3 GB
Q2_K_XL Baja 11.45 GB
IQ2_M Baja 10.73 GB
IQ2_XXS Baja 10.02 GB
IQ1_M Baja 9.36 GB
Última actualización: 29 de abril de 2026