Qwen3.6 35B A3B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.6 35B A3B es un modelo « Mixture-of-Experts » del equipo Qwen de Alibaba con 35.900 millones de parámetros totales pero solo 3.000 millones activos por token, distribuidos entre 256 expertos mediante un novedoso mecanismo híbrido Gated DeltaNet y Gated Attention. Es nativamente multimodal, procesando texto, imágenes y vídeo, con capacidades integradas de razonamiento y llamada a herramientas en una ventana de contexto de 262K tokens. El modelo soporta más de 200 idiomas y se publica bajo licencia Apache 2.0. Con cuantización Q4 requiere aproximadamente 20 GB de VRAM, lo que lo hace muy práctico para el despliegue autoalojado en GPUs de consumo.
Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| BF16 | Precisión completa | 64.62 GB | — |
| Q8_0 | Alta | 34.37 GB | — |
| Q8_K_XL | Alta | 35.81 GB | — |
| Q6_K | Alta | 27.06 GB | — |
| Q6_K_XL | Alta | 29.66 GB | — |
| Q5_K_M | Media | 24.64 GB | — |
| Q5_K_S | Media | 23.23 GB | — |
| Q5_K_XL | Media | 24.77 GB | — |
| Q4_K_M | Media | 20.61 GB | — |
| Q4_K_S | Media | 19.46 GB | — |
| Q4_K_XL | Media | 20.82 GB | — |
| MXFP4_MOE | Media | 20.22 GB | — |
| IQ4_NL | Media | 16.8 GB | — |
| IQ4_XS | Media | 16.51 GB | — |
| Q3_K_M | Baja | 15.46 GB | — |
| Q3_K_S | Baja | 14.3 GB | — |
| Q3_K_XL | Baja | 15.69 GB | — |
| IQ3_S | Baja | 12.74 GB | — |
| IQ3_XXS | Baja | 12.3 GB | — |
| Q2_K_XL | Baja | 11.45 GB | — |
| IQ2_M | Baja | 10.73 GB | — |
| IQ2_XXS | Baja | 10.02 GB | — |
| IQ1_M | Baja | 9.36 GB | — |
Última actualización: 29 de abril de 2026