Qwen3.5 9B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.5 9B es el modelo insignia de tamaño pequeño en la familia Qwen 3.5 de Alibaba con arquitectura híbrida Gated Delta Networks y 9.650 millones de parámetros, superando a gpt-oss-120B en GPQA Diamond con 81,7 frente a 80,1 con trece veces menos parámetros. Es nativamente multimodal, procesando texto, imágenes y vídeo, con capacidades de razonamiento integradas para inferencia « chain-of-thought ». El modelo soporta una ventana de contexto de 262K y cubre más de 201 idiomas. Publicado bajo licencia Apache 2.0, funciona con aproximadamente 5 GB de VRAM en Q4, siendo una opción de primer nivel para despliegue autoalojado en hardware de consumo.
Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| Q8_0 | Alta | 8.87 GB | — |
| Q8_K_XL | Alta | 12.08 GB | — |
| Q6_K | Alta | 6.95 GB | — |
| Q6_K_XL | Alta | 8.16 GB | — |
| Q5_K_M | Media | 6.13 GB | — |
| Q5_K_S | Media | 5.92 GB | — |
| Q5_K_XL | Media | 6.28 GB | — |
| Q4_K_M | Media | 5.29 GB | — |
| Q4_K_S | Media | 5.02 GB | — |
| Q4_K_XL | Media | 5.56 GB | — |
| Q4_0 | Media | 5.01 GB | — |
| Q4_1 | Media | 5.44 GB | — |
| Q3_K_M | Baja | 4.35 GB | — |
| Q3_K_S | Baja | 4.02 GB | — |
| Q3_K_XL | Baja | 4.71 GB | — |
| Q2_K_XL | Baja | 3.84 GB | — |
Última actualización: 13 de marzo de 2026