Qwen3.5 0.8B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.5 0.8B es el modelo más pequeño de la familia Qwen 3.5 de Alibaba con arquitectura híbrida Gated Delta Networks y 870 millones de parámetros, diseñado para teléfonos, dispositivos edge y entornos con recursos extremadamente limitados. Es nativamente multimodal, procesando texto, imágenes y vídeo, con capacidades de razonamiento integradas para inferencia « chain-of-thought ». El modelo soporta una ventana de contexto de 262K y cubre más de 201 idiomas. Publicado bajo licencia Apache 2.0, se cuantiza a menos de 1 GB de VRAM en Q4, siendo ideal para clasificación y tareas simples en despliegue autoalojado.
Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| Q8_0 | Alta | 0.76 GB | — |
| Q8_K_XL | Alta | 1.1 GB | — |
| Q6_K | Alta | 0.6 GB | — |
| Q6_K_XL | Alta | 0.72 GB | — |
| Q5_K_M | Media | 0.55 GB | — |
| Q5_K_S | Media | 0.53 GB | — |
| Q5_K_XL | Media | 0.56 GB | — |
| Q4_K_M | Media | 0.5 GB | — |
| Q4_K_S | Media | 0.47 GB | — |
| Q4_K_XL | Media | 0.52 GB | — |
| Q4_0 | Media | 0.47 GB | — |
| Q4_1 | Media | 0.5 GB | — |
| Q3_K_M | Baja | 0.44 GB | — |
| Q3_K_S | Baja | 0.41 GB | — |
| Q3_K_XL | Baja | 0.46 GB | — |
| Q2_K_XL | Baja | 0.39 GB | — |
Última actualización: 13 de marzo de 2026