Qwen3.5 4B

Code Multilingual Thinking Tool Calls Vision

Qwen3.5 4B es un modelo de la familia Qwen 3.5 de Alibaba con arquitectura híbrida Gated Delta Networks y 4.660 millones de parámetros, ampliamente considerado como el punto óptimo de rendimiento por vatio en la comunidad. Es nativamente multimodal, procesando texto, imágenes y vídeo, con capacidades de razonamiento integradas para inferencia « chain-of-thought ». El modelo soporta una ventana de contexto de 262K y cubre más de 201 idiomas, igualando casi a modelos MoE de 80B de la generación anterior en benchmarks de código. Publicado bajo licencia Apache 2.0, funciona con aproximadamente 3 GB de VRAM en Q4, ofreciendo despliegue autoalojado rápido y estable en hardware de consumo.

Configuración de hardware

Fabricante

Producto

Plataforma

Familia

Modelo

VRAM

RAM del sistema (GB) Opcional — para recomendaciones de despliegue precisas

Cuantización	Calidad	Tamaño	Ajuste
Q8_0	Alta	4.17 GB	—
Q8_K_XL	Alta	5.54 GB	—
Q6_K	Alta	3.28 GB	—
Q6_K_XL	Alta	3.86 GB	—
Q5_K_M	Media	2.93 GB	—
Q5_K_S	Media	2.82 GB	—
Q5_K_XL	Media	3.03 GB	—
Q4_K_M	Media	2.55 GB	—
Q4_K_S	Media	2.41 GB	—
Q4_K_XL	Media	2.71 GB	—
Q4_0	Media	2.41 GB	—
Q4_1	Media	2.59 GB	—
Q3_K_M	Baja	2.14 GB	—
Q3_K_S	Baja	1.96 GB	—
Q3_K_XL	Baja	2.27 GB	—
Q2_K_XL	Baja	1.81 GB	—

Última actualización: 24 de marzo de 2026