Ir al contenido

Qwen3.5 4B

Qwen
Code Multilingual Thinking Tool Calls Vision

Qwen3.5 4B es un modelo de la familia Qwen 3.5 de Alibaba con arquitectura híbrida Gated Delta Networks y 4.660 millones de parámetros, ampliamente considerado como el punto óptimo de rendimiento por vatio en la comunidad. Es nativamente multimodal, procesando texto, imágenes y vídeo, con capacidades de razonamiento integradas para inferencia « chain-of-thought ». El modelo soporta una ventana de contexto de 262K y cubre más de 201 idiomas, igualando casi a modelos MoE de 80B de la generación anterior en benchmarks de código. Publicado bajo licencia Apache 2.0, funciona con aproximadamente 3 GB de VRAM en Q4, ofreciendo despliegue autoalojado rápido y estable en hardware de consumo.

Configuración de hardware

Opcional — para recomendaciones de despliegue precisas
Cuantización Calidad Tamaño Ajuste
Q8_0 Alta 4.17 GB
Q8_K_XL Alta 5.54 GB
Q6_K Alta 3.28 GB
Q6_K_XL Alta 3.86 GB
Q5_K_M Media 2.93 GB
Q5_K_S Media 2.82 GB
Q5_K_XL Media 3.03 GB
Q4_K_M Media 2.55 GB
Q4_K_S Media 2.41 GB
Q4_K_XL Media 2.71 GB
Q4_0 Media 2.41 GB
Q4_1 Media 2.59 GB
Q3_K_M Baja 2.14 GB
Q3_K_S Baja 1.96 GB
Q3_K_XL Baja 2.27 GB
Q2_K_XL Baja 1.81 GB
Última actualización: 13 de marzo de 2026