Qwen3 8B

Code Multilingual Thinking Tool Calls

Qwen3 8B es un transformador denso de 8.000 millones de parametros del equipo Qwen de Alibaba, con capacidades de razonamiento integradas junto con generacion de codigo, "tool calling" y soporte multilingue. Avanza respecto a Qwen2.5 con razonamiento mejorado, soportando inferencia "chain-of-thought" en un factor de forma compacto. El modelo cubre 14 idiomas, incluidos ingles, chino y arabe. Con una ventana de contexto de 40K y "flash attention", cabe en una sola GPU de consumo y se cuantiza eficientemente para cargas de razonamiento autoalojadas rentables.

Configuración de hardware

Fabricante

Producto

Plataforma

Familia

Modelo

VRAM

RAM del sistema (GB) Opcional — para recomendaciones de despliegue precisas

Cuantización	Calidad	Tamaño	Ajuste
Q8_0	Alta	8.11 GB	—
Q8_K_XL	Alta	10.08 GB	—
Q6_K	Alta	6.26 GB	—
Q6_K_XL	Alta	6.98 GB	—
Q5_K_M	Media	5.45 GB	—
Q5_K_S	Media	5.33 GB	—
Q5_K_XL	Media	5.47 GB	—
Q4_K_M	Media	4.68 GB	—
Q4_K_S	Media	4.47 GB	—
Q4_K_XL	Media	4.78 GB	—
Q4_1	Media	4.89 GB	—
Q3_K_M	Baja	3.84 GB	—
Q3_K_S	Baja	3.51 GB	—
Q3_K_XL	Baja	4.01 GB	—
Q2_K	Baja	3.06 GB	—
Q2_K_L	Baja	3.19 GB	—
Q2_K_XL	Baja	3.26 GB	—

Última actualización: 24 de marzo de 2026