Ir al contenido

Qwen3 8B

Qwen
Code Multilingual Thinking Tool Calls

Qwen3 8B es un transformador denso de 8.000 millones de parametros del equipo Qwen de Alibaba, con capacidades de razonamiento integradas junto con generacion de codigo, "tool calling" y soporte multilingue. Avanza respecto a Qwen2.5 con razonamiento mejorado, soportando inferencia "chain-of-thought" en un factor de forma compacto. El modelo cubre 14 idiomas, incluidos ingles, chino y arabe. Con una ventana de contexto de 40K y "flash attention", cabe en una sola GPU de consumo y se cuantiza eficientemente para cargas de razonamiento autoalojadas rentables.

Configuración de hardware

Opcional — para recomendaciones de despliegue precisas
Cuantización Calidad Tamaño Ajuste
Q8_0 Alta 8.11 GB
Q8_K_XL Alta 10.08 GB
Q6_K Alta 6.26 GB
Q6_K_XL Alta 6.98 GB
Q5_K_M Media 5.45 GB
Q5_K_S Media 5.33 GB
Q5_K_XL Media 5.47 GB
Q4_K_M Media 4.68 GB
Q4_K_S Media 4.47 GB
Q4_K_XL Media 4.78 GB
Q4_1 Media 4.89 GB
Q3_K_M Baja 3.84 GB
Q3_K_S Baja 3.51 GB
Q3_K_XL Baja 4.01 GB
Q2_K Baja 3.06 GB
Q2_K_L Baja 3.19 GB
Q2_K_XL Baja 3.26 GB
Última actualización: 5 de marzo de 2026