Qwen3 8B
Qwen
Code Multilingual Thinking Tool Calls
Qwen3 8B es un transformador denso de 8.000 millones de parametros del equipo Qwen de Alibaba, con capacidades de razonamiento integradas junto con generacion de codigo, "tool calling" y soporte multilingue. Avanza respecto a Qwen2.5 con razonamiento mejorado, soportando inferencia "chain-of-thought" en un factor de forma compacto. El modelo cubre 14 idiomas, incluidos ingles, chino y arabe. Con una ventana de contexto de 40K y "flash attention", cabe en una sola GPU de consumo y se cuantiza eficientemente para cargas de razonamiento autoalojadas rentables.
Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| Q8_0 | Alta | 8.11 GB | — |
| Q8_K_XL | Alta | 10.08 GB | — |
| Q6_K | Alta | 6.26 GB | — |
| Q6_K_XL | Alta | 6.98 GB | — |
| Q5_K_M | Media | 5.45 GB | — |
| Q5_K_S | Media | 5.33 GB | — |
| Q5_K_XL | Media | 5.47 GB | — |
| Q4_K_M | Media | 4.68 GB | — |
| Q4_K_S | Media | 4.47 GB | — |
| Q4_K_XL | Media | 4.78 GB | — |
| Q4_1 | Media | 4.89 GB | — |
| Q3_K_M | Baja | 3.84 GB | — |
| Q3_K_S | Baja | 3.51 GB | — |
| Q3_K_XL | Baja | 4.01 GB | — |
| Q2_K | Baja | 3.06 GB | — |
| Q2_K_L | Baja | 3.19 GB | — |
| Q2_K_XL | Baja | 3.26 GB | — |
Última actualización: 5 de marzo de 2026