Qwen3 Next 80B A3B Thinking
Qwen
Code Multilingual Thinking Tool Calls
Qwen3 Next 80B A3B Thinking es un modelo "Mixture-of-Experts" enfocado en razonamiento del equipo Qwen de Alibaba con 81.320 millones de parámetros totales, optimizado para inferencia "chain-of-thought" en tareas complejas de matemáticas, lógica y programación. Solo unos 3.000 millones de parámetros se activan por token, utilizando 10 de 512 expertos, logrando un sólido rendimiento de razonamiento a una fracción del coste computacional de alternativas densas. El modelo soporta generación de código, "tool calling" y 13 idiomas, incluidos inglés y chino. Con una ventana de contexto de 262K y "flash attention", maneja trazas de razonamiento largas de forma nativa y se cuantiza bien a GGUF para despliegue autoalojado.
Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| Q8_0 | Alta | 78.99 GB | — |
| Q8_K_XL | Alta | 86.69 GB | — |
| Q6_K | Alta | 61.04 GB | — |
| Q6_K_XL | Alta | 63.81 GB | — |
| Q5_K_M | Media | 52.91 GB | — |
| Q5_K_S | Media | 51.24 GB | — |
| Q5_K_XL | Media | 52.77 GB | — |
| Q4_K_M | Media | 45.17 GB | — |
| Q4_K_S | Media | 42.38 GB | — |
| Q4_K_XL | Media | 42.78 GB | — |
| Q4_0 | Media | 42.2 GB | — |
| Q4_1 | Media | 46.61 GB | — |
| Q3_K_M | Baja | 35.67 GB | — |
| Q3_K_S | Baja | 32.21 GB | — |
| Q3_K_XL | Baja | 33.06 GB | — |
| Q2_K | Baja | 27.17 GB | — |
| Q2_K_L | Baja | 27.24 GB | — |
| Q2_K_XL | Baja | 28.06 GB | — |
Última actualización: 5 de marzo de 2026