Ir al contenido

Qwen3 Next 80B A3B Thinking

Qwen
Code Multilingual Thinking Tool Calls

Qwen3 Next 80B A3B Thinking es un modelo "Mixture-of-Experts" enfocado en razonamiento del equipo Qwen de Alibaba con 81.320 millones de parámetros totales, optimizado para inferencia "chain-of-thought" en tareas complejas de matemáticas, lógica y programación. Solo unos 3.000 millones de parámetros se activan por token, utilizando 10 de 512 expertos, logrando un sólido rendimiento de razonamiento a una fracción del coste computacional de alternativas densas. El modelo soporta generación de código, "tool calling" y 13 idiomas, incluidos inglés y chino. Con una ventana de contexto de 262K y "flash attention", maneja trazas de razonamiento largas de forma nativa y se cuantiza bien a GGUF para despliegue autoalojado.

Configuración de hardware

Opcional — para recomendaciones de despliegue precisas
Cuantización Calidad Tamaño Ajuste
Q8_0 Alta 78.99 GB
Q8_K_XL Alta 86.69 GB
Q6_K Alta 61.04 GB
Q6_K_XL Alta 63.81 GB
Q5_K_M Media 52.91 GB
Q5_K_S Media 51.24 GB
Q5_K_XL Media 52.77 GB
Q4_K_M Media 45.17 GB
Q4_K_S Media 42.38 GB
Q4_K_XL Media 42.78 GB
Q4_0 Media 42.2 GB
Q4_1 Media 46.61 GB
Q3_K_M Baja 35.67 GB
Q3_K_S Baja 32.21 GB
Q3_K_XL Baja 33.06 GB
Q2_K Baja 27.17 GB
Q2_K_L Baja 27.24 GB
Q2_K_XL Baja 28.06 GB
Última actualización: 5 de marzo de 2026