Qwen3 Next 80B A3B Thinking

Code Multilingual Thinking Tool Calls

Qwen3 Next 80B A3B Thinking es un modelo "Mixture-of-Experts" enfocado en razonamiento del equipo Qwen de Alibaba con 81.320 millones de parámetros totales, optimizado para inferencia "chain-of-thought" en tareas complejas de matemáticas, lógica y programación. Solo unos 3.000 millones de parámetros se activan por token, utilizando 10 de 512 expertos, logrando un sólido rendimiento de razonamiento a una fracción del coste computacional de alternativas densas. El modelo soporta generación de código, "tool calling" y 13 idiomas, incluidos inglés y chino. Con una ventana de contexto de 262K y "flash attention", maneja trazas de razonamiento largas de forma nativa y se cuantiza bien a GGUF para despliegue autoalojado.

Configuración de hardware

Fabricante

Producto

Plataforma

Familia

Modelo

VRAM

RAM del sistema (GB) Opcional — para recomendaciones de despliegue precisas

Cuantización	Calidad	Tamaño	Ajuste
Q8_0	Alta	78.99 GB	—
Q8_K_XL	Alta	86.69 GB	—
Q6_K	Alta	61.04 GB	—
Q6_K_XL	Alta	63.81 GB	—
Q5_K_M	Media	52.91 GB	—
Q5_K_S	Media	51.24 GB	—
Q5_K_XL	Media	52.77 GB	—
Q4_K_M	Media	45.17 GB	—
Q4_K_S	Media	42.38 GB	—
Q4_K_XL	Media	42.78 GB	—
Q4_0	Media	42.2 GB	—
Q4_1	Media	46.61 GB	—
Q3_K_M	Baja	35.67 GB	—
Q3_K_S	Baja	32.21 GB	—
Q3_K_XL	Baja	33.06 GB	—
Q2_K	Baja	27.17 GB	—
Q2_K_L	Baja	27.24 GB	—
Q2_K_XL	Baja	28.06 GB	—

Última actualización: 29 de abril de 2026