MiniMax M2

Code Thinking Tool Calls

MiniMax M2 es un modelo "Mixture-of-Experts" de 228.700 millones de parámetros de MiniMax con 256 expertos y 8 activos por token, optimizado para flujos de trabajo de programación y agentes. Utiliza razonamiento "chain-of-thought" intercalado y se posiciona entre los mejores modelos de código abierto para ejecución de tareas multi-paso y generación de código. El modelo soporta "tool calling" con fuerte rendimiento en toolchains de shell, navegador y ejecución de código. Con una ventana de contexto de 192K y "flash attention", gestiona tareas de largo alcance y se cuantiza hasta niveles Q2 en GGUF para despliegues autoalojados multi-GPU.

Configuración de hardware

Fabricante

Producto

Plataforma

Familia

Modelo

VRAM

RAM del sistema (GB) Opcional — para recomendaciones de despliegue precisas

Cuantización	Calidad	Tamaño	Ajuste
Q8_0	Alta	226.43 GB	—
Q8_K_XL	Alta	243.43 GB	—
Q6_K	Alta	174.87 GB	—
Q6_K_XL	Alta	180.95 GB	—
Q5_K_M	Media	151.16 GB	—
Q5_K_S	Media	146.67 GB	—
Q5_K_XL	Media	150.96 GB	—
Q4_K_M	Media	128.84 GB	—
Q4_K_S	Media	121.1 GB	—
Q4_K_XL	Media	122.58 GB	—
Q4_0	Media	120.61 GB	—
Q4_1	Media	133.39 GB	—
Q3_K_M	Baja	101.77 GB	—
Q3_K_S	Baja	91.92 GB	—
Q3_K_XL	Baja	94.48 GB	—
Q2_K	Baja	77.58 GB	—
Q2_K_L	Baja	77.71 GB	—
Q2_K_XL	Baja	79.87 GB	—

Última actualización: 29 de abril de 2026