Ir al contenido

MiniMax M2

MiniMax
Code Thinking Tool Calls

MiniMax M2 es un modelo "Mixture-of-Experts" de 228.700 millones de parámetros de MiniMax con 256 expertos y 8 activos por token, optimizado para flujos de trabajo de programación y agentes. Utiliza razonamiento "chain-of-thought" intercalado y se posiciona entre los mejores modelos de código abierto para ejecución de tareas multi-paso y generación de código. El modelo soporta "tool calling" con fuerte rendimiento en toolchains de shell, navegador y ejecución de código. Con una ventana de contexto de 192K y "flash attention", gestiona tareas de largo alcance y se cuantiza hasta niveles Q2 en GGUF para despliegues autoalojados multi-GPU.

Configuración de hardware

Opcional — para recomendaciones de despliegue precisas
Cuantización Calidad Tamaño Ajuste
Q8_0 Alta 226.43 GB
Q8_K_XL Alta 243.43 GB
Q6_K Alta 174.87 GB
Q6_K_XL Alta 180.95 GB
Q5_K_M Media 151.16 GB
Q5_K_S Media 146.67 GB
Q5_K_XL Media 150.96 GB
Q4_K_M Media 128.84 GB
Q4_K_S Media 121.1 GB
Q4_K_XL Media 122.58 GB
Q4_0 Media 120.61 GB
Q4_1 Media 133.39 GB
Q3_K_M Baja 101.77 GB
Q3_K_S Baja 91.92 GB
Q3_K_XL Baja 94.48 GB
Q2_K Baja 77.58 GB
Q2_K_L Baja 77.71 GB
Q2_K_XL Baja 79.87 GB
Última actualización: 5 de marzo de 2026