MiniMax M2
MiniMax
Code Thinking Tool Calls
MiniMax M2 es un modelo "Mixture-of-Experts" de 228.700 millones de parámetros de MiniMax con 256 expertos y 8 activos por token, optimizado para flujos de trabajo de programación y agentes. Utiliza razonamiento "chain-of-thought" intercalado y se posiciona entre los mejores modelos de código abierto para ejecución de tareas multi-paso y generación de código. El modelo soporta "tool calling" con fuerte rendimiento en toolchains de shell, navegador y ejecución de código. Con una ventana de contexto de 192K y "flash attention", gestiona tareas de largo alcance y se cuantiza hasta niveles Q2 en GGUF para despliegues autoalojados multi-GPU.
Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| Q8_0 | Alta | 226.43 GB | — |
| Q8_K_XL | Alta | 243.43 GB | — |
| Q6_K | Alta | 174.87 GB | — |
| Q6_K_XL | Alta | 180.95 GB | — |
| Q5_K_M | Media | 151.16 GB | — |
| Q5_K_S | Media | 146.67 GB | — |
| Q5_K_XL | Media | 150.96 GB | — |
| Q4_K_M | Media | 128.84 GB | — |
| Q4_K_S | Media | 121.1 GB | — |
| Q4_K_XL | Media | 122.58 GB | — |
| Q4_0 | Media | 120.61 GB | — |
| Q4_1 | Media | 133.39 GB | — |
| Q3_K_M | Baja | 101.77 GB | — |
| Q3_K_S | Baja | 91.92 GB | — |
| Q3_K_XL | Baja | 94.48 GB | — |
| Q2_K | Baja | 77.58 GB | — |
| Q2_K_L | Baja | 77.71 GB | — |
| Q2_K_XL | Baja | 79.87 GB | — |
Última actualización: 5 de marzo de 2026