MiniMax M2
MiniMax
Code Thinking Tool Calls
MiniMax M2 è un modello "Mixture-of-Experts" da 228,7 miliardi di parametri di MiniMax con 256 esperti e 8 attivi per token, ottimizzato per workflow di codifica e agentici. Utilizza ragionamento "chain-of-thought" intercalato e si posiziona tra i migliori modelli open source per l'esecuzione di compiti multi-step e la generazione di codice. Il modello supporta il "tool calling" con ottime prestazioni su toolchain shell, browser e code runner. Con una finestra di contesto da 192K e "flash attention", gestisce compiti a lungo orizzonte e si quantizza fino a livelli Q2 in GGUF per deployment self-hosted multi-GPU.
Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
| Quantizzazione | Qualità | Dimensione | Adeguatezza |
|---|---|---|---|
| Q8_0 | Alta | 226.43 GB | — |
| Q8_K_XL | Alta | 243.43 GB | — |
| Q6_K | Alta | 174.87 GB | — |
| Q6_K_XL | Alta | 180.95 GB | — |
| Q5_K_M | Media | 151.16 GB | — |
| Q5_K_S | Media | 146.67 GB | — |
| Q5_K_XL | Media | 150.96 GB | — |
| Q4_K_M | Media | 128.84 GB | — |
| Q4_K_S | Media | 121.1 GB | — |
| Q4_K_XL | Media | 122.58 GB | — |
| Q4_0 | Media | 120.61 GB | — |
| Q4_1 | Media | 133.39 GB | — |
| Q3_K_M | Bassa | 101.77 GB | — |
| Q3_K_S | Bassa | 91.92 GB | — |
| Q3_K_XL | Bassa | 94.48 GB | — |
| Q2_K | Bassa | 77.58 GB | — |
| Q2_K_L | Bassa | 77.71 GB | — |
| Q2_K_XL | Bassa | 79.87 GB | — |
Ultimo aggiornamento: 5 marzo 2026