Salta ai contenuti

MiniMax M2

MiniMax
Code Thinking Tool Calls

MiniMax M2 è un modello "Mixture-of-Experts" da 228,7 miliardi di parametri di MiniMax con 256 esperti e 8 attivi per token, ottimizzato per workflow di codifica e agentici. Utilizza ragionamento "chain-of-thought" intercalato e si posiziona tra i migliori modelli open source per l'esecuzione di compiti multi-step e la generazione di codice. Il modello supporta il "tool calling" con ottime prestazioni su toolchain shell, browser e code runner. Con una finestra di contesto da 192K e "flash attention", gestisce compiti a lungo orizzonte e si quantizza fino a livelli Q2 in GGUF per deployment self-hosted multi-GPU.

Configurazione hardware

Facoltativo — per raccomandazioni di distribuzione precise
Quantizzazione Qualità Dimensione Adeguatezza
Q8_0 Alta 226.43 GB
Q8_K_XL Alta 243.43 GB
Q6_K Alta 174.87 GB
Q6_K_XL Alta 180.95 GB
Q5_K_M Media 151.16 GB
Q5_K_S Media 146.67 GB
Q5_K_XL Media 150.96 GB
Q4_K_M Media 128.84 GB
Q4_K_S Media 121.1 GB
Q4_K_XL Media 122.58 GB
Q4_0 Media 120.61 GB
Q4_1 Media 133.39 GB
Q3_K_M Bassa 101.77 GB
Q3_K_S Bassa 91.92 GB
Q3_K_XL Bassa 94.48 GB
Q2_K Bassa 77.58 GB
Q2_K_L Bassa 77.71 GB
Q2_K_XL Bassa 79.87 GB
Ultimo aggiornamento: 5 marzo 2026