MiniMax M2

Code Thinking Tool Calls

MiniMax M2 è un modello "Mixture-of-Experts" da 228,7 miliardi di parametri di MiniMax con 256 esperti e 8 attivi per token, ottimizzato per workflow di codifica e agentici. Utilizza ragionamento "chain-of-thought" intercalato e si posiziona tra i migliori modelli open source per l'esecuzione di compiti multi-step e la generazione di codice. Il modello supporta il "tool calling" con ottime prestazioni su toolchain shell, browser e code runner. Con una finestra di contesto da 192K e "flash attention", gestisce compiti a lungo orizzonte e si quantizza fino a livelli Q2 in GGUF per deployment self-hosted multi-GPU.

Configurazione hardware

Produttore

Prodotto

Piattaforma

Famiglia

Modello

VRAM

RAM di sistema (GB) Facoltativo — per raccomandazioni di distribuzione precise

Quantizzazione	Qualità	Dimensione	Adeguatezza
Q8_0	Alta	226.43 GB	—
Q8_K_XL	Alta	243.43 GB	—
Q6_K	Alta	174.87 GB	—
Q6_K_XL	Alta	180.95 GB	—
Q5_K_M	Media	151.16 GB	—
Q5_K_S	Media	146.67 GB	—
Q5_K_XL	Media	150.96 GB	—
Q4_K_M	Media	128.84 GB	—
Q4_K_S	Media	121.1 GB	—
Q4_K_XL	Media	122.58 GB	—
Q4_0	Media	120.61 GB	—
Q4_1	Media	133.39 GB	—
Q3_K_M	Bassa	101.77 GB	—
Q3_K_S	Bassa	91.92 GB	—
Q3_K_XL	Bassa	94.48 GB	—
Q2_K	Bassa	77.58 GB	—
Q2_K_L	Bassa	77.71 GB	—
Q2_K_XL	Bassa	79.87 GB	—

Ultimo aggiornamento: 29 aprile 2026