MiniMax M2

Code Thinking Tool Calls

MiniMax M2 est un modèle "Mixture-of-Experts" de 228,7 milliards de paramètres de MiniMax avec 256 experts et 8 actifs par jeton, optimisé pour les workflows de codage et agentiques. Il utilise un raisonnement "chain-of-thought" entrelacé et se classe parmi les meilleurs modèles open source pour l'exécution de tâches multi-étapes et la génération de code. Le modèle prend en charge le "tool calling" avec de solides performances sur les toolchains shell, navigateur et code runner. Avec une fenêtre de contexte de 192K et le "flash attention", il gère les tâches à long horizon tout en se quantifiant jusqu'au niveau Q2 en GGUF pour des déploiements auto-hébergés multi-GPU.

Configuration matérielle

Fabricant

Produit

Plateforme

Famille

Modèle

VRAM

RAM système (Go) Facultatif — pour des recommandations de déploiement précises

Quantification	Qualité	Taille	Adéquation
Q8_0	Élevée	226.43 GB	—
Q8_K_XL	Élevée	243.43 GB	—
Q6_K	Élevée	174.87 GB	—
Q6_K_XL	Élevée	180.95 GB	—
Q5_K_M	Moyenne	151.16 GB	—
Q5_K_S	Moyenne	146.67 GB	—
Q5_K_XL	Moyenne	150.96 GB	—
Q4_K_M	Moyenne	128.84 GB	—
Q4_K_S	Moyenne	121.1 GB	—
Q4_K_XL	Moyenne	122.58 GB	—
Q4_0	Moyenne	120.61 GB	—
Q4_1	Moyenne	133.39 GB	—
Q3_K_M	Basse	101.77 GB	—
Q3_K_S	Basse	91.92 GB	—
Q3_K_XL	Basse	94.48 GB	—
Q2_K	Basse	77.58 GB	—
Q2_K_L	Basse	77.71 GB	—
Q2_K_XL	Basse	79.87 GB	—

Dernière mise à jour : 29 avril 2026