MiniMax M2
MiniMax
Code Thinking Tool Calls
MiniMax M2 est un modèle "Mixture-of-Experts" de 228,7 milliards de paramètres de MiniMax avec 256 experts et 8 actifs par jeton, optimisé pour les workflows de codage et agentiques. Il utilise un raisonnement "chain-of-thought" entrelacé et se classe parmi les meilleurs modèles open source pour l'exécution de tâches multi-étapes et la génération de code. Le modèle prend en charge le "tool calling" avec de solides performances sur les toolchains shell, navigateur et code runner. Avec une fenêtre de contexte de 192K et le "flash attention", il gère les tâches à long horizon tout en se quantifiant jusqu'au niveau Q2 en GGUF pour des déploiements auto-hébergés multi-GPU.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| Q8_0 | Élevée | 226.43 GB | — |
| Q8_K_XL | Élevée | 243.43 GB | — |
| Q6_K | Élevée | 174.87 GB | — |
| Q6_K_XL | Élevée | 180.95 GB | — |
| Q5_K_M | Moyenne | 151.16 GB | — |
| Q5_K_S | Moyenne | 146.67 GB | — |
| Q5_K_XL | Moyenne | 150.96 GB | — |
| Q4_K_M | Moyenne | 128.84 GB | — |
| Q4_K_S | Moyenne | 121.1 GB | — |
| Q4_K_XL | Moyenne | 122.58 GB | — |
| Q4_0 | Moyenne | 120.61 GB | — |
| Q4_1 | Moyenne | 133.39 GB | — |
| Q3_K_M | Basse | 101.77 GB | — |
| Q3_K_S | Basse | 91.92 GB | — |
| Q3_K_XL | Basse | 94.48 GB | — |
| Q2_K | Basse | 77.58 GB | — |
| Q2_K_L | Basse | 77.71 GB | — |
| Q2_K_XL | Basse | 79.87 GB | — |
Dernière mise à jour : 5 mars 2026