Aller au contenu

MiniMax M2

MiniMax
Code Thinking Tool Calls

MiniMax M2 est un modèle "Mixture-of-Experts" de 228,7 milliards de paramètres de MiniMax avec 256 experts et 8 actifs par jeton, optimisé pour les workflows de codage et agentiques. Il utilise un raisonnement "chain-of-thought" entrelacé et se classe parmi les meilleurs modèles open source pour l'exécution de tâches multi-étapes et la génération de code. Le modèle prend en charge le "tool calling" avec de solides performances sur les toolchains shell, navigateur et code runner. Avec une fenêtre de contexte de 192K et le "flash attention", il gère les tâches à long horizon tout en se quantifiant jusqu'au niveau Q2 en GGUF pour des déploiements auto-hébergés multi-GPU.

Configuration matérielle

Facultatif — pour des recommandations de déploiement précises
Quantification Qualité Taille Adéquation
Q8_0 Élevée 226.43 GB
Q8_K_XL Élevée 243.43 GB
Q6_K Élevée 174.87 GB
Q6_K_XL Élevée 180.95 GB
Q5_K_M Moyenne 151.16 GB
Q5_K_S Moyenne 146.67 GB
Q5_K_XL Moyenne 150.96 GB
Q4_K_M Moyenne 128.84 GB
Q4_K_S Moyenne 121.1 GB
Q4_K_XL Moyenne 122.58 GB
Q4_0 Moyenne 120.61 GB
Q4_1 Moyenne 133.39 GB
Q3_K_M Basse 101.77 GB
Q3_K_S Basse 91.92 GB
Q3_K_XL Basse 94.48 GB
Q2_K Basse 77.58 GB
Q2_K_L Basse 77.71 GB
Q2_K_XL Basse 79.87 GB
Dernière mise à jour : 5 mars 2026