Zum Inhalt springen

MiniMax M2

MiniMax
Code Thinking Tool Calls

MiniMax M2 ist ein Mixture-of-Experts-Modell mit 228,7 Milliarden Parametern von MiniMax mit 256 Experten und 8 aktiven pro Token, optimiert für Coding- und agentische Workflows. Es nutzt verschränktes Chain-of-Thought-Reasoning und zählt zu den besten Open-Source-Modellen für mehrstufige Aufgabenausführung und Codegenerierung. Das Modell unterstützt Tool Calling mit starker Leistung über Shell-, Browser- und Code-Runner-Toolchains. Mit einem 192K-Kontextfenster und Flash Attention bewältigt es Aufgaben mit langem Horizont und quantisiert bis auf Q2-GGUF-Stufen für selbstgehostete Multi-GPU-Deployments.

Hardwarekonfiguration

Optional — für präzise Bereitstellungsempfehlungen
Quantisierung Qualität Größe Eignung
Q8_0 Hoch 226.43 GB
Q8_K_XL Hoch 243.43 GB
Q6_K Hoch 174.87 GB
Q6_K_XL Hoch 180.95 GB
Q5_K_M Mittel 151.16 GB
Q5_K_S Mittel 146.67 GB
Q5_K_XL Mittel 150.96 GB
Q4_K_M Mittel 128.84 GB
Q4_K_S Mittel 121.1 GB
Q4_K_XL Mittel 122.58 GB
Q4_0 Mittel 120.61 GB
Q4_1 Mittel 133.39 GB
Q3_K_M Niedrig 101.77 GB
Q3_K_S Niedrig 91.92 GB
Q3_K_XL Niedrig 94.48 GB
Q2_K Niedrig 77.58 GB
Q2_K_L Niedrig 77.71 GB
Q2_K_XL Niedrig 79.87 GB
Zuletzt aktualisiert: 5. März 2026