MiniMax M2
MiniMax
Code Thinking Tool Calls
MiniMax M2 ist ein Mixture-of-Experts-Modell mit 228,7 Milliarden Parametern von MiniMax mit 256 Experten und 8 aktiven pro Token, optimiert für Coding- und agentische Workflows. Es nutzt verschränktes Chain-of-Thought-Reasoning und zählt zu den besten Open-Source-Modellen für mehrstufige Aufgabenausführung und Codegenerierung. Das Modell unterstützt Tool Calling mit starker Leistung über Shell-, Browser- und Code-Runner-Toolchains. Mit einem 192K-Kontextfenster und Flash Attention bewältigt es Aufgaben mit langem Horizont und quantisiert bis auf Q2-GGUF-Stufen für selbstgehostete Multi-GPU-Deployments.
Hardwarekonfiguration
Optional — für präzise Bereitstellungsempfehlungen
| Quantisierung | Qualität | Größe | Eignung |
|---|---|---|---|
| Q8_0 | Hoch | 226.43 GB | — |
| Q8_K_XL | Hoch | 243.43 GB | — |
| Q6_K | Hoch | 174.87 GB | — |
| Q6_K_XL | Hoch | 180.95 GB | — |
| Q5_K_M | Mittel | 151.16 GB | — |
| Q5_K_S | Mittel | 146.67 GB | — |
| Q5_K_XL | Mittel | 150.96 GB | — |
| Q4_K_M | Mittel | 128.84 GB | — |
| Q4_K_S | Mittel | 121.1 GB | — |
| Q4_K_XL | Mittel | 122.58 GB | — |
| Q4_0 | Mittel | 120.61 GB | — |
| Q4_1 | Mittel | 133.39 GB | — |
| Q3_K_M | Niedrig | 101.77 GB | — |
| Q3_K_S | Niedrig | 91.92 GB | — |
| Q3_K_XL | Niedrig | 94.48 GB | — |
| Q2_K | Niedrig | 77.58 GB | — |
| Q2_K_L | Niedrig | 77.71 GB | — |
| Q2_K_XL | Niedrig | 79.87 GB | — |
Zuletzt aktualisiert: 5. März 2026