MiniMax M2

Code Thinking Tool Calls

MiniMax M2 ist ein Mixture-of-Experts-Modell mit 228,7 Milliarden Parametern von MiniMax mit 256 Experten und 8 aktiven pro Token, optimiert für Coding- und agentische Workflows. Es nutzt verschränktes Chain-of-Thought-Reasoning und zählt zu den besten Open-Source-Modellen für mehrstufige Aufgabenausführung und Codegenerierung. Das Modell unterstützt Tool Calling mit starker Leistung über Shell-, Browser- und Code-Runner-Toolchains. Mit einem 192K-Kontextfenster und Flash Attention bewältigt es Aufgaben mit langem Horizont und quantisiert bis auf Q2-GGUF-Stufen für selbstgehostete Multi-GPU-Deployments.

Hardwarekonfiguration

Hersteller

Produkt

Plattform

Familie

Modell

VRAM

System-RAM (GB) Optional — für präzise Bereitstellungsempfehlungen

Quantisierung	Qualität	Größe	Eignung
Q8_0	Hoch	226.43 GB	—
Q8_K_XL	Hoch	243.43 GB	—
Q6_K	Hoch	174.87 GB	—
Q6_K_XL	Hoch	180.95 GB	—
Q5_K_M	Mittel	151.16 GB	—
Q5_K_S	Mittel	146.67 GB	—
Q5_K_XL	Mittel	150.96 GB	—
Q4_K_M	Mittel	128.84 GB	—
Q4_K_S	Mittel	121.1 GB	—
Q4_K_XL	Mittel	122.58 GB	—
Q4_0	Mittel	120.61 GB	—
Q4_1	Mittel	133.39 GB	—
Q3_K_M	Niedrig	101.77 GB	—
Q3_K_S	Niedrig	91.92 GB	—
Q3_K_XL	Niedrig	94.48 GB	—
Q2_K	Niedrig	77.58 GB	—
Q2_K_L	Niedrig	77.71 GB	—
Q2_K_XL	Niedrig	79.87 GB	—

Zuletzt aktualisiert: 29. April 2026