Kimi K2 Thinking

Code Thinking Tool Calls

Kimi K2 Thinking ist ein Mixture-of-Experts-Modell mit 170,27 Milliarden Parametern von Moonshot AI, End-to-End trainiert für erweitertes Chain-of-Thought-Reasoning mit integrierter Toolnutzung. Es aktiviert 8 von 384 Experten plus 1 gemeinsamen Experten pro Token und erreicht Spitzenleistung bei komplexen Mathematik-, Programmier- und agentischen Benchmarks, während es über Hunderte aufeinanderfolgender Toolaufrufe kohärentes Verhalten beibehält. Das Modell unterstützt Codegenerierung, tiefgehendes Denken und Tool Calling auf Englisch und Chinesisch. Mit einem 256K-Kontextfenster und Flash Attention überzeugt es bei mehrstufigen agentischen Workflows, die anhaltendes zielgerichtetes Reasoning erfordern.

Hardwarekonfiguration

Hersteller

Produkt

Plattform

Familie

Modell

VRAM

System-RAM (GB) Optional — für präzise Bereitstellungsempfehlungen

Quantisierung	Qualität	Größe	Eignung
Q8_0	Hoch	1016.07 GB	—
Q8_K_XL	Hoch	1108.35 GB	—
Q6_K	Hoch	785.01 GB	—
Q6_K_XL	Hoch	818.73 GB	—
Q5_K_M	Mittel	678.67 GB	—
Q5_K_S	Mittel	658.39 GB	—
Q5_K_XL	Mittel	679.68 GB	—
Q4_K_M	Mittel	578.6 GB	—
Q4_K_S	Mittel	543.23 GB	—
Q4_K_XL	Mittel	601.86 GB	—
Q4_0	Mittel	541.24 GB	—
Q4_1	Mittel	598.79 GB	—
Q3_K_M	Niedrig	456.33 GB	—
Q3_K_S	Niedrig	412.7 GB	—
Q3_K_XL	Niedrig	423.87 GB	—
Q2_K	Niedrig	348.4 GB	—
Q2_K_L	Niedrig	348.65 GB	—
Q2_K_XL	Niedrig	359.82 GB	—

Zuletzt aktualisiert: 29. April 2026