Zum Inhalt springen

Kimi K2 Thinking

Moonshot AI
Code Thinking Tool Calls

Kimi K2 Thinking ist ein Mixture-of-Experts-Modell mit 170,27 Milliarden Parametern von Moonshot AI, End-to-End trainiert für erweitertes Chain-of-Thought-Reasoning mit integrierter Toolnutzung. Es aktiviert 8 von 384 Experten plus 1 gemeinsamen Experten pro Token und erreicht Spitzenleistung bei komplexen Mathematik-, Programmier- und agentischen Benchmarks, während es über Hunderte aufeinanderfolgender Toolaufrufe kohärentes Verhalten beibehält. Das Modell unterstützt Codegenerierung, tiefgehendes Denken und Tool Calling auf Englisch und Chinesisch. Mit einem 256K-Kontextfenster und Flash Attention überzeugt es bei mehrstufigen agentischen Workflows, die anhaltendes zielgerichtetes Reasoning erfordern.

Hardwarekonfiguration

Optional — für präzise Bereitstellungsempfehlungen
Quantisierung Qualität Größe Eignung
Q8_0 Hoch 1016.07 GB
Q8_K_XL Hoch 1108.35 GB
Q6_K Hoch 785.01 GB
Q6_K_XL Hoch 818.73 GB
Q5_K_M Mittel 678.67 GB
Q5_K_S Mittel 658.39 GB
Q5_K_XL Mittel 679.68 GB
Q4_K_M Mittel 578.6 GB
Q4_K_S Mittel 543.23 GB
Q4_K_XL Mittel 601.86 GB
Q4_0 Mittel 541.24 GB
Q4_1 Mittel 598.79 GB
Q3_K_M Niedrig 456.33 GB
Q3_K_S Niedrig 412.7 GB
Q3_K_XL Niedrig 423.87 GB
Q2_K Niedrig 348.4 GB
Q2_K_L Niedrig 348.65 GB
Q2_K_XL Niedrig 359.82 GB
Zuletzt aktualisiert: 5. März 2026