Kimi K2 Thinking
Moonshot AI
Code Thinking Tool Calls
Kimi K2 Thinking ist ein Mixture-of-Experts-Modell mit 170,27 Milliarden Parametern von Moonshot AI, End-to-End trainiert für erweitertes Chain-of-Thought-Reasoning mit integrierter Toolnutzung. Es aktiviert 8 von 384 Experten plus 1 gemeinsamen Experten pro Token und erreicht Spitzenleistung bei komplexen Mathematik-, Programmier- und agentischen Benchmarks, während es über Hunderte aufeinanderfolgender Toolaufrufe kohärentes Verhalten beibehält. Das Modell unterstützt Codegenerierung, tiefgehendes Denken und Tool Calling auf Englisch und Chinesisch. Mit einem 256K-Kontextfenster und Flash Attention überzeugt es bei mehrstufigen agentischen Workflows, die anhaltendes zielgerichtetes Reasoning erfordern.
Hardwarekonfiguration
Optional — für präzise Bereitstellungsempfehlungen
| Quantisierung | Qualität | Größe | Eignung |
|---|---|---|---|
| Q8_0 | Hoch | 1016.07 GB | — |
| Q8_K_XL | Hoch | 1108.35 GB | — |
| Q6_K | Hoch | 785.01 GB | — |
| Q6_K_XL | Hoch | 818.73 GB | — |
| Q5_K_M | Mittel | 678.67 GB | — |
| Q5_K_S | Mittel | 658.39 GB | — |
| Q5_K_XL | Mittel | 679.68 GB | — |
| Q4_K_M | Mittel | 578.6 GB | — |
| Q4_K_S | Mittel | 543.23 GB | — |
| Q4_K_XL | Mittel | 601.86 GB | — |
| Q4_0 | Mittel | 541.24 GB | — |
| Q4_1 | Mittel | 598.79 GB | — |
| Q3_K_M | Niedrig | 456.33 GB | — |
| Q3_K_S | Niedrig | 412.7 GB | — |
| Q3_K_XL | Niedrig | 423.87 GB | — |
| Q2_K | Niedrig | 348.4 GB | — |
| Q2_K_L | Niedrig | 348.65 GB | — |
| Q2_K_XL | Niedrig | 359.82 GB | — |
Zuletzt aktualisiert: 5. März 2026