Kimi K2 Instruct
Moonshot AI
Code Tool Calls
Kimi K2 Instruct ist ein Mixture-of-Experts-Modell mit 1.026,47 Milliarden Parametern von Moonshot AI, feinabgestimmt für Instruktionsbefolgung, Codegenerierung und autonome Toolnutzung. Es aktiviert 8 von 384 Experten plus 1 gemeinsamen Experten pro Token und erreicht starke Leistung bei Programmier- und agentischen Benchmarks, während der Rechenaufwand pro Token einem 32B-Dense-Modell entspricht. Das Modell unterstützt Codegenerierung und Tool Calling auf Englisch und Chinesisch, trainiert mit dem MuonClip-Optimierer auf 15,5 Billionen Tokens. Mit einem 128K-Kontextfenster und Flash Attention eignet es sich für agentische Deployments mit zuverlässiger Tool-Orchestrierung.
Hardwarekonfiguration
Optional — für präzise Bereitstellungsempfehlungen
| Quantisierung | Qualität | Größe | Eignung |
|---|---|---|---|
| Q8_0 | Hoch | 1016.15 GB | — |
| Q8_K_XL | Hoch | 1108.35 GB | — |
| Q6_K | Hoch | 784.82 GB | — |
| Q6_K_XL | Hoch | 818.73 GB | — |
| Q5_K_M | Mittel | 678.37 GB | — |
| Q5_K_S | Mittel | 658.07 GB | — |
| Q5_K_XL | Mittel | 680.38 GB | — |
| Q4_K_M | Mittel | 578.14 GB | — |
| Q4_K_S | Mittel | 542.74 GB | — |
| Q4_K_XL | Mittel | 546.77 GB | — |
| Q4_0 | Mittel | 540.76 GB | — |
| Q4_1 | Mittel | 598.41 GB | — |
| Q3_K_M | Niedrig | 455.73 GB | — |
| Q3_K_S | Niedrig | 412.01 GB | — |
| Q3_K_XL | Niedrig | 421.03 GB | — |
| Q2_K | Niedrig | 347.56 GB | — |
| Q2_K_L | Niedrig | 347.82 GB | — |
| Q2_K_XL | Niedrig | 355.65 GB | — |
Zuletzt aktualisiert: 5. März 2026