Zum Inhalt springen

Kimi K2 Instruct

Moonshot AI
Code Tool Calls

Kimi K2 Instruct ist ein Mixture-of-Experts-Modell mit 1.026,47 Milliarden Parametern von Moonshot AI, feinabgestimmt für Instruktionsbefolgung, Codegenerierung und autonome Toolnutzung. Es aktiviert 8 von 384 Experten plus 1 gemeinsamen Experten pro Token und erreicht starke Leistung bei Programmier- und agentischen Benchmarks, während der Rechenaufwand pro Token einem 32B-Dense-Modell entspricht. Das Modell unterstützt Codegenerierung und Tool Calling auf Englisch und Chinesisch, trainiert mit dem MuonClip-Optimierer auf 15,5 Billionen Tokens. Mit einem 128K-Kontextfenster und Flash Attention eignet es sich für agentische Deployments mit zuverlässiger Tool-Orchestrierung.

Hardwarekonfiguration

Optional — für präzise Bereitstellungsempfehlungen
Quantisierung Qualität Größe Eignung
Q8_0 Hoch 1016.15 GB
Q8_K_XL Hoch 1108.35 GB
Q6_K Hoch 784.82 GB
Q6_K_XL Hoch 818.73 GB
Q5_K_M Mittel 678.37 GB
Q5_K_S Mittel 658.07 GB
Q5_K_XL Mittel 680.38 GB
Q4_K_M Mittel 578.14 GB
Q4_K_S Mittel 542.74 GB
Q4_K_XL Mittel 546.77 GB
Q4_0 Mittel 540.76 GB
Q4_1 Mittel 598.41 GB
Q3_K_M Niedrig 455.73 GB
Q3_K_S Niedrig 412.01 GB
Q3_K_XL Niedrig 421.03 GB
Q2_K Niedrig 347.56 GB
Q2_K_L Niedrig 347.82 GB
Q2_K_XL Niedrig 355.65 GB
Zuletzt aktualisiert: 5. März 2026