Kimi K2 Instruct

Code Tool Calls

Kimi K2 Instruct ist ein Mixture-of-Experts-Modell mit 1.026,47 Milliarden Parametern von Moonshot AI, feinabgestimmt für Instruktionsbefolgung, Codegenerierung und autonome Toolnutzung. Es aktiviert 8 von 384 Experten plus 1 gemeinsamen Experten pro Token und erreicht starke Leistung bei Programmier- und agentischen Benchmarks, während der Rechenaufwand pro Token einem 32B-Dense-Modell entspricht. Das Modell unterstützt Codegenerierung und Tool Calling auf Englisch und Chinesisch, trainiert mit dem MuonClip-Optimierer auf 15,5 Billionen Tokens. Mit einem 128K-Kontextfenster und Flash Attention eignet es sich für agentische Deployments mit zuverlässiger Tool-Orchestrierung.

Hardwarekonfiguration

Hersteller

Produkt

Plattform

Familie

Modell

VRAM

System-RAM (GB) Optional — für präzise Bereitstellungsempfehlungen

Quantisierung	Qualität	Größe	Eignung
Q8_0	Hoch	1016.15 GB	—
Q8_K_XL	Hoch	1108.35 GB	—
Q6_K	Hoch	784.82 GB	—
Q6_K_XL	Hoch	818.73 GB	—
Q5_K_M	Mittel	678.37 GB	—
Q5_K_S	Mittel	658.07 GB	—
Q5_K_XL	Mittel	680.38 GB	—
Q4_K_M	Mittel	578.14 GB	—
Q4_K_S	Mittel	542.74 GB	—
Q4_K_XL	Mittel	546.77 GB	—
Q4_0	Mittel	540.76 GB	—
Q4_1	Mittel	598.41 GB	—
Q3_K_M	Niedrig	455.73 GB	—
Q3_K_S	Niedrig	412.01 GB	—
Q3_K_XL	Niedrig	421.03 GB	—
Q2_K	Niedrig	347.56 GB	—
Q2_K_L	Niedrig	347.82 GB	—
Q2_K_XL	Niedrig	355.65 GB	—

Zuletzt aktualisiert: 29. April 2026