Kimi K2.5

Code Thinking Tool Calls Vision

Kimi K2.5 ist ein Mixture-of-Experts-Modell mit 1.016,23 Milliarden Parametern von Moonshot AI, das native Bildverarbeitung mit fortgeschrittenem agentischem Reasoning kombiniert. Es aktiviert 8 von 384 Experten plus 1 gemeinsamen Experten pro Token und erreicht Spitzenleistung bei Programmier-, Mathematik- und multimodalen Benchmarks, während der Rechenaufwand pro Token einem 32B-Dense-Modell entspricht. Das Modell unterstützt Codegenerierung, erweitertes Denken, Tool Calling und Bildverständnis auf Englisch und Chinesisch. Mit einem 256K-Kontextfenster und Flash Attention bewerkstelligt es Langdokumentanalyse und mehrstufige agentische Workflows mit visuellen Eingaben.

Hardwarekonfiguration

Hersteller

Produkt

Plattform

Familie

Modell

VRAM

System-RAM (GB) Optional — für präzise Bereitstellungsempfehlungen

Quantisierung	Qualität	Größe	Eignung
Q8_0	Hoch	1016.23 GB	—
Q8_K_XL	Hoch	1108.05 GB	—
Q6_K	Hoch	785.01 GB	—
Q6_K_XL	Hoch	817.42 GB	—
Q5_K_M	Mittel	678.67 GB	—
Q5_K_S	Mittel	658.39 GB	—
Q5_K_XL	Mittel	681.05 GB	—
Q4_K_M	Mittel	578.6 GB	—
Q4_K_S	Mittel	543.22 GB	—
Q4_K_XL	Mittel	579.29 GB	—
Q4_0	Mittel	541.23 GB	—
Q4_1	Mittel	598.79 GB	—
Q3_K_M	Niedrig	456.13 GB	—
Q3_K_S	Niedrig	412.7 GB	—
Q3_K_XL	Niedrig	456.76 GB	—
Q2_K	Niedrig	348.09 GB	—
Q2_K_L	Niedrig	348.35 GB	—
Q2_K_XL	Niedrig	349.01 GB	—

Zuletzt aktualisiert: 29. April 2026