Zum Inhalt springen

Kimi K2.5

Moonshot AI
Code Thinking Tool Calls Vision

Kimi K2.5 ist ein Mixture-of-Experts-Modell mit 1.016,23 Milliarden Parametern von Moonshot AI, das native Bildverarbeitung mit fortgeschrittenem agentischem Reasoning kombiniert. Es aktiviert 8 von 384 Experten plus 1 gemeinsamen Experten pro Token und erreicht Spitzenleistung bei Programmier-, Mathematik- und multimodalen Benchmarks, während der Rechenaufwand pro Token einem 32B-Dense-Modell entspricht. Das Modell unterstützt Codegenerierung, erweitertes Denken, Tool Calling und Bildverständnis auf Englisch und Chinesisch. Mit einem 256K-Kontextfenster und Flash Attention bewerkstelligt es Langdokumentanalyse und mehrstufige agentische Workflows mit visuellen Eingaben.

Hardwarekonfiguration

Optional — für präzise Bereitstellungsempfehlungen
Quantisierung Qualität Größe Eignung
Q8_0 Hoch 1016.23 GB
Q8_K_XL Hoch 1108.05 GB
Q6_K Hoch 785.01 GB
Q6_K_XL Hoch 817.42 GB
Q5_K_M Mittel 678.67 GB
Q5_K_S Mittel 658.39 GB
Q5_K_XL Mittel 681.05 GB
Q4_K_M Mittel 578.6 GB
Q4_K_S Mittel 543.22 GB
Q4_K_XL Mittel 579.29 GB
Q4_0 Mittel 541.23 GB
Q4_1 Mittel 598.79 GB
Q3_K_M Niedrig 456.13 GB
Q3_K_S Niedrig 412.7 GB
Q3_K_XL Niedrig 456.76 GB
Q2_K Niedrig 348.09 GB
Q2_K_L Niedrig 348.35 GB
Q2_K_XL Niedrig 349.01 GB
Zuletzt aktualisiert: 5. März 2026