Kimi K2.5
Moonshot AI
Code Thinking Tool Calls Vision
Kimi K2.5 ist ein Mixture-of-Experts-Modell mit 1.016,23 Milliarden Parametern von Moonshot AI, das native Bildverarbeitung mit fortgeschrittenem agentischem Reasoning kombiniert. Es aktiviert 8 von 384 Experten plus 1 gemeinsamen Experten pro Token und erreicht Spitzenleistung bei Programmier-, Mathematik- und multimodalen Benchmarks, während der Rechenaufwand pro Token einem 32B-Dense-Modell entspricht. Das Modell unterstützt Codegenerierung, erweitertes Denken, Tool Calling und Bildverständnis auf Englisch und Chinesisch. Mit einem 256K-Kontextfenster und Flash Attention bewerkstelligt es Langdokumentanalyse und mehrstufige agentische Workflows mit visuellen Eingaben.
Hardwarekonfiguration
Optional — für präzise Bereitstellungsempfehlungen
| Quantisierung | Qualität | Größe | Eignung |
|---|---|---|---|
| Q8_0 | Hoch | 1016.23 GB | — |
| Q8_K_XL | Hoch | 1108.05 GB | — |
| Q6_K | Hoch | 785.01 GB | — |
| Q6_K_XL | Hoch | 817.42 GB | — |
| Q5_K_M | Mittel | 678.67 GB | — |
| Q5_K_S | Mittel | 658.39 GB | — |
| Q5_K_XL | Mittel | 681.05 GB | — |
| Q4_K_M | Mittel | 578.6 GB | — |
| Q4_K_S | Mittel | 543.22 GB | — |
| Q4_K_XL | Mittel | 579.29 GB | — |
| Q4_0 | Mittel | 541.23 GB | — |
| Q4_1 | Mittel | 598.79 GB | — |
| Q3_K_M | Niedrig | 456.13 GB | — |
| Q3_K_S | Niedrig | 412.7 GB | — |
| Q3_K_XL | Niedrig | 456.76 GB | — |
| Q2_K | Niedrig | 348.09 GB | — |
| Q2_K_L | Niedrig | 348.35 GB | — |
| Q2_K_XL | Niedrig | 349.01 GB | — |
Zuletzt aktualisiert: 5. März 2026