Kimi K2.5
Moonshot AI
Code Thinking Tool Calls Vision
Kimi K2.5 è un modello "Mixture-of-Experts" da 1.016,23 miliardi di parametri di Moonshot AI, che combina visione nativa con ragionamento agentico avanzato. Attiva 8 dei 384 esperti più 1 esperto condiviso per token, raggiungendo prestazioni di frontiera in programmazione, matematica e benchmark multimodali con un costo di calcolo per token equivalente a un modello denso da 32B. Il modello supporta generazione di codice, pensiero esteso, "tool calling" e comprensione di immagini in inglese e cinese. Con una finestra di contesto da 256K e "flash attention", gestisce analisi di documenti lunghi e workflow agentici multi-step con input visivi.
Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
| Quantizzazione | Qualità | Dimensione | Adeguatezza |
|---|---|---|---|
| Q8_0 | Alta | 1016.23 GB | — |
| Q8_K_XL | Alta | 1108.05 GB | — |
| Q6_K | Alta | 785.01 GB | — |
| Q6_K_XL | Alta | 817.42 GB | — |
| Q5_K_M | Media | 678.67 GB | — |
| Q5_K_S | Media | 658.39 GB | — |
| Q5_K_XL | Media | 681.05 GB | — |
| Q4_K_M | Media | 578.6 GB | — |
| Q4_K_S | Media | 543.22 GB | — |
| Q4_K_XL | Media | 579.29 GB | — |
| Q4_0 | Media | 541.23 GB | — |
| Q4_1 | Media | 598.79 GB | — |
| Q3_K_M | Bassa | 456.13 GB | — |
| Q3_K_S | Bassa | 412.7 GB | — |
| Q3_K_XL | Bassa | 456.76 GB | — |
| Q2_K | Bassa | 348.09 GB | — |
| Q2_K_L | Bassa | 348.35 GB | — |
| Q2_K_XL | Bassa | 349.01 GB | — |
Ultimo aggiornamento: 5 marzo 2026