Kimi K2 Instruct
Moonshot AI
Code Tool Calls
Kimi K2 Instruct è un modello "Mixture-of-Experts" da 1.026,47 miliardi di parametri di Moonshot AI, perfezionato per il seguimento di istruzioni, la generazione di codice e l'utilizzo autonomo di strumenti. Attiva 8 dei 384 esperti più 1 esperto condiviso per token, raggiungendo solide prestazioni su benchmark di programmazione e agentici con un costo di calcolo per token equivalente a un modello denso da 32B. Il modello supporta generazione di codice e "tool calling" in inglese e cinese, addestrato con l'ottimizzatore MuonClip su 15,5 bilioni di token. Con una finestra di contesto da 128K e "flash attention", è adatto a deployment agentici che richiedono un'orchestrazione di strumenti affidabile.
Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
| Quantizzazione | Qualità | Dimensione | Adeguatezza |
|---|---|---|---|
| Q8_0 | Alta | 1016.15 GB | — |
| Q8_K_XL | Alta | 1108.35 GB | — |
| Q6_K | Alta | 784.82 GB | — |
| Q6_K_XL | Alta | 818.73 GB | — |
| Q5_K_M | Media | 678.37 GB | — |
| Q5_K_S | Media | 658.07 GB | — |
| Q5_K_XL | Media | 680.38 GB | — |
| Q4_K_M | Media | 578.14 GB | — |
| Q4_K_S | Media | 542.74 GB | — |
| Q4_K_XL | Media | 546.77 GB | — |
| Q4_0 | Media | 540.76 GB | — |
| Q4_1 | Media | 598.41 GB | — |
| Q3_K_M | Bassa | 455.73 GB | — |
| Q3_K_S | Bassa | 412.01 GB | — |
| Q3_K_XL | Bassa | 421.03 GB | — |
| Q2_K | Bassa | 347.56 GB | — |
| Q2_K_L | Bassa | 347.82 GB | — |
| Q2_K_XL | Bassa | 355.65 GB | — |
Ultimo aggiornamento: 5 marzo 2026