Kimi K2 Thinking
Moonshot AI
Code Thinking Tool Calls
Kimi K2 Thinking è un modello "Mixture-of-Experts" da 170,27 miliardi di parametri di Moonshot AI, addestrato end-to-end per il ragionamento "chain-of-thought" esteso con utilizzo integrato di strumenti. Attiva 8 dei 384 esperti più 1 esperto condiviso per token, raggiungendo prestazioni di frontiera su benchmark complessi di matematica, programmazione e compiti agentici, mantenendo coerenza a lungo raggio attraverso centinaia di invocazioni consecutive di strumenti. Il modello supporta generazione di codice, pensiero profondo e "tool calling" in inglese e cinese. Con una finestra di contesto da 256K e "flash attention", eccelle nei workflow agentici multi-step che richiedono ragionamento sostenuto e orientato agli obiettivi.
Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
| Quantizzazione | Qualità | Dimensione | Adeguatezza |
|---|---|---|---|
| Q8_0 | Alta | 1016.07 GB | — |
| Q8_K_XL | Alta | 1108.35 GB | — |
| Q6_K | Alta | 785.01 GB | — |
| Q6_K_XL | Alta | 818.73 GB | — |
| Q5_K_M | Media | 678.67 GB | — |
| Q5_K_S | Media | 658.39 GB | — |
| Q5_K_XL | Media | 679.68 GB | — |
| Q4_K_M | Media | 578.6 GB | — |
| Q4_K_S | Media | 543.23 GB | — |
| Q4_K_XL | Media | 601.86 GB | — |
| Q4_0 | Media | 541.24 GB | — |
| Q4_1 | Media | 598.79 GB | — |
| Q3_K_M | Bassa | 456.33 GB | — |
| Q3_K_S | Bassa | 412.7 GB | — |
| Q3_K_XL | Bassa | 423.87 GB | — |
| Q2_K | Bassa | 348.4 GB | — |
| Q2_K_L | Bassa | 348.65 GB | — |
| Q2_K_XL | Bassa | 359.82 GB | — |
Ultimo aggiornamento: 5 marzo 2026