Kimi K2 Thinking

Code Thinking Tool Calls

Kimi K2 Thinking è un modello "Mixture-of-Experts" da 170,27 miliardi di parametri di Moonshot AI, addestrato end-to-end per il ragionamento "chain-of-thought" esteso con utilizzo integrato di strumenti. Attiva 8 dei 384 esperti più 1 esperto condiviso per token, raggiungendo prestazioni di frontiera su benchmark complessi di matematica, programmazione e compiti agentici, mantenendo coerenza a lungo raggio attraverso centinaia di invocazioni consecutive di strumenti. Il modello supporta generazione di codice, pensiero profondo e "tool calling" in inglese e cinese. Con una finestra di contesto da 256K e "flash attention", eccelle nei workflow agentici multi-step che richiedono ragionamento sostenuto e orientato agli obiettivi.

Configurazione hardware

Produttore

Prodotto

Piattaforma

Famiglia

Modello

VRAM

RAM di sistema (GB) Facoltativo — per raccomandazioni di distribuzione precise

Quantizzazione	Qualità	Dimensione	Adeguatezza
Q8_0	Alta	1016.07 GB	—
Q8_K_XL	Alta	1108.35 GB	—
Q6_K	Alta	785.01 GB	—
Q6_K_XL	Alta	818.73 GB	—
Q5_K_M	Media	678.67 GB	—
Q5_K_S	Media	658.39 GB	—
Q5_K_XL	Media	679.68 GB	—
Q4_K_M	Media	578.6 GB	—
Q4_K_S	Media	543.23 GB	—
Q4_K_XL	Media	601.86 GB	—
Q4_0	Media	541.24 GB	—
Q4_1	Media	598.79 GB	—
Q3_K_M	Bassa	456.33 GB	—
Q3_K_S	Bassa	412.7 GB	—
Q3_K_XL	Bassa	423.87 GB	—
Q2_K	Bassa	348.4 GB	—
Q2_K_L	Bassa	348.65 GB	—
Q2_K_XL	Bassa	359.82 GB	—

Ultimo aggiornamento: 29 aprile 2026