Kimi K2 Instruct

Code Tool Calls

Kimi K2 Instruct è un modello "Mixture-of-Experts" da 1.026,47 miliardi di parametri di Moonshot AI, perfezionato per il seguimento di istruzioni, la generazione di codice e l'utilizzo autonomo di strumenti. Attiva 8 dei 384 esperti più 1 esperto condiviso per token, raggiungendo solide prestazioni su benchmark di programmazione e agentici con un costo di calcolo per token equivalente a un modello denso da 32B. Il modello supporta generazione di codice e "tool calling" in inglese e cinese, addestrato con l'ottimizzatore MuonClip su 15,5 bilioni di token. Con una finestra di contesto da 128K e "flash attention", è adatto a deployment agentici che richiedono un'orchestrazione di strumenti affidabile.

Configurazione hardware

Produttore

Prodotto

Piattaforma

Famiglia

Modello

VRAM

RAM di sistema (GB) Facoltativo — per raccomandazioni di distribuzione precise

Quantizzazione	Qualità	Dimensione	Adeguatezza
Q8_0	Alta	1016.15 GB	—
Q8_K_XL	Alta	1108.35 GB	—
Q6_K	Alta	784.82 GB	—
Q6_K_XL	Alta	818.73 GB	—
Q5_K_M	Media	678.37 GB	—
Q5_K_S	Media	658.07 GB	—
Q5_K_XL	Media	680.38 GB	—
Q4_K_M	Media	578.14 GB	—
Q4_K_S	Media	542.74 GB	—
Q4_K_XL	Media	546.77 GB	—
Q4_0	Media	540.76 GB	—
Q4_1	Media	598.41 GB	—
Q3_K_M	Bassa	455.73 GB	—
Q3_K_S	Bassa	412.01 GB	—
Q3_K_XL	Bassa	421.03 GB	—
Q2_K	Bassa	347.56 GB	—
Q2_K_L	Bassa	347.82 GB	—
Q2_K_XL	Bassa	355.65 GB	—

Ultimo aggiornamento: 29 aprile 2026