Kimi K2.5

Code Thinking Tool Calls Vision

Kimi K2.5 è un modello "Mixture-of-Experts" da 1.016,23 miliardi di parametri di Moonshot AI, che combina visione nativa con ragionamento agentico avanzato. Attiva 8 dei 384 esperti più 1 esperto condiviso per token, raggiungendo prestazioni di frontiera in programmazione, matematica e benchmark multimodali con un costo di calcolo per token equivalente a un modello denso da 32B. Il modello supporta generazione di codice, pensiero esteso, "tool calling" e comprensione di immagini in inglese e cinese. Con una finestra di contesto da 256K e "flash attention", gestisce analisi di documenti lunghi e workflow agentici multi-step con input visivi.

Configurazione hardware

Produttore

Prodotto

Piattaforma

Famiglia

Modello

VRAM

RAM di sistema (GB) Facoltativo — per raccomandazioni di distribuzione precise

Quantizzazione	Qualità	Dimensione	Adeguatezza
Q8_0	Alta	1016.23 GB	—
Q8_K_XL	Alta	1108.05 GB	—
Q6_K	Alta	785.01 GB	—
Q6_K_XL	Alta	817.42 GB	—
Q5_K_M	Media	678.67 GB	—
Q5_K_S	Media	658.39 GB	—
Q5_K_XL	Media	681.05 GB	—
Q4_K_M	Media	578.6 GB	—
Q4_K_S	Media	543.22 GB	—
Q4_K_XL	Media	579.29 GB	—
Q4_0	Media	541.23 GB	—
Q4_1	Media	598.79 GB	—
Q3_K_M	Bassa	456.13 GB	—
Q3_K_S	Bassa	412.7 GB	—
Q3_K_XL	Bassa	456.76 GB	—
Q2_K	Bassa	348.09 GB	—
Q2_K_L	Bassa	348.35 GB	—
Q2_K_XL	Bassa	349.01 GB	—

Ultimo aggiornamento: 29 aprile 2026