Kimi K2.5

Code Thinking Tool Calls Vision

Kimi K2.5 est un modèle "Mixture-of-Experts" de 1 016,23 milliards de paramètres de Moonshot AI, combinant la vision native avec un raisonnement agentique avancé. Il active 8 des 384 experts plus 1 expert partagé par jeton, atteignant des performances de pointe en programmation, mathématiques et benchmarks multimodaux tout en maintenant un coût de calcul par jeton équivalent à un modèle dense de 32B. Le modèle prend en charge la génération de code, la réflexion étendue, le "tool calling" et la compréhension d'images en anglais et en chinois. Avec une fenêtre de contexte de 256K et le "flash attention", il gère l'analyse de longs documents et les workflows agentiques multi-étapes avec des entrées visuelles.

Configuration matérielle

Fabricant

Produit

Plateforme

Famille

Modèle

VRAM

RAM système (Go) Facultatif — pour des recommandations de déploiement précises

Quantification	Qualité	Taille	Adéquation
Q8_0	Élevée	1016.23 GB	—
Q8_K_XL	Élevée	1108.05 GB	—
Q6_K	Élevée	785.01 GB	—
Q6_K_XL	Élevée	817.42 GB	—
Q5_K_M	Moyenne	678.67 GB	—
Q5_K_S	Moyenne	658.39 GB	—
Q5_K_XL	Moyenne	681.05 GB	—
Q4_K_M	Moyenne	578.6 GB	—
Q4_K_S	Moyenne	543.22 GB	—
Q4_K_XL	Moyenne	579.29 GB	—
Q4_0	Moyenne	541.23 GB	—
Q4_1	Moyenne	598.79 GB	—
Q3_K_M	Basse	456.13 GB	—
Q3_K_S	Basse	412.7 GB	—
Q3_K_XL	Basse	456.76 GB	—
Q2_K	Basse	348.09 GB	—
Q2_K_L	Basse	348.35 GB	—
Q2_K_XL	Basse	349.01 GB	—

Dernière mise à jour : 29 avril 2026