Kimi K2.5
Moonshot AI
Code Thinking Tool Calls Vision
Kimi K2.5 est un modèle "Mixture-of-Experts" de 1 016,23 milliards de paramètres de Moonshot AI, combinant la vision native avec un raisonnement agentique avancé. Il active 8 des 384 experts plus 1 expert partagé par jeton, atteignant des performances de pointe en programmation, mathématiques et benchmarks multimodaux tout en maintenant un coût de calcul par jeton équivalent à un modèle dense de 32B. Le modèle prend en charge la génération de code, la réflexion étendue, le "tool calling" et la compréhension d'images en anglais et en chinois. Avec une fenêtre de contexte de 256K et le "flash attention", il gère l'analyse de longs documents et les workflows agentiques multi-étapes avec des entrées visuelles.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| Q8_0 | Élevée | 1016.23 GB | — |
| Q8_K_XL | Élevée | 1108.05 GB | — |
| Q6_K | Élevée | 785.01 GB | — |
| Q6_K_XL | Élevée | 817.42 GB | — |
| Q5_K_M | Moyenne | 678.67 GB | — |
| Q5_K_S | Moyenne | 658.39 GB | — |
| Q5_K_XL | Moyenne | 681.05 GB | — |
| Q4_K_M | Moyenne | 578.6 GB | — |
| Q4_K_S | Moyenne | 543.22 GB | — |
| Q4_K_XL | Moyenne | 579.29 GB | — |
| Q4_0 | Moyenne | 541.23 GB | — |
| Q4_1 | Moyenne | 598.79 GB | — |
| Q3_K_M | Basse | 456.13 GB | — |
| Q3_K_S | Basse | 412.7 GB | — |
| Q3_K_XL | Basse | 456.76 GB | — |
| Q2_K | Basse | 348.09 GB | — |
| Q2_K_L | Basse | 348.35 GB | — |
| Q2_K_XL | Basse | 349.01 GB | — |
Dernière mise à jour : 5 mars 2026