Kimi K2 Instruct
Moonshot AI
Code Tool Calls
Kimi K2 Instruct est un modèle "Mixture-of-Experts" de 1 026,47 milliards de paramètres de Moonshot AI, affiné pour le suivi d'instructions, la génération de code et l'utilisation autonome d'outils. Il active 8 des 384 experts plus 1 expert partagé par jeton, atteignant de solides performances sur les benchmarks de programmation et agentiques tout en maintenant un coût de calcul par jeton équivalent à un modèle dense de 32B. Le modèle prend en charge la génération de code et le "tool calling" en anglais et en chinois, entraîné avec l'optimiseur MuonClip sur 15,5 billions de jetons. Avec une fenêtre de contexte de 128K et le "flash attention", il convient aux déploiements agentiques nécessitant une orchestration d'outils fiable.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| Q8_0 | Élevée | 1016.15 GB | — |
| Q8_K_XL | Élevée | 1108.35 GB | — |
| Q6_K | Élevée | 784.82 GB | — |
| Q6_K_XL | Élevée | 818.73 GB | — |
| Q5_K_M | Moyenne | 678.37 GB | — |
| Q5_K_S | Moyenne | 658.07 GB | — |
| Q5_K_XL | Moyenne | 680.38 GB | — |
| Q4_K_M | Moyenne | 578.14 GB | — |
| Q4_K_S | Moyenne | 542.74 GB | — |
| Q4_K_XL | Moyenne | 546.77 GB | — |
| Q4_0 | Moyenne | 540.76 GB | — |
| Q4_1 | Moyenne | 598.41 GB | — |
| Q3_K_M | Basse | 455.73 GB | — |
| Q3_K_S | Basse | 412.01 GB | — |
| Q3_K_XL | Basse | 421.03 GB | — |
| Q2_K | Basse | 347.56 GB | — |
| Q2_K_L | Basse | 347.82 GB | — |
| Q2_K_XL | Basse | 355.65 GB | — |
Dernière mise à jour : 5 mars 2026