Kimi K2 Instruct

Code Tool Calls

Kimi K2 Instruct est un modèle "Mixture-of-Experts" de 1 026,47 milliards de paramètres de Moonshot AI, affiné pour le suivi d'instructions, la génération de code et l'utilisation autonome d'outils. Il active 8 des 384 experts plus 1 expert partagé par jeton, atteignant de solides performances sur les benchmarks de programmation et agentiques tout en maintenant un coût de calcul par jeton équivalent à un modèle dense de 32B. Le modèle prend en charge la génération de code et le "tool calling" en anglais et en chinois, entraîné avec l'optimiseur MuonClip sur 15,5 billions de jetons. Avec une fenêtre de contexte de 128K et le "flash attention", il convient aux déploiements agentiques nécessitant une orchestration d'outils fiable.

Configuration matérielle

Fabricant

Produit

Plateforme

Famille

Modèle

VRAM

RAM système (Go) Facultatif — pour des recommandations de déploiement précises

Quantification	Qualité	Taille	Adéquation
Q8_0	Élevée	1016.15 GB	—
Q8_K_XL	Élevée	1108.35 GB	—
Q6_K	Élevée	784.82 GB	—
Q6_K_XL	Élevée	818.73 GB	—
Q5_K_M	Moyenne	678.37 GB	—
Q5_K_S	Moyenne	658.07 GB	—
Q5_K_XL	Moyenne	680.38 GB	—
Q4_K_M	Moyenne	578.14 GB	—
Q4_K_S	Moyenne	542.74 GB	—
Q4_K_XL	Moyenne	546.77 GB	—
Q4_0	Moyenne	540.76 GB	—
Q4_1	Moyenne	598.41 GB	—
Q3_K_M	Basse	455.73 GB	—
Q3_K_S	Basse	412.01 GB	—
Q3_K_XL	Basse	421.03 GB	—
Q2_K	Basse	347.56 GB	—
Q2_K_L	Basse	347.82 GB	—
Q2_K_XL	Basse	355.65 GB	—

Dernière mise à jour : 29 avril 2026