Kimi K2 Thinking

Code Thinking Tool Calls

Kimi K2 Thinking est un modèle "Mixture-of-Experts" de 170,27 milliards de paramètres de Moonshot AI, entraîné de bout en bout pour le raisonnement "chain-of-thought" étendu avec utilisation d'outils intégrée. Il active 8 des 384 experts plus 1 expert partagé par jeton, atteignant des performances de pointe sur des benchmarks complexes de mathématiques, programmation et tâches agentiques tout en maintenant une cohérence sur de longues séquences de centaines d'appels d'outils consécutifs. Le modèle prend en charge la génération de code, la réflexion approfondie et le "tool calling" en anglais et en chinois. Avec une fenêtre de contexte de 256K et le "flash attention", il excelle dans les workflows agentiques multi-étapes nécessitant un raisonnement soutenu et orienté vers un objectif.

Configuration matérielle

Fabricant

Produit

Plateforme

Famille

Modèle

VRAM

RAM système (Go) Facultatif — pour des recommandations de déploiement précises

Quantification	Qualité	Taille	Adéquation
Q8_0	Élevée	1016.07 GB	—
Q8_K_XL	Élevée	1108.35 GB	—
Q6_K	Élevée	785.01 GB	—
Q6_K_XL	Élevée	818.73 GB	—
Q5_K_M	Moyenne	678.67 GB	—
Q5_K_S	Moyenne	658.39 GB	—
Q5_K_XL	Moyenne	679.68 GB	—
Q4_K_M	Moyenne	578.6 GB	—
Q4_K_S	Moyenne	543.23 GB	—
Q4_K_XL	Moyenne	601.86 GB	—
Q4_0	Moyenne	541.24 GB	—
Q4_1	Moyenne	598.79 GB	—
Q3_K_M	Basse	456.33 GB	—
Q3_K_S	Basse	412.7 GB	—
Q3_K_XL	Basse	423.87 GB	—
Q2_K	Basse	348.4 GB	—
Q2_K_L	Basse	348.65 GB	—
Q2_K_XL	Basse	359.82 GB	—

Dernière mise à jour : 29 avril 2026