Kimi K2 Thinking
Kimi K2 Thinking est un modèle "Mixture-of-Experts" de 170,27 milliards de paramètres de Moonshot AI, entraîné de bout en bout pour le raisonnement "chain-of-thought" étendu avec utilisation d'outils intégrée. Il active 8 des 384 experts plus 1 expert partagé par jeton, atteignant des performances de pointe sur des benchmarks complexes de mathématiques, programmation et tâches agentiques tout en maintenant une cohérence sur de longues séquences de centaines d'appels d'outils consécutifs. Le modèle prend en charge la génération de code, la réflexion approfondie et le "tool calling" en anglais et en chinois. Avec une fenêtre de contexte de 256K et le "flash attention", il excelle dans les workflows agentiques multi-étapes nécessitant un raisonnement soutenu et orienté vers un objectif.
Configuration matérielle
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| Q8_0 | Élevée | 1016.07 GB | — |
| Q8_K_XL | Élevée | 1108.35 GB | — |
| Q6_K | Élevée | 785.01 GB | — |
| Q6_K_XL | Élevée | 818.73 GB | — |
| Q5_K_M | Moyenne | 678.67 GB | — |
| Q5_K_S | Moyenne | 658.39 GB | — |
| Q5_K_XL | Moyenne | 679.68 GB | — |
| Q4_K_M | Moyenne | 578.6 GB | — |
| Q4_K_S | Moyenne | 543.23 GB | — |
| Q4_K_XL | Moyenne | 601.86 GB | — |
| Q4_0 | Moyenne | 541.24 GB | — |
| Q4_1 | Moyenne | 598.79 GB | — |
| Q3_K_M | Basse | 456.33 GB | — |
| Q3_K_S | Basse | 412.7 GB | — |
| Q3_K_XL | Basse | 423.87 GB | — |
| Q2_K | Basse | 348.4 GB | — |
| Q2_K_L | Basse | 348.65 GB | — |
| Q2_K_XL | Basse | 359.82 GB | — |