GLM 4.7
Zai Org
Code Thinking Tool Calls
GLM-4.7 est un modèle "Mixture-of-Experts" de 358,34 milliards de paramètres de l'équipe GLM chez Zai Org, conçu pour la programmation avancée, le raisonnement agentique et l'utilisation d'outils. Il achemine chaque jeton à travers 8 des 160 experts plus 1 expert partagé, atteignant des performances de pointe sur des benchmarks comme SWE-bench et AIME tout en maintenant un coût de calcul par jeton raisonnable. Le modèle prend en charge la génération de code, la réflexion étendue avec raisonnement entrelacé et le "tool calling" en anglais et en chinois. Avec une fenêtre de contexte de 198K et le "flash attention", il est destiné aux workflows agentiques multi-étapes sur des déploiements GPU haut de gamme.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| Q8_0 | Élevée | 354.79 GB | — |
| Q8_K_XL | Élevée | 367.72 GB | — |
| Q6_K | Élevée | 274.17 GB | — |
| Q6_K_XL | Élevée | 280.43 GB | — |
| Q5_K_M | Moyenne | 236.81 GB | — |
| Q5_K_S | Moyenne | 230.04 GB | — |
| Q5_K_XL | Moyenne | 236.19 GB | — |
| Q4_K_M | Moyenne | 201.58 GB | — |
| Q4_K_S | Moyenne | 189.71 GB | — |
| Q4_K_XL | Moyenne | 190.51 GB | — |
| Q4_0 | Moyenne | 189.1 GB | — |
| Q4_1 | Moyenne | 209.19 GB | — |
| Q3_K_M | Basse | 159.5 GB | — |
| Q3_K_S | Basse | 144.39 GB | — |
| Q3_K_XL | Basse | 147.83 GB | — |
| Q2_K | Basse | 122.14 GB | — |
| Q2_K_L | Basse | 122.31 GB | — |
| Q2_K_XL | Basse | 125.92 GB | — |
Dernière mise à jour : 5 mars 2026