Granite 4.0 Tiny Base Preview
IBM
Code Multilingual
Granite 4.0 Tiny Base Preview est un modèle "Mixture-of-Experts" à grain fin de 6,67 milliards de paramètres d'IBM, conçu pour le suivi d'instructions et la génération de code efficaces. Avec 62 experts et 6 actifs par token, il offre un raisonnement solide pour une fraction du coût de calcul des modèles denses de taille équivalente. Le modèle prend en charge les tâches liées au code et la conversation multilingue dans 12 langues dont l'anglais, le chinois et le japonais. Une fenêtre de contexte de 128K avec "flash attention" permet des flux de travail sur documents longs et il se quantifie bien en GGUF pour des déploiements auto-hébergés légers.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| FP16 | Pleine précision | 12.44 GB | — |
| Q8_0 | Élevée | 6.62 GB | — |
| Q6_K | Élevée | 5.11 GB | — |
| Q5_K_M | Moyenne | 4.42 GB | — |
| Q5_K_S | Moyenne | 4.3 GB | — |
| Q4_K_M | Moyenne | 3.77 GB | — |
| Q4_K_S | Moyenne | 3.56 GB | — |
| Q4_0 | Moyenne | 3.53 GB | — |
| Q4_1 | Moyenne | 3.91 GB | — |
| Q3_K_M | Basse | 2.98 GB | — |
| Q3_K_S | Basse | 2.71 GB | — |
| Q2_K | Basse | 2.28 GB | — |
| Q3_K_L | Basse | 3.2 GB | — |
| Q5_0 | Basse | 4.3 GB | — |
| Q5_1 | Basse | 4.68 GB | — |
Dernière mise à jour : 5 mars 2026