Aller au contenu

Granite 4.0 Tiny Base Preview

IBM
Code Multilingual

Granite 4.0 Tiny Base Preview est un modèle "Mixture-of-Experts" à grain fin de 6,67 milliards de paramètres d'IBM, conçu pour le suivi d'instructions et la génération de code efficaces. Avec 62 experts et 6 actifs par token, il offre un raisonnement solide pour une fraction du coût de calcul des modèles denses de taille équivalente. Le modèle prend en charge les tâches liées au code et la conversation multilingue dans 12 langues dont l'anglais, le chinois et le japonais. Une fenêtre de contexte de 128K avec "flash attention" permet des flux de travail sur documents longs et il se quantifie bien en GGUF pour des déploiements auto-hébergés légers.

Configuration matérielle

Facultatif — pour des recommandations de déploiement précises
Quantification Qualité Taille Adéquation
FP16 Pleine précision 12.44 GB
Q8_0 Élevée 6.62 GB
Q6_K Élevée 5.11 GB
Q5_K_M Moyenne 4.42 GB
Q5_K_S Moyenne 4.3 GB
Q4_K_M Moyenne 3.77 GB
Q4_K_S Moyenne 3.56 GB
Q4_0 Moyenne 3.53 GB
Q4_1 Moyenne 3.91 GB
Q3_K_M Basse 2.98 GB
Q3_K_S Basse 2.71 GB
Q2_K Basse 2.28 GB
Q3_K_L Basse 3.2 GB
Q5_0 Basse 4.3 GB
Q5_1 Basse 4.68 GB
Dernière mise à jour : 5 mars 2026