NVIDIA Nemotron 3 Nano 4B
NVIDIA
Code Thinking Tool Calls
Nemotron 3 Nano 4B est un modèle dense hybride Mamba-2/Transformer de 3,97 milliards de paramètres développé par NVIDIA, compressé à partir du modèle 9B Nano v2. Il prend en charge un mode de réflexion activable, l'appel d'outils et la génération de code pour les tâches agentiques et de raisonnement. Une fenêtre de contexte de 262K et le flash attention permettent des flux de travail à contexte long sur du matériel modeste. Les quantifications GGUF vont de 2 à 8 Go, ce qui le rend idéal pour les appareils en périphérie et les GPU grand public à mémoire limitée.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| BF16 | Pleine précision | 7.96 GB | — |
| Q8_0 | Élevée | 4.23 GB | — |
| Q8_K_XL | Élevée | 5.63 GB | — |
| Q6_K | Élevée | 4.06 GB | — |
| Q6_K_XL | Élevée | 4.56 GB | — |
| Q5_K_M | Moyenne | 3.16 GB | — |
| Q5_K_S | Moyenne | 3.11 GB | — |
| Q5_K_XL | Moyenne | 3.31 GB | — |
| Q4_K_M | Moyenne | 2.9 GB | — |
| Q4_K_S | Moyenne | 2.83 GB | — |
| Q4_K_XL | Moyenne | 3.13 GB | — |
| IQ4_NL | Moyenne | 2.57 GB | — |
| IQ4_XS | Moyenne | 2.54 GB | — |
| Q4_0 | Moyenne | 2.53 GB | — |
| Q4_1 | Moyenne | 2.71 GB | — |
| Q3_K_M | Basse | 2.46 GB | — |
| Q3_K_S | Basse | 2.36 GB | — |
| Q3_K_XL | Basse | 2.68 GB | — |
| IQ3_XXS | Basse | 2.39 GB | — |
| Q2_K_XL | Basse | 2.5 GB | — |
| IQ2_M | Basse | 2.3 GB | — |
| IQ2_XXS | Basse | 2.18 GB | — |
Dernière mise à jour : 17 mars 2026