NVIDIA Nemotron 3 Nano 4B
NVIDIA
Code Thinking Tool Calls
Nemotron 3 Nano 4B è un modello denso ibrido Mamba-2/Transformer da 3,97 miliardi di parametri di NVIDIA, compresso dal modello più grande 9B Nano v2. Supporta una modalità di ragionamento attivabile, tool calling e generazione di codice per attività agentiche e di ragionamento. Una finestra di contesto da 262K e il flash attention consentono flussi di lavoro a contesto lungo su hardware modesto. Le quantizzazioni GGUF vanno da 2 a 8 GB, rendendolo ideale per dispositivi edge e GPU consumer con memoria limitata.
Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
| Quantizzazione | Qualità | Dimensione | Adeguatezza |
|---|---|---|---|
| BF16 | Piena precisione | 7.96 GB | — |
| Q8_0 | Alta | 4.23 GB | — |
| Q8_K_XL | Alta | 5.63 GB | — |
| Q6_K | Alta | 4.06 GB | — |
| Q6_K_XL | Alta | 4.56 GB | — |
| Q5_K_M | Media | 3.16 GB | — |
| Q5_K_S | Media | 3.11 GB | — |
| Q5_K_XL | Media | 3.31 GB | — |
| Q4_K_M | Media | 2.9 GB | — |
| Q4_K_S | Media | 2.83 GB | — |
| Q4_K_XL | Media | 3.13 GB | — |
| IQ4_NL | Media | 2.57 GB | — |
| IQ4_XS | Media | 2.54 GB | — |
| Q4_0 | Media | 2.53 GB | — |
| Q4_1 | Media | 2.71 GB | — |
| Q3_K_M | Bassa | 2.46 GB | — |
| Q3_K_S | Bassa | 2.36 GB | — |
| Q3_K_XL | Bassa | 2.68 GB | — |
| IQ3_XXS | Bassa | 2.39 GB | — |
| Q2_K_XL | Bassa | 2.5 GB | — |
| IQ2_M | Bassa | 2.3 GB | — |
| IQ2_XXS | Bassa | 2.18 GB | — |
Ultimo aggiornamento: 17 marzo 2026