Salta ai contenuti

NVIDIA Nemotron 3 Nano 4B

NVIDIA
Code Thinking Tool Calls

Nemotron 3 Nano 4B è un modello denso ibrido Mamba-2/Transformer da 3,97 miliardi di parametri di NVIDIA, compresso dal modello più grande 9B Nano v2. Supporta una modalità di ragionamento attivabile, tool calling e generazione di codice per attività agentiche e di ragionamento. Una finestra di contesto da 262K e il flash attention consentono flussi di lavoro a contesto lungo su hardware modesto. Le quantizzazioni GGUF vanno da 2 a 8 GB, rendendolo ideale per dispositivi edge e GPU consumer con memoria limitata.

Configurazione hardware

Facoltativo — per raccomandazioni di distribuzione precise
Quantizzazione Qualità Dimensione Adeguatezza
BF16 Piena precisione 7.96 GB
Q8_0 Alta 4.23 GB
Q8_K_XL Alta 5.63 GB
Q6_K Alta 4.06 GB
Q6_K_XL Alta 4.56 GB
Q5_K_M Media 3.16 GB
Q5_K_S Media 3.11 GB
Q5_K_XL Media 3.31 GB
Q4_K_M Media 2.9 GB
Q4_K_S Media 2.83 GB
Q4_K_XL Media 3.13 GB
IQ4_NL Media 2.57 GB
IQ4_XS Media 2.54 GB
Q4_0 Media 2.53 GB
Q4_1 Media 2.71 GB
Q3_K_M Bassa 2.46 GB
Q3_K_S Bassa 2.36 GB
Q3_K_XL Bassa 2.68 GB
IQ3_XXS Bassa 2.39 GB
Q2_K_XL Bassa 2.5 GB
IQ2_M Bassa 2.3 GB
IQ2_XXS Bassa 2.18 GB
Ultimo aggiornamento: 17 marzo 2026