NVIDIA Nemotron 3 Nano 4B

Code Thinking Tool Calls

Nemotron 3 Nano 4B è un modello denso ibrido Mamba-2/Transformer da 3,97 miliardi di parametri di NVIDIA, compresso dal modello più grande 9B Nano v2. Supporta una modalità di ragionamento attivabile, tool calling e generazione di codice per attività agentiche e di ragionamento. Una finestra di contesto da 262K e il flash attention consentono flussi di lavoro a contesto lungo su hardware modesto. Le quantizzazioni GGUF vanno da 2 a 8 GB, rendendolo ideale per dispositivi edge e GPU consumer con memoria limitata.

Configurazione hardware

Produttore

Prodotto

Piattaforma

Famiglia

Modello

VRAM

RAM di sistema (GB) Facoltativo — per raccomandazioni di distribuzione precise

Quantizzazione	Qualità	Dimensione	Adeguatezza
BF16	Piena precisione	7.96 GB	—
Q8_0	Alta	4.23 GB	—
Q8_K_XL	Alta	5.63 GB	—
Q6_K	Alta	4.06 GB	—
Q6_K_XL	Alta	4.56 GB	—
Q5_K_M	Media	3.16 GB	—
Q5_K_S	Media	3.11 GB	—
Q5_K_XL	Media	3.31 GB	—
Q4_K_M	Media	2.9 GB	—
Q4_K_S	Media	2.83 GB	—
Q4_K_XL	Media	3.13 GB	—
IQ4_NL	Media	2.57 GB	—
IQ4_XS	Media	2.54 GB	—
Q4_0	Media	2.53 GB	—
Q4_1	Media	2.71 GB	—
Q3_K_M	Bassa	2.46 GB	—
Q3_K_S	Bassa	2.36 GB	—
Q3_K_XL	Bassa	2.68 GB	—
IQ3_XXS	Bassa	2.39 GB	—
Q2_K_XL	Bassa	2.5 GB	—
IQ2_M	Bassa	2.3 GB	—
IQ2_XXS	Bassa	2.18 GB	—

Ultimo aggiornamento: 24 marzo 2026