Salta ai contenuti

Qwen3.5 4B

Qwen
Code Multilingual Thinking Tool Calls Vision

Qwen3.5 4B è un modello della famiglia Qwen 3.5 di Alibaba con architettura ibrida Gated Delta Networks e 4,66 miliardi di parametri, ampiamente considerato il punto ottimale dalla comunità per prestazioni per watt. È nativamente multimodale, elaborando testo, immagini e video, con capacità di ragionamento integrate per l'inferenza « chain-of-thought ». Il modello supporta una finestra di contesto da 262K e copre oltre 201 lingue, eguagliando quasi i modelli MoE da 80B della generazione precedente sui benchmark di codice. Rilasciato sotto licenza Apache 2.0, funziona con circa 3 GB di VRAM in Q4, offrendo un deployment self-hosted veloce e stabile su hardware consumer.

Configurazione hardware

Facoltativo — per raccomandazioni di distribuzione precise
Quantizzazione Qualità Dimensione Adeguatezza
Q8_0 Alta 4.17 GB
Q8_K_XL Alta 5.54 GB
Q6_K Alta 3.28 GB
Q6_K_XL Alta 3.86 GB
Q5_K_M Media 2.93 GB
Q5_K_S Media 2.82 GB
Q5_K_XL Media 3.03 GB
Q4_K_M Media 2.55 GB
Q4_K_S Media 2.41 GB
Q4_K_XL Media 2.71 GB
Q4_0 Media 2.41 GB
Q4_1 Media 2.59 GB
Q3_K_M Bassa 2.14 GB
Q3_K_S Bassa 1.96 GB
Q3_K_XL Bassa 2.27 GB
Q2_K_XL Bassa 1.81 GB
Ultimo aggiornamento: 13 marzo 2026