Qwen3.5 4B

Code Multilingual Thinking Tool Calls Vision

Qwen3.5 4B è un modello della famiglia Qwen 3.5 di Alibaba con architettura ibrida Gated Delta Networks e 4,66 miliardi di parametri, ampiamente considerato il punto ottimale dalla comunità per prestazioni per watt. È nativamente multimodale, elaborando testo, immagini e video, con capacità di ragionamento integrate per l'inferenza « chain-of-thought ». Il modello supporta una finestra di contesto da 262K e copre oltre 201 lingue, eguagliando quasi i modelli MoE da 80B della generazione precedente sui benchmark di codice. Rilasciato sotto licenza Apache 2.0, funziona con circa 3 GB di VRAM in Q4, offrendo un deployment self-hosted veloce e stabile su hardware consumer.

Configurazione hardware

Produttore

Prodotto

Piattaforma

Famiglia

Modello

VRAM

RAM di sistema (GB) Facoltativo — per raccomandazioni di distribuzione precise

Quantizzazione	Qualità	Dimensione	Adeguatezza
Q8_0	Alta	4.17 GB	—
Q8_K_XL	Alta	5.54 GB	—
Q6_K	Alta	3.28 GB	—
Q6_K_XL	Alta	3.86 GB	—
Q5_K_M	Media	2.93 GB	—
Q5_K_S	Media	2.82 GB	—
Q5_K_XL	Media	3.03 GB	—
Q4_K_M	Media	2.55 GB	—
Q4_K_S	Media	2.41 GB	—
Q4_K_XL	Media	2.71 GB	—
Q4_0	Media	2.41 GB	—
Q4_1	Media	2.59 GB	—
Q3_K_M	Bassa	2.14 GB	—
Q3_K_S	Bassa	1.96 GB	—
Q3_K_XL	Bassa	2.27 GB	—
Q2_K_XL	Bassa	1.81 GB	—

Ultimo aggiornamento: 24 marzo 2026