Qwen3.5 4B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.5 4B è un modello della famiglia Qwen 3.5 di Alibaba con architettura ibrida Gated Delta Networks e 4,66 miliardi di parametri, ampiamente considerato il punto ottimale dalla comunità per prestazioni per watt. È nativamente multimodale, elaborando testo, immagini e video, con capacità di ragionamento integrate per l'inferenza « chain-of-thought ». Il modello supporta una finestra di contesto da 262K e copre oltre 201 lingue, eguagliando quasi i modelli MoE da 80B della generazione precedente sui benchmark di codice. Rilasciato sotto licenza Apache 2.0, funziona con circa 3 GB di VRAM in Q4, offrendo un deployment self-hosted veloce e stabile su hardware consumer.
Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
| Quantizzazione | Qualità | Dimensione | Adeguatezza |
|---|---|---|---|
| Q8_0 | Alta | 4.17 GB | — |
| Q8_K_XL | Alta | 5.54 GB | — |
| Q6_K | Alta | 3.28 GB | — |
| Q6_K_XL | Alta | 3.86 GB | — |
| Q5_K_M | Media | 2.93 GB | — |
| Q5_K_S | Media | 2.82 GB | — |
| Q5_K_XL | Media | 3.03 GB | — |
| Q4_K_M | Media | 2.55 GB | — |
| Q4_K_S | Media | 2.41 GB | — |
| Q4_K_XL | Media | 2.71 GB | — |
| Q4_0 | Media | 2.41 GB | — |
| Q4_1 | Media | 2.59 GB | — |
| Q3_K_M | Bassa | 2.14 GB | — |
| Q3_K_S | Bassa | 1.96 GB | — |
| Q3_K_XL | Bassa | 2.27 GB | — |
| Q2_K_XL | Bassa | 1.81 GB | — |
Ultimo aggiornamento: 13 marzo 2026