Qwen3.5 9B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.5 9B è il modello di punta di piccole dimensioni nella famiglia Qwen 3.5 di Alibaba con architettura ibrida Gated Delta Networks e 9,65 miliardi di parametri, superando gpt-oss-120B su GPQA Diamond con 81,7 contro 80,1 con tredici volte meno parametri. È nativamente multimodale, elaborando testo, immagini e video, con capacità di ragionamento integrate per l'inferenza « chain-of-thought ». Il modello supporta una finestra di contesto da 262K e copre oltre 201 lingue. Rilasciato sotto licenza Apache 2.0, funziona con circa 5 GB di VRAM in Q4, rendendolo una scelta di primo livello per il deployment self-hosted su hardware consumer.
Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
| Quantizzazione | Qualità | Dimensione | Adeguatezza |
|---|---|---|---|
| Q8_0 | Alta | 8.87 GB | — |
| Q8_K_XL | Alta | 12.08 GB | — |
| Q6_K | Alta | 6.95 GB | — |
| Q6_K_XL | Alta | 8.16 GB | — |
| Q5_K_M | Media | 6.13 GB | — |
| Q5_K_S | Media | 5.92 GB | — |
| Q5_K_XL | Media | 6.28 GB | — |
| Q4_K_M | Media | 5.29 GB | — |
| Q4_K_S | Media | 5.02 GB | — |
| Q4_K_XL | Media | 5.56 GB | — |
| Q4_0 | Media | 5.01 GB | — |
| Q4_1 | Media | 5.44 GB | — |
| Q3_K_M | Bassa | 4.35 GB | — |
| Q3_K_S | Bassa | 4.02 GB | — |
| Q3_K_XL | Bassa | 4.71 GB | — |
| Q2_K_XL | Bassa | 3.84 GB | — |
Ultimo aggiornamento: 13 marzo 2026