Qwen3.6 35B A3B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.6 35B A3B è un modello « Mixture-of-Experts » del team Qwen di Alibaba con 35,9 miliardi di parametri totali ma solo 3 miliardi attivi per token, distribuiti su 256 esperti tramite un innovativo meccanismo ibrido Gated DeltaNet e Gated Attention. È nativamente multimodale, elaborando testo, immagini e video, con capacità integrate di ragionamento e chiamata di strumenti su una finestra di contesto da 262K token. Il modello supporta oltre 200 lingue ed è rilasciato sotto licenza Apache 2.0. Con quantizzazione Q4 richiede circa 20 GB di VRAM, rendendolo molto adatto al deployment self-hosted su GPU consumer.
Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
| Quantizzazione | Qualità | Dimensione | Adeguatezza |
|---|---|---|---|
| BF16 | Piena precisione | 64.62 GB | — |
| Q8_0 | Alta | 34.37 GB | — |
| Q8_K_XL | Alta | 35.81 GB | — |
| Q6_K | Alta | 27.06 GB | — |
| Q6_K_XL | Alta | 29.66 GB | — |
| Q5_K_M | Media | 24.64 GB | — |
| Q5_K_S | Media | 23.23 GB | — |
| Q5_K_XL | Media | 24.77 GB | — |
| Q4_K_M | Media | 20.61 GB | — |
| Q4_K_S | Media | 19.46 GB | — |
| Q4_K_XL | Media | 20.82 GB | — |
| MXFP4_MOE | Media | 20.22 GB | — |
| IQ4_NL | Media | 16.8 GB | — |
| IQ4_XS | Media | 16.51 GB | — |
| Q3_K_M | Bassa | 15.46 GB | — |
| Q3_K_S | Bassa | 14.3 GB | — |
| Q3_K_XL | Bassa | 15.69 GB | — |
| IQ3_S | Bassa | 12.74 GB | — |
| IQ3_XXS | Bassa | 12.3 GB | — |
| Q2_K_XL | Bassa | 11.45 GB | — |
| IQ2_M | Bassa | 10.73 GB | — |
| IQ2_XXS | Bassa | 10.02 GB | — |
| IQ1_M | Bassa | 9.36 GB | — |
Ultimo aggiornamento: 29 aprile 2026