Salta ai contenuti

Qwen3.6 35B A3B

Qwen
Code Multilingual Thinking Tool Calls Vision

Qwen3.6 35B A3B è un modello « Mixture-of-Experts » del team Qwen di Alibaba con 35,9 miliardi di parametri totali ma solo 3 miliardi attivi per token, distribuiti su 256 esperti tramite un innovativo meccanismo ibrido Gated DeltaNet e Gated Attention. È nativamente multimodale, elaborando testo, immagini e video, con capacità integrate di ragionamento e chiamata di strumenti su una finestra di contesto da 262K token. Il modello supporta oltre 200 lingue ed è rilasciato sotto licenza Apache 2.0. Con quantizzazione Q4 richiede circa 20 GB di VRAM, rendendolo molto adatto al deployment self-hosted su GPU consumer.

Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
Quantizzazione Qualità Dimensione Adeguatezza
BF16 Piena precisione 64.62 GB
Q8_0 Alta 34.37 GB
Q8_K_XL Alta 35.81 GB
Q6_K Alta 27.06 GB
Q6_K_XL Alta 29.66 GB
Q5_K_M Media 24.64 GB
Q5_K_S Media 23.23 GB
Q5_K_XL Media 24.77 GB
Q4_K_M Media 20.61 GB
Q4_K_S Media 19.46 GB
Q4_K_XL Media 20.82 GB
MXFP4_MOE Media 20.22 GB
IQ4_NL Media 16.8 GB
IQ4_XS Media 16.51 GB
Q3_K_M Bassa 15.46 GB
Q3_K_S Bassa 14.3 GB
Q3_K_XL Bassa 15.69 GB
IQ3_S Bassa 12.74 GB
IQ3_XXS Bassa 12.3 GB
Q2_K_XL Bassa 11.45 GB
IQ2_M Bassa 10.73 GB
IQ2_XXS Bassa 10.02 GB
IQ1_M Bassa 9.36 GB
Ultimo aggiornamento: 29 aprile 2026