Qwen3.6 35B A3B

Code Multilingual Thinking Tool Calls Vision

Qwen3.6 35B A3B è un modello « Mixture-of-Experts » del team Qwen di Alibaba con 35,9 miliardi di parametri totali ma solo 3 miliardi attivi per token, distribuiti su 256 esperti tramite un innovativo meccanismo ibrido Gated DeltaNet e Gated Attention. È nativamente multimodale, elaborando testo, immagini e video, con capacità integrate di ragionamento e chiamata di strumenti su una finestra di contesto da 262K token. Il modello supporta oltre 200 lingue ed è rilasciato sotto licenza Apache 2.0. Con quantizzazione Q4 richiede circa 20 GB di VRAM, rendendolo molto adatto al deployment self-hosted su GPU consumer.

Configurazione hardware

Produttore

Prodotto

Piattaforma

Famiglia

Modello

VRAM

RAM di sistema (GB) Facoltativo — per raccomandazioni di distribuzione precise

Quantizzazione	Qualità	Dimensione	Adeguatezza
BF16	Piena precisione	64.62 GB	—
Q8_0	Alta	34.37 GB	—
Q8_K_XL	Alta	35.81 GB	—
Q6_K	Alta	27.06 GB	—
Q6_K_XL	Alta	29.66 GB	—
Q5_K_M	Media	24.64 GB	—
Q5_K_S	Media	23.23 GB	—
Q5_K_XL	Media	24.77 GB	—
Q4_K_M	Media	20.61 GB	—
Q4_K_S	Media	19.46 GB	—
Q4_K_XL	Media	20.82 GB	—
MXFP4_MOE	Media	20.22 GB	—
IQ4_NL	Media	16.8 GB	—
IQ4_XS	Media	16.51 GB	—
Q3_K_M	Bassa	15.46 GB	—
Q3_K_S	Bassa	14.3 GB	—
Q3_K_XL	Bassa	15.69 GB	—
IQ3_S	Bassa	12.74 GB	—
IQ3_XXS	Bassa	12.3 GB	—
Q2_K_XL	Bassa	11.45 GB	—
IQ2_M	Bassa	10.73 GB	—
IQ2_XXS	Bassa	10.02 GB	—
IQ1_M	Bassa	9.36 GB	—

Ultimo aggiornamento: 29 aprile 2026