Qwen3.6 35B A3B

Code Multilingual Thinking Tool Calls Vision

Qwen3.6 35B A3B ist ein Mixture-of-Experts-Modell vom Qwen-Team bei Alibaba mit 35,9 Milliarden Gesamtparametern, von denen nur 3 Milliarden pro Token aktiv sind, verteilt auf 256 Experten über einen neuartigen hybriden Gated-DeltaNet- und Gated-Attention-Mechanismus. Es ist nativ multimodal und verarbeitet Text, Bilder und Video, mit integrierten Denk- und Tool-Calling-Fähigkeiten über ein 262K-Kontextfenster. Das Modell unterstützt über 200 Sprachen und steht unter der Apache-2.0-Lizenz. Bei Q4-Quantisierung benötigt es etwa 20 GB VRAM und eignet sich damit hervorragend für selbstgehostete Bereitstellung auf Consumer-GPUs.

Hardwarekonfiguration

Hersteller

Produkt

Plattform

Familie

Modell

VRAM

System-RAM (GB) Optional — für präzise Bereitstellungsempfehlungen

Quantisierung	Qualität	Größe	Eignung
BF16	Volle Präzision	64.62 GB	—
Q8_0	Hoch	34.37 GB	—
Q8_K_XL	Hoch	35.81 GB	—
Q6_K	Hoch	27.06 GB	—
Q6_K_XL	Hoch	29.66 GB	—
Q5_K_M	Mittel	24.64 GB	—
Q5_K_S	Mittel	23.23 GB	—
Q5_K_XL	Mittel	24.77 GB	—
Q4_K_M	Mittel	20.61 GB	—
Q4_K_S	Mittel	19.46 GB	—
Q4_K_XL	Mittel	20.82 GB	—
MXFP4_MOE	Mittel	20.22 GB	—
IQ4_NL	Mittel	16.8 GB	—
IQ4_XS	Mittel	16.51 GB	—
Q3_K_M	Niedrig	15.46 GB	—
Q3_K_S	Niedrig	14.3 GB	—
Q3_K_XL	Niedrig	15.69 GB	—
IQ3_S	Niedrig	12.74 GB	—
IQ3_XXS	Niedrig	12.3 GB	—
Q2_K_XL	Niedrig	11.45 GB	—
IQ2_M	Niedrig	10.73 GB	—
IQ2_XXS	Niedrig	10.02 GB	—
IQ1_M	Niedrig	9.36 GB	—

Zuletzt aktualisiert: 29. April 2026