Zum Inhalt springen

Qwen3.5 35B A3B

Qwen
Code Multilingual Thinking Tool Calls Vision

Qwen3.5 35B A3B ist ein Mixture-of-Experts-Modell vom Qwen-Team bei Alibaba mit 35 Milliarden Gesamtparametern, von denen nur 3 Milliarden pro Token aktiv sind, verteilt auf 256 Experten für extreme Effizienz. Es ist nativ multimodal und verarbeitet Text, Bilder und Video, mit integrierten Denkfähigkeiten für Chain-of-Thought-Schlussfolgern. Das Modell unterstützt ein 262K-Kontextfenster und deckt über 200 Sprachen ab. Unter der Apache-2.0-Lizenz veröffentlicht, liefert es Spitzenleistung bei einem Bruchteil der Rechenkosten und lässt sich effizient für selbstgehostete Deployments auf Consumer-Hardware quantisieren.

Hardwarekonfiguration

Optional — für präzise Bereitstellungsempfehlungen
Quantisierung Qualität Größe Eignung
MXFP4_MOE Sehr hoch 20.11 GB
Q8_K_XL Hoch 36.04 GB
Q6_K_XL Hoch 28.22 GB
Q5_K_XL Mittel 23.22 GB
Q4_K_M Mittel 18.49 GB
Q4_K_XL Mittel 19.17 GB
Q3_K_M Niedrig 15.54 GB
Q3_K_XL Niedrig 16.06 GB
Q2_K_XL Niedrig 12.04 GB
Q4_K_L Niedrig 18.82 GB
Q6_K_S Niedrig 26.56 GB
Zuletzt aktualisiert: 13. März 2026