Qwen3.5 35B A3B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.5 35B A3B ist ein Mixture-of-Experts-Modell vom Qwen-Team bei Alibaba mit 35 Milliarden Gesamtparametern, von denen nur 3 Milliarden pro Token aktiv sind, verteilt auf 256 Experten für extreme Effizienz. Es ist nativ multimodal und verarbeitet Text, Bilder und Video, mit integrierten Denkfähigkeiten für Chain-of-Thought-Schlussfolgern. Das Modell unterstützt ein 262K-Kontextfenster und deckt über 200 Sprachen ab. Unter der Apache-2.0-Lizenz veröffentlicht, liefert es Spitzenleistung bei einem Bruchteil der Rechenkosten und lässt sich effizient für selbstgehostete Deployments auf Consumer-Hardware quantisieren.
Hardwarekonfiguration
Optional — für präzise Bereitstellungsempfehlungen
| Quantisierung | Qualität | Größe | Eignung |
|---|---|---|---|
| MXFP4_MOE | Sehr hoch | 20.11 GB | — |
| Q8_K_XL | Hoch | 36.04 GB | — |
| Q6_K_XL | Hoch | 28.22 GB | — |
| Q5_K_XL | Mittel | 23.22 GB | — |
| Q4_K_M | Mittel | 18.49 GB | — |
| Q4_K_XL | Mittel | 19.17 GB | — |
| Q3_K_M | Niedrig | 15.54 GB | — |
| Q3_K_XL | Niedrig | 16.06 GB | — |
| Q2_K_XL | Niedrig | 12.04 GB | — |
| Q4_K_L | Niedrig | 18.82 GB | — |
| Q6_K_S | Niedrig | 26.56 GB | — |
Zuletzt aktualisiert: 13. März 2026