Zum Inhalt springen

Qwen3 Next 80B A3B Instruct

Qwen
Code Multilingual Tool Calls

Qwen3 Next 80B A3B Instruct ist ein Mixture-of-Experts-Modell vom Qwen-Team bei Alibaba mit 81,32 Milliarden Gesamtparametern, feinabgestimmt für Instruktionsbefolgung und Tool-Use-Workflows. Nur etwa 3 Milliarden Parameter werden pro Token aktiviert, wobei 10 von 512 Experten zum Einsatz kommen, was die Leistung weit größerer Modelle bei drastisch geringeren Rechenkosten erreicht. Es unterstützt Codegenerierung, Tool Calling und 13 Sprachen, darunter Englisch und Chinesisch. Mit einem 262K-Kontextfenster und Flash Attention verarbeitet es lange Dokumente nativ und lässt sich gut ins GGUF-Format quantisieren für selbstgehostete Inferenz auf Consumer-Multi-GPU-Konfigurationen.

Hardwarekonfiguration

Optional — für präzise Bereitstellungsempfehlungen
Quantisierung Qualität Größe Eignung
Q8_0 Hoch 78.99 GB
Q8_K_XL Hoch 86.69 GB
Q6_K Hoch 61.04 GB
Q6_K_XL Hoch 63.81 GB
Q5_K_M Mittel 52.91 GB
Q5_K_S Mittel 51.24 GB
Q5_K_XL Mittel 52.77 GB
Q4_K_M Mittel 45.17 GB
Q4_K_S Mittel 42.38 GB
Q4_K_XL Mittel 42.9 GB
Q4_0 Mittel 42.2 GB
Q4_1 Mittel 46.61 GB
Q3_K_M Niedrig 35.67 GB
Q3_K_S Niedrig 32.21 GB
Q3_K_XL Niedrig 33.19 GB
Q2_K Niedrig 27.17 GB
Q2_K_L Niedrig 27.24 GB
Q2_K_XL Niedrig 28.06 GB
Zuletzt aktualisiert: 5. März 2026