Qwen3 Next 80B A3B Instruct
Qwen
Code Multilingual Tool Calls
Qwen3 Next 80B A3B Instruct est un modèle "Mixture-of-Experts" de l'équipe Qwen d'Alibaba avec 81,32 milliards de paramètres totaux, affiné pour le suivi d'instructions et les workflows d'utilisation d'outils. Seuls environ 3 milliards de paramètres s'activent par token en sollicitant 10 des 512 experts, égalant les performances de modèles bien plus grands à un coût de calcul nettement inférieur. Il prend en charge la génération de code, le "tool calling" et 13 langues dont l'anglais et le chinois. Avec une fenêtre de contexte de 262K et le "flash attention", il traite nativement les documents longs et se quantifie bien au format GGUF pour une inférence auto-hébergée sur des configurations multi-GPU grand public.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| Q8_0 | Élevée | 78.99 GB | — |
| Q8_K_XL | Élevée | 86.69 GB | — |
| Q6_K | Élevée | 61.04 GB | — |
| Q6_K_XL | Élevée | 63.81 GB | — |
| Q5_K_M | Moyenne | 52.91 GB | — |
| Q5_K_S | Moyenne | 51.24 GB | — |
| Q5_K_XL | Moyenne | 52.77 GB | — |
| Q4_K_M | Moyenne | 45.17 GB | — |
| Q4_K_S | Moyenne | 42.38 GB | — |
| Q4_K_XL | Moyenne | 42.9 GB | — |
| Q4_0 | Moyenne | 42.2 GB | — |
| Q4_1 | Moyenne | 46.61 GB | — |
| Q3_K_M | Basse | 35.67 GB | — |
| Q3_K_S | Basse | 32.21 GB | — |
| Q3_K_XL | Basse | 33.19 GB | — |
| Q2_K | Basse | 27.17 GB | — |
| Q2_K_L | Basse | 27.24 GB | — |
| Q2_K_XL | Basse | 28.06 GB | — |
Dernière mise à jour : 5 mars 2026