Qwen3 8B
Qwen
Code Multilingual Thinking Tool Calls
Qwen3 8B est un transformeur dense de 8 milliards de parametres de l'equipe Qwen d'Alibaba, integrant des capacites de reflexion en plus de la generation de code, du "tool calling" et du support multilingue. Il va au-dela de Qwen2.5 avec un raisonnement ameliore, prenant en charge l'inference "chain-of-thought" dans un format compact. Le modele couvre 14 langues dont l'anglais, le chinois et l'arabe. Avec une fenetre de contexte de 40K et le "flash attention", il tient sur un seul GPU grand public et se quantifie efficacement pour des charges de raisonnement auto-hebergees a faible cout.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| Q8_0 | Élevée | 8.11 GB | — |
| Q8_K_XL | Élevée | 10.08 GB | — |
| Q6_K | Élevée | 6.26 GB | — |
| Q6_K_XL | Élevée | 6.98 GB | — |
| Q5_K_M | Moyenne | 5.45 GB | — |
| Q5_K_S | Moyenne | 5.33 GB | — |
| Q5_K_XL | Moyenne | 5.47 GB | — |
| Q4_K_M | Moyenne | 4.68 GB | — |
| Q4_K_S | Moyenne | 4.47 GB | — |
| Q4_K_XL | Moyenne | 4.78 GB | — |
| Q4_1 | Moyenne | 4.89 GB | — |
| Q3_K_M | Basse | 3.84 GB | — |
| Q3_K_S | Basse | 3.51 GB | — |
| Q3_K_XL | Basse | 4.01 GB | — |
| Q2_K | Basse | 3.06 GB | — |
| Q2_K_L | Basse | 3.19 GB | — |
| Q2_K_XL | Basse | 3.26 GB | — |
Dernière mise à jour : 5 mars 2026