Qwen3 8B

Code Multilingual Thinking Tool Calls

Qwen3 8B est un transformeur dense de 8 milliards de parametres de l'equipe Qwen d'Alibaba, integrant des capacites de reflexion en plus de la generation de code, du "tool calling" et du support multilingue. Il va au-dela de Qwen2.5 avec un raisonnement ameliore, prenant en charge l'inference "chain-of-thought" dans un format compact. Le modele couvre 14 langues dont l'anglais, le chinois et l'arabe. Avec une fenetre de contexte de 40K et le "flash attention", il tient sur un seul GPU grand public et se quantifie efficacement pour des charges de raisonnement auto-hebergees a faible cout.

Configuration matérielle

Fabricant

Produit

Plateforme

Famille

Modèle

VRAM

RAM système (Go) Facultatif — pour des recommandations de déploiement précises

Quantification	Qualité	Taille	Adéquation
Q8_0	Élevée	8.11 GB	—
Q8_K_XL	Élevée	10.08 GB	—
Q6_K	Élevée	6.26 GB	—
Q6_K_XL	Élevée	6.98 GB	—
Q5_K_M	Moyenne	5.45 GB	—
Q5_K_S	Moyenne	5.33 GB	—
Q5_K_XL	Moyenne	5.47 GB	—
Q4_K_M	Moyenne	4.68 GB	—
Q4_K_S	Moyenne	4.47 GB	—
Q4_K_XL	Moyenne	4.78 GB	—
Q4_1	Moyenne	4.89 GB	—
Q3_K_M	Basse	3.84 GB	—
Q3_K_S	Basse	3.51 GB	—
Q3_K_XL	Basse	4.01 GB	—
Q2_K	Basse	3.06 GB	—
Q2_K_L	Basse	3.19 GB	—
Q2_K_XL	Basse	3.26 GB	—

Dernière mise à jour : 24 mars 2026