Qwen2.5 7B Instruct
Qwen
Code Multilingual Tool Calls
Qwen2.5 7B Instruct est un transformeur dense de 7,62 milliards de parametres de l'equipe Qwen d'Alibaba, affine pour le suivi d'instructions, la generation de code et la conversation multilingue. Il se classe parmi les modeles instruct 7B les plus performants, avec une large couverture linguistique de 14 langues dont l'anglais, le chinois, le japonais et l'arabe. Le modele prend en charge le "tool calling" et la sortie structuree de maniere native. Avec une fenetre de contexte de 32K et le "flash attention", il fonctionne efficacement sur des GPU grand public et se quantifie bien pour des deployments auto-heberges legers.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| FP16 | Pleine précision | 14.19 GB | — |
| Q8_0 | Élevée | 7.54 GB | — |
| Q6_K | Élevée | 5.83 GB | — |
| Q5_K_M | Moyenne | 5.08 GB | — |
| Q4_K_M | Moyenne | 4.36 GB | — |
| Q4_0 | Moyenne | 4.13 GB | — |
| Q3_K_M | Basse | 3.55 GB | — |
| Q2_K | Basse | 2.81 GB | — |
| Q5_0 | Basse | 4.95 GB | — |
Dernière mise à jour : 5 mars 2026