Qwen3.5 27B
Qwen3.5 27B est le plus grand modèle dense de la série moyenne Qwen 3.5 d'Alibaba, à architecture hybride Gated Delta Networks avec 27,78 milliards de paramètres. Il atteint 86,1 sur MMLU-Pro, 85,5 sur GPQA Diamond et 72,4 sur SWE-bench Verified, égalant GPT-5 mini sur les tâches de programmation. Il est nativement multimodal, traitant texte, images et vidéo, avec des capacités de réflexion intégrées pour le raisonnement « chain-of-thought ». Le modèle prend en charge une fenêtre de contexte de 262K, extensible à plus d'un million de tokens, et couvre plus de 201 langues. Publié sous licence Apache 2.0, il fonctionne avec environ 15 Go de VRAM en Q4, ce qui en fait un excellent choix pour le déploiement auto-hébergé sur des GPU grand public de milieu de gamme.
Configuration matérielle
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| Q8_0 | Élevée | 26.63 GB | — |
| Q8_K_XL | Élevée | 33.09 GB | — |
| Q6_K | Élevée | 20.91 GB | — |
| Q6_K_XL | Élevée | 23.91 GB | — |
| Q5_K_M | Moyenne | 18.26 GB | — |
| Q5_K_S | Moyenne | 17.59 GB | — |
| Q5_K_XL | Moyenne | 18.79 GB | — |
| Q4_K_M | Moyenne | 15.59 GB | — |
| Q4_K_S | Moyenne | 14.69 GB | — |
| Q4_K_XL | Moyenne | 16.41 GB | — |
| Q4_0 | Moyenne | 14.64 GB | — |
| Q4_1 | Moyenne | 16 GB | — |
| Q3_K_M | Basse | 12.58 GB | — |
| Q3_K_S | Basse | 11.45 GB | — |
| Q3_K_XL | Basse | 13.45 GB | — |
| Q2_K_XL | Basse | 10.44 GB | — |