Aller au contenu

Phi 4

Microsoft
Code

Phi 4 est un transformeur dense de 14,66 milliards de paramètres de Microsoft, entraîné sur 9,8 billions de tokens avec un accent sur les données synthétiques curées pour le raisonnement avancé. Il surpasse de nombreux modèles plus grands sur les benchmarks de sciences et de mathématiques, ce qui en fait un choix solide pour les charges de travail intensives en raisonnement à échelle modérée. Le modèle se concentre sur l'anglais avec des capacités en génération de code et résolution de problèmes mathématiques. Une fenêtre de contexte de 16K et le "flash attention" permettent une inférence efficace, et il se quantifie bien au format GGUF pour des déploiements GPU auto-hébergés.

Configuration matérielle

Facultatif — pour des recommandations de déploiement précises
Quantification Qualité Taille Adéquation
Q8_0 Élevée 14.51 GB
Q6_K Élevée 11.2 GB
Q5_K_S Moyenne 9.45 GB
Q4_K_S Moyenne 7.86 GB
Q4_0 Moyenne 7.81 GB
Q4_1 Moyenne 8.63 GB
Q3_K_S Basse 6.06 GB
Q2_K Basse 5.17 GB
Q3_K Basse 6.86 GB
Q3_K_L Basse 7.39 GB
Q4_K Basse 8.43 GB
Q5_0 Basse 9.45 GB
Q5_1 Basse 10.28 GB
Q5_K Basse 9.88 GB
Dernière mise à jour : 5 mars 2026