En une phrase
Ce rapport teste 11 LLM locaux (15B-35B paramètres) sur une GPU RTX 3090, évaluant leurs performances en raisonnement, écriture, codage, suivi d'instructions et précision, pour identifier les meilleurs modèles exécutables localement. Qwen 3.5 27B se distingue comme le plus performant.
Points clés
- Méthodologie de test rigoureuse : 11 LLM locaux (15B-35B paramètres) ont été testés sur une RTX 3090 (24 GB VRAM) avec quantification Q4 via LM Studio. Chaque modèle a été évalué dans cinq catégories (raisonnement logique, écriture créative, codage, respect des instructions, précision) avec une température de zéro et un Top P de 1.0 pour des résultats comparables.
- Performances en raisonnement logique et écriture créative : Qwen 3.5 27B s'est distingué en résolvant un problème logique complexe avec efficacité et a produit la meilleure histoire créative, immersive et atmosphérique. Qwen 3.5 35B A3B a également montré de bonnes capacités créatives.
- Compétences en codage et suivi d'instructions : Pour le codage (création d'une application JavaScript/HTML5), GPT-OSS 20B, Qwen 3.5 27B et Gemma 4 31B ont généré des applications parfaitement fonctionnelles. Concernant le respect d'instructions complexes, Nvidia Neumitron 3 Nano 30B, April 1.6 15B et GPT-OSS 20B ont été les seuls à suivre toutes les contraintes.
- Précision et vitesse d'exécution : Gemma 4 31B, Qwen 3 32B et Qwen 3.5 27B ont atteint une précision parfaite sur les faits (10/10). En termes de vitesse, LFM 224B a été le plus rapide parmi les modèles "non pensants" et GPT-OSS 20B le plus rapide parmi les "modèles pensants".
- Classement général final : Qwen 3.5 27B est le vainqueur global. Il est suivi par Gemma 4 31B (2ème) et Qwen 3 32B (3ème). GPT-OSS 20B et Mistral Small 3.2 complètent le top 5.
Ressources
- LM Studio — exécuter et gérer des LLM en local
- Qwen (famille) — famille de modèles linguistiques open-source (inclut Qwen 3.5 27B, Qwen 3.5 35B A3B, Qwen 3 32B)
- DeepSeek (famille) — entreprise proposant des modèles open-source (inclut DeepSeekR 1 DistilQwen 32B)
- Mistral AI (famille Mistral) — entreprise derrière la famille de modèles Mistral (inclut Mistral Small 3.2 24B)
- Gemma (famille) — famille de modèles légers de Google (inclut Gemma 4 31B)
- THUDM (famille GLM) — entité derrière la famille de modèles GLM (inclut GLM 4.7 flash 30B)
- Nvidia — entreprise derrière Nvidia Neumitron 3 Nano 30B
- LFM 224B — modèle testé sans URL officielle connue
- GPT-OSS 20B — modèle testé sans URL officielle connue
- April 1.6 15B — modèle testé sans URL officielle connue