Vous gaspillez 90% de vos tokens sans le savoir — Veille IA

En une phrase

Ce tutoriel explique comment éviter d'atteindre rapidement les limites de messages sur Claude en optimisant l'utilisation des tokens. Il détaille neuf pièges courants liés à l'hygiène des conversations, la configuration des modèles et des outils, ainsi qu'à des aspects techniques, pour maximiser l'efficacité et réduire les coûts.

Points clés

Gestion du contexte de conversation : Les conversations prolongées augmentent considérablement le coût en tokens car tout l'historique est renvoyé à chaque message. Utilisez `/clear` ou `/compact` (dès 40% de contexte) pour réinitialiser ou compresser le contexte, ou démarrez une nouvelle conversation.
Contrôle de la verbosité des sorties : Les réponses par défaut de Claude sont souvent trop détaillées et consomment des tokens inutilement. Le plugin Caveman permet d'obtenir des réponses concises, limitant le volume des tokens de sortie.
Choix stratégique des modèles LLM : N'utilisez pas systématiquement Opus 4.7, le modèle le plus performant et coûteux. Privilégiez Haiku pour les tâches très simples, Sonnet pour l'exécution et les tâches basiques, et réservez Opus aux réflexions profondes et complexes.
Optimisation des outils et plugins par défaut : Les MCP (plugins/skills) et certains plugins chargés par défaut polluent le contexte dès le début d'une conversation. Désactivez-les par défaut et activez-les manuellement via `/mcp` uniquement quand nécessaire après avoir vérifié le contexte avec `/context`.
Gestion des fichiers et du cache : Convertissez les fichiers non textuels (PDF, images, Word, Excel) en texte brut avant de les soumettre à Claude, car ils coûtent 10 à 20 fois plus de tokens. Évitez de changer de modèle ou d'ajouter des MCP en cours de conversation pour ne pas invalider le cache, qui optimise le coût des tokens.

Ressources

Claude — assistant IA développé par Anthropic
ChatGPT — assistant IA développé par OpenAI
Claude Code — interface CLI ou mode de développement intégré pour Claude
Caveman — plugin/skill pour Claude, optimise la concision des réponses
Claude Haiku — modèle LLM de Claude adapté aux tâches simples et rapides
Claude Sonnet — modèle LLM de Claude équilibré pour l'exécution et les tâches courantes
Claude Opus — modèle LLM de Claude de pointe, idéal pour la réflexion et la structuration complexes