Si tu traînes dans les communautés autour de Claude Code, tu as forcément croisé le mot « caveman ». L'idée paraît absurde au premier abord : demander à une IA de pointe de répondre comme un homme des cavernes, en phrases hachées, sans articles ni fioritures. Et pourtant, c'est devenu une vraie méthode pour deux raisons très concrètes : économiser des tokens et, souvent, obtenir des réponses plus utiles.
C'est quoi, le mode Caveman ?
Le principe tient en une phrase : on instruit le modèle de communiquer de façon ultra-compressée. On supprime les articles (le, la, les), les formules de politesse (« bien sûr, je serais ravi de… »), les répétitions et le remplissage. On garde uniquement la substance technique.
Concrètement, au lieu de :
« Bien sûr ! Je serais ravi de vous aider avec ce problème. L'erreur que vous rencontrez est probablement causée par une vérification de l'expiration du token… »
On obtient :
« Bug dans middleware auth. Check expiration token utilise<au lieu de<=. Fix : »
Même information. Trois fois moins de mots.
Pourquoi ça réduit la facture
Les modèles de langage facturent au token — grossièrement un morceau de mot. Chaque article, chaque « bien sûr », chaque phrase de transition consomme des tokens en sortie. Sur une session de développement où l'IA répond des dizaines de fois, le remplissage représente une part énorme du coût total.
En forçant un style télégraphique, on coupe couramment 60 à 75 % des tokens de sortie sur les opérations de dev courantes, sans perdre l'information qui compte. Sur un usage intensif, l'économie est loin d'être anecdotique.
Pourquoi ça améliore (souvent) les réponses
L'effet secondaire est le plus intéressant. Quand on force la concision, on force aussi le modèle à aller à l'essentiel. Plus de paragraphes d'introduction qui noient le diagnostic, plus de précautions oratoires : juste le problème, la cause, le correctif.
Pour du debug ou de la revue de code, c'est exactement ce qu'on veut. Le format pousse à un schéma mental clair : [chose] [action] [raison]. [étape suivante].
Comment l'activer dans Claude Code
Le mode Caveman n'est pas un bouton officiel : c'est une instruction qu'on donne au modèle. Plusieurs approches existent selon ton outillage :
- Dans un fichier d'instructions projet (type
CLAUDE.md) : on décrit le style attendu — supprimer articles et politesses, fragments autorisés, termes techniques exacts, blocs de code intacts. - Via une compétence / un plugin : la communauté a packagé le comportement sous forme de « skill » réutilisable, avec des niveaux d'intensité (léger, complet, ultra).
- À la volée : un simple « réponds en mode caveman » en début de conversation suffit pour un essai.
Un point important : on garde toujours le code, les commits et les avertissements de sécurité en langage normal. La compression touche la prose explicative, pas les artefacts où la précision littérale compte.
Les limites
Le style caveman n'est pas adapté à tout. Pour de la documentation destinée à d'autres humains, un message d'erreur à citer exactement, ou une explication pédagogique destinée à un débutant, la concision extrême nuit à la clarté. La bonne pratique est de désactiver Caveman sur ces cas et de le réserver aux échanges techniques rapides.
Faut-il l'adopter ?
Si tu utilises Claude Code de façon intensive et que ta facture de tokens grimpe, l'essai vaut le coup : tu réduis le coût et tu gagnes en lisibilité sur le travail technique. C'est typiquement le genre d'optimisation invisible mais cumulative — quelques pourcents par réponse, multipliés par des centaines de réponses par semaine.
Pour aller plus loin sur l'écosystème Claude Code et l'IA appliquée au dev, jette un œil à la catégorie Projet IA et à la veille IA quotidienne du site.

Commentaires