Opus 4.6 est INSANE — le récap complet en 15 min

En une phrase

Opus 4.6 d'Anthropic représente un bond en avant majeur pour l'IA en tant qu'agent de codage, offrant des performances inédites, une fenêtre de contexte massive (jusqu'à 1 million de tokens) et surtout l'introduction des *agents teams* pour une collaboration avancée.

Points clés

  • Performances accrues : Une amélioration de 190 points Elo par rapport à la version précédente, plaçant Opus 4.6 en tête des benchmarks pour le coding agentic et rivalisant avec GPT 5.3. Il montre des progrès notables en raisonnement multidisciplinaire, analyse financière et cybersécurité.

* Fenêtre de contexte massive : Possibilité d'étendre la fenêtre de contexte en entrée de 200K à 1 million de tokens, et la sortie double (jusqu'à 128K). C'est un atout considérable pour analyser des bases de code complètes ou des projets complexes.

* Pricing et accès au 1M de tokens : L'extension à 1 million de tokens est un coût additionnel (API: 10$/input et 37$/output si dépassement des 200K tokens). Un bonus de 50$ est offert pour tester (jusqu'au 20 février). Les abonnements Pro/Max restent limités à 200K tokens par défaut.

* Mémoire persistante et compaction de contexte : Introduction d'une mémoire persistante pour conserver des notes et du contexte entre les sessions (inspiré de Open Clow Bot). La compaction de contexte est désormais gérée côté serveur/API, rendant l'expérience plus fluide et moins bloquante côté client.

* Modes de réflexion avancés : Ajout de l' "Adaptive Thinking" (permettant de choisir un mode d'effort 'low' ou 'high' pour adapter la puissance de raisonnement aux tâches) et de l' "Interlied Thinking" (raisonnement amélioré entre chaque étape des tâches, activé par défaut).

Agents Teams (La nouveauté majeure !) : Cette fonctionnalité permet à plusieurs agents de collaborer via une session partagée* (à la différence des sous-agents isolés qui n'ont qu'un input/output). Cela ouvre la porte à des orchestrations complexes, comme un agent backend et un agent frontend qui communiquent pour développer une application. C'est coûteux en tokens mais potentiellement révolutionnaire pour la productivité.