Depuis que j’utilise Claude, je me demande toujours quel modèle choisir et quel “effort” lui donner : medium, high ou xhigh ? Voici ce que j’ai trouvé.

Pendant des mois, j’ai utilisé le modèle le plus puissant disponible par réflexe. Opus par défaut. Effort maximum. Résultat : lent, coûteux et souvent inutile pour ce que je faisais vraiment.

La réalité est plus simple : le bon modèle n’est pas le plus puissant, c’est celui qui correspond à la complexité réelle de votre tâche.

La hiérarchie en juin 2026

Anthropic propose maintenant quatre niveaux de modèles, du plus rapide au plus puissant :

Haiku 4.5 : Le sprinter. Rapide, économique, sans raisonnement étendu.

Sonnet 4.6 : Le cheval de travail. Équilibre qualité / vitesse pour 80 % des tâches.

Opus 4.8 : Le spécialiste. Raisonnement profond, contextes longs, problèmes complexes.

Fable 5 : Le nouveau sommet, lancé le 9 juin 2026. Une classe au-dessus d’Opus, avec des garde-fous intégrés pour certains domaines sensibles.

Le test en cinq questions

Avant de choisir un modèle, posez-vous ces cinq questions. Une réponse “oui” suffit pour monter d’un niveau.

1. Est-ce que je dois analyser plus de 50 000 mots en un seul passage ? Non → Haiku ou Sonnet suffisent. Oui → Opus ou Fable 5.

2. Est-ce que la tâche demande de comparer, synthétiser ou raisonner sur plusieurs documents en même temps ? Non → Sonnet. Oui → Opus.

3. Est-ce que je vais répéter cette opération des dizaines ou centaines de fois par jour ? Oui → Haiku. La vitesse et le coût comptent davantage que la profondeur.

4. Est-ce qu’une erreur dans la réponse a des conséquences réelles (décision d’affaires, analyse juridique, code en production) ? Oui → Opus minimum.

5. Est-ce que je travaille sur un problème que Sonnet ou Opus n’a pas réussi à résoudre correctement après deux essais ? Oui → Fable 5.

Exemples concrets par tâche

Résumer un courriel de 200 mots → Haiku 4.5

Rédiger une réponse à un appel d’offres → Sonnet 4.6

Analyser 10 fichiers de données distincts → Sonnet 4.6 (effort high)

Réviser un contrat de 80 pages → Opus 4.8

Concevoir l’architecture d’un système → Opus 4.8

Déboguer un problème complexe multi-composants → Opus 4.8 ou Fable 5

Écrire 500 descriptions de produits similaires → Haiku 4.5

Produire une analyse de risque avec sources contradictoires → Fable 5

Le cas des 10 fichiers de données

Question fréquente : si j’ai 10 fichiers à analyser, je prends quoi ?

Ça dépend de ce que vous en faites.

Vous extrayez des chiffres ou normalisez des données ? Haiku ou Sonnet, effort medium.

Vous cherchez des patterns, des anomalies ou des corrélations entre les fichiers ? Sonnet, effort high.

Vous devez synthétiser les fichiers en une recommandation stratégique avec raisonnement explicite ? Opus, effort high.

La complexité n’est pas dans le volume. Elle est dans le niveau de raisonnement requis.

Le paramètre effort : ce que ça change vraiment

Le choix du modèle est une décision. Le choix du niveau d’effort en est une autre, distincte.

L’effort contrôle la profondeur du raisonnement interne avant que Claude produise une réponse. Concrètement : plus l’effort est élevé, plus Claude “réfléchit” avant de répondre, ce qui coûte plus de temps et de tokens de traitement.

Dans l’interface claude.ai

Low : Réponse rapide, raisonnement minimal. Pour les questions factuelles, les reformulations, les tâches répétitives simples.

Medium : Le point d’équilibre recommandé pour la majorité des usages. Rédaction, analyses courantes, questions techniques standard.

High : Claude prend systématiquement le temps de raisonner avant de répondre. Pour les problèmes à plusieurs étapes, les analyses qui requièrent de la nuance, les décisions conséquentes.

xhigh / Max : Réservé aux problèmes difficiles où high ne suffit pas. Débogage complexe, architecture de systèmes, raisonnement scientifique ou juridique poussé.

Ultra Code (Opus 4.8, API seulement) : Spécifiquement optimisé pour les tâches de développement logiciel à haute complexité.

Dans l’API

Le paramètre effort offre un contrôle plus fin. La documentation Anthropic recommande explicitement le niveau medium comme défaut pour Sonnet 4.6 : il évite la latence inutile que cause le niveau high par défaut.

Règle pratique : réduire l’effort d’un niveau sur les tâches simples peut réduire la latence et le coût de 30 à 50 % sans différence perceptible dans la qualité de la réponse.

Note sur Fable 5

Fable 5 est la première instance publique d’une nouvelle classe de modèles chez Anthropic, appelée Mythos. Lancé le 9 juin 2026, il dépasse Opus en capacité de raisonnement, de vision et de travail autonome sur des tâches longues.

J’ai eu la chance de le tester quelques jours avant qu’il ne soit retiré. Impression générale : la différence avec Opus est perceptible sur les tâches longues et ambiguës. Là où Opus demande parfois des relances pour maintenir le fil d’un raisonnement complexe, Fable gardait le cap sur plusieurs étapes sans intervention. Sur des tâches courantes (rédaction, analyse standard, questions techniques), la différence était marginale. Ça confirme ce que la grille dit : la puissance ne justifie le coût que si la tâche le demande vraiment.

Il est actuellement indisponible. Le 12 juin, Anthropic l’a retiré pour tous les utilisateurs suite à une directive de contrôle des exportations américaines. Aucune date de retour n’a été annoncée au moment où j’écris ces lignes.

Quand il reviendra, il sera vraisemblablement accessible via un système de crédits à l’usage (facturation par token) plutôt qu’inclus dans les abonnements standard. Anthropic a indiqué vouloir le réintégrer aux abonnements une fois la capacité et les contraintes réglementaires le permettant.

En attendant : Opus 4.8 reste le modèle de référence pour les tâches les plus exigeantes. Fable 5 était lui-même conçu pour basculer automatiquement vers Opus 4.8 en cas de refus, ce qui confirme qu’Opus constitue une base solide pour la grande majorité des cas d’usage réels.

La grille de décision en résumé

Tâche répétitive, volume élevé, peu de nuance requis → Haiku 4.5 / effort low ou medium

Rédaction, analyse standard, questions techniques courantes → Sonnet 4.6 / effort medium

Analyse multi-documents, décisions conséquentes, nuance requise → Sonnet 4.6 effort high OU Opus 4.8 effort medium

Problèmes complexes, architecture, raisonnement profond → Opus 4.8 / effort high ou xhigh

Cas extrêmes, tâches longues autonomes, problèmes que les autres n’ont pas résolus → Fable 5 (indisponible pour l’instant, voir note ci-dessus) → En attendant : Opus 4.8 / effort xhigh ou max

Le réflexe de toujours prendre le modèle le plus puissant est compréhensible. Mais c’est un peu comme utiliser une tronçonneuse pour couper du pain. Le bon outil pour la bonne tâche reste la règle la plus efficace, même en intelligence artificielle.

Et vous ? Est-ce que vous utilisez d’autres critères que ceux-là pour choisir entre Haiku, Sonnet et Opus ? Un signal dans la qualité des réponses, une règle empirique que vous avez développée, une tâche pour laquelle votre intuition s’est avérée fausse ? Je serais curieux de lire vos expériences dans les commentaires.