HOLDRS Research, dans l’atelier

On a essayé de casser notre propre méthode

Voici ce qui a tenu, et ce qui n’a pas tenu

Par HOLDRS Research10 minutes de lecture
Lire le monde sur dix ans, pas sur dix minutes.

Information éducative. Pas un conseil en investissement au sens de la directive européenne MIF2. Les données indiquent. La décision vous appartient.


Tout le monde vous montre ses backtests qui réussissent. Les courbes qui montent, les stratégies qui « auraient fait +12 % par an », les méthodes qui n’ont, semble-t-il, jamais tort. Personne ne vous montre l’envers : les tests qui essaient de casser la méthode. C’est dommage, parce que c’est le seul endroit où on apprend quelque chose.

Alors on l’a fait sur la nôtre. Notre grille des 4 climats, celle qui tourne chaque jour sur ce site, on l’a attaquée trois fois, sérieusement, avec l’envie sincère de la voir tomber. Changement de paramètre, chasse à la case faible, test d’une amélioration qui nous plaisait beaucoup.

Résultat : elle a survécu deux fois et demie. Cet article vous montre tout, les chiffres qui tiennent, la case qui boite, et le correctif séduisant qu’on a jeté à la poubelle. À la fin, vous saurez exactement ce que vaut notre grille, et, en bonus, comment évaluer n’importe quelle méthode qu’on essaiera de vous vendre.

Section 1

La méthode qu'on va attaquer, en soixante secondes

Notre grille lit le climat de l’économie dans deux prix : la bourse face au pétrole (l’énergie) et l’or face aux obligations (la monnaie), chacun comparé à sa moyenne de 7 ans. Deux questions, quatre climats : expansion, surchauffe, stagflation, récession. Pas de prévision : une lecture.

Si vous découvrez la grille, le mieux est de commencer par l’article qui la présente, ou par nos leçons gratuites. Pour aujourd’hui, voici l’essentiel : deux ratios de prix, une moyenne de sept ans, quatre cases. Et voici ce que ça donne, appliqué mois par mois depuis 1953 :

19601970198019902000201020201973 · choc pétrolier1980 · 2ᵉ choc2000 · bulle internet2008 · crise financière2020 · Covid↓ aujourd'hui
ExpansionSurchauffeStagflationRécession
La bourse face au pétrole (l'énergie), et l'or face aux obligations (la monnaie), comparés à leur moyenne longue (7 ans). Lecture HOLDRS, données publiques 1953–2026.

Sur cinquante ans de données, chaque case a récompensé des placements différents : les actions et les obligations quand la monnaie tient, l’or et l’énergie quand elle se dégrade. C’est cette frise, et les chiffres qui vont avec, qu’on va attaquer.

C’est simple. Et c’est exactement ce qui devrait vous inquiéter. Une grille simple avec des résultats nets, ça ressemble furieusement à ce que les statisticiens appellent du sur-ajustement : une formule réglée, consciemment ou non, pour briller sur le passé. Le milieu des stratégies quantitatives a une règle d’hygiène pour ça, et elle est brutale : si le fait de passer une moyenne de 20 à 22 périodes transforme un gain en perte, vous n’avez pas une stratégie, vous avez une coïncidence. Alors on a appliqué la règle à notre propre grille. Trois attaques, dans l’ordre.

Section 2

Attaque n°1 : et si le paramètre était truqué ?

Toute la grille repose sur une moyenne de 7 ans. On a tout recalculé avec 5 ans, puis 10 ans : sur trois climats sur quatre, le classement des placements ne change pas. Le paramètre ne fabrique pas les conclusions.

Pourquoi 7 ans ? Honnêtement : parce que c’est à peu près la durée d’un cycle des affaires, et parce que c’est un compromis raisonnable entre une moyenne courte qui clignote au moindre bruit et une moyenne longue qui met dix ans à voir un changement. Raisonnable, mais pas sacré. Si nos résultats ne tenaient qu’à ce chiffre-là, ils ne vaudraient rien.

Le test est simple et n’importe qui peut le refaire : on garde exactement la même grille, et on remplace la moyenne de 7 ans par 5 ans, puis par 10 ans. Premier verdict, à l’œil nu : voici les trois frises des climats, recalculées de zéro avec chaque réglage.

ExpansionSurchauffeStagflationRécessionMoyenne 5 ansMoyenne 7 ansMoyenne 10 ans1960197019801990200020102020
Le même test, en image : les climats recalculés avec une moyenne de 5, 7 et 10 ans (1953-2026, épisodes de moins de 6 mois lissés). Les trois frises racontent la même histoire : la stagflation des années 1970, les grandes expansions 1980-2000, la stagflation des années 2000, et la surchauffe actuelle depuis fin 2023. Si le paramètre fabriquait les résultats, ces trois bandes n’auraient rien en commun.

Et maintenant les chiffres. Pour chaque version de la grille, on mesure ce que les quatre grands placements ont rapporté dans les douze mois qui suivaient chaque climat, de 1971 à aujourd’hui :

Climat (moyenne 5 / 7 / 10 ans)ActionsObligationsOrPétrole
Expansion12,8 / 11,8 / 11,3 %8,3 / 8,9 / 8,6−0,2 / 1,0 / 4,04,0 / 4,0 / 6,3
Surchauffe10,9 / 10,3 / 8,0 %0,9 / 0,6 / 0,023,4 / 22,9 / 25,428,0 / 27,0 / 20,5
Stagflation6,9 / 7,2 / 7,4 %5,7 / 5,5 / 6,218,9 / 17,8 / 14,417,4 / 17,0 / 13,9
Récession1,7 / 5,1 / 10,9 %8,0 / 6,8 / 4,214,9 / 16,6 / 16,5−0,4 / 0,9 / 20,6
Rendement moyen des 12 mois suivants, par climat, recalculé avec trois fenêtres de moyenne mobile (1971-2026, données mensuelles publiques, agrégation HOLDRS Research). Trois cases stables, une fragile : la Récession (⚠), détaillée plus bas. Performances passées, sans garantie sur l’avenir.

Lisez ligne par ligne. Expansion : les actions mènent, à 5, 7 ou 10 ans. Surchauffe : l’or et le pétrole dominent et les obligations ne paient à peu près rien, à 5, 7 ou 10 ans. Stagflation : pareil, les actifs réels en tête, quel que soit le réglage. Trois cases sur quatre racontent la même histoire avec trois paramètres différents. C’est précisément ce qu’on attend d’un phénomène réel, et c’est ce que le sur-ajustement ne sait pas imiter.

Vous avez remarqué qu’il manque une ligne dans ce satisfecit. On y vient : c’est l’attaque numéro deux, et c’est elle qui a fait mouche.

Section 3

Attaque n°2 : la case qui ne tient pas

La case Récession ne passe pas le test : environ quatre épisodes en cinquante ans, et des chiffres qui changent avec le paramètre. Une seule constante dans nos mesures : l’or. On préfère vous le dire nous-mêmes.

Regardez la dernière ligne du tableau. Le pétrole y fait −0,4 % avec une moyenne de 5 ans… et +20,6 % avec une moyenne de 10 ans. Les obligations passent de 8,0 à 4,2 %. Mettez cette ligne à côté d’une case robuste, et le contraste saute aux yeux :

Surchauffe (case robuste)

Or

23,4 / 22,9 / 25,4 %

5a
7a
10a

Pétrole

28,0 / 27,0 / 20,5 %

5a
7a
10a

Obligations

0,9 / 0,6 / 0,0 %

5a
7a
10a

Récession (case fragile)

Or

14,9 / 16,6 / 16,5 %

5a
7a
10a

Pétrole

-0,4 / 0,9 / 20,6 %

5a
7a
10a

Obligations

8,0 / 6,8 / 4,2 %

5a
7a
10a
Le même actif, trois réglages (5, 7, 10 ans). À gauche, la Surchauffe : les barres bougent à peine, le résultat ne dépend pas du paramètre. À droite, la Récession : regardez le pétrole, de −0,4 à +20,6 % selon le réglage. C’est exactement la signature d’un échantillon trop petit pour conclure.

Quand les chiffres d’une case dansent comme ça selon le réglage, la conclusion honnête est sans appel : cette case n’a pas assez d’histoire pour conclure. La raison est mécanique : les récessions au sens de notre grille sont rares, environ quatre épisodes en cinquante ans. Quatre épisodes, ce n’est pas un échantillon, c’est une anecdote en quatre exemplaires.

Une seule chose y est restée constante dans nos mesures, et elle nous a surpris nous-mêmes : l’or, entre 15 et 17 % quel que soit le paramètre. Le réflexe classique « en récession, les obligations protègent » reste l’hypothèse la plus raisonnable, 2008 l’a illustrée violemment. Mais notre propre backtest ne la prouve pas avec la robustesse des trois autres cases, et nous préférons vous le dire plutôt que de lisser le tableau. Vous le savez, maintenant. C’est la demi-défaite de notre titre : la grille a survécu, mais une de ses quatre cases marche avec une canne.

Au passage, ce n’est pas le seul aveu au dossier. La grille a aussi un angle mort daté et documenté : l’automne 2008, où elle a lu « Stagflation » pendant qu’un krach déflationniste se préparait. Le récit complet, épisode par épisode, est dans notre note de méthode. Ce qui nous amène à la troisième attaque, parce que cet angle mort, on a évidemment essayé de le corriger.

Section 4

Attaque n°3 : l'amélioration qu'on a refusée

Pour corriger l’angle mort de 2008, on a testé une règle séduisante : basculer vers les obligations quand le crédit panique. Le backtest l’a tuée : après les paniques de crédit, le réel a rapporté dix fois plus que les obligations. La règle aurait vendu au creux.

L’idée était élégante. Il existe un indicateur centenaire qui mesure la peur des prêteurs : l’écart de taux entre les entreprises les plus solides et les plus fragiles. En temps normal, il dort sous 1,2 point. En 2008, il a explosé à 3,38, son record historique, pendant que notre grille lisait tranquillement « Stagflation ». D’où la règle candidate : quand la grille dit « or et énergie » mais que le crédit panique au-delà de 2,5 points, ne pas écouter la grille, basculer vers les obligations. Sur le cas 2008, ça marche magnifiquement. On tenait notre correctif.

Un siècle de tension du crédit (écart de taux entre entreprises les mieux et les moins bien notées). Chaque sommet au-dessus de la ligne rouge est une panique historique : 1932, 1982, et le record de décembre 2008. C’est l’indicateur que notre « amélioration » voulait utiliser comme interrupteur.

Puis on a fait ce qu’on devrait toujours faire avant d’adopter une amélioration : la tester sur toutes les paniques, pas seulement sur celle qui nous avait donné l’idée. Et le verdict a été sans appel. Dans les douze mois qui ont suivi les grandes paniques de crédit, l’or a rapporté en moyenne +20 % et le pétrole +35 %… contre +2 % pour les obligations vers lesquelles notre règle aurait basculé. Autrement dit : notre correctif élégant aurait systématiquement vendu les actifs réels au creux exact, juste avant leurs meilleurs mois. Il réparait 2008 et cassait tout le reste.

La règle est morte ce jour-là, et c’est le backtest qui l’a tuée, pas notre intuition : notre intuition l’adorait. L’indicateur, lui, a survécu sous un autre statut : il ne décide plus rien, il signale. Au-dessus de 2 points, il dit « risque de chute brutale élevé, quelle que soit la case de la grille », et c’est tout. C’est peut-être la leçon la plus utile de cet article : la plupart des mauvaises méthodes ne naissent pas mauvaises, elles le deviennent à force d’améliorations jamais testées.

Section 5

Pourquoi on vous montre tout ça

Une seule question démasque n’importe quelle source d’analyse : « qu’est-ce qui vous ferait changer d’avis ? ». Une réponse précise et datée ? Vous pouvez écouter. Une réponse floue ? Fermez l’onglet. Cet article est notre réponse à cette question.

Le réflexe du métier est de montrer les backtests qui réussissent et de ranger les autres dans un tiroir. On comprend pourquoi : une case faible, un correctif avorté, un angle mort de 2008, ce n’est pas vendeur. Mais réfléchissez une seconde à l’alternative : une méthode présentée sans aucune limite, des résultats qui tombent toujours juste, et un paramètre dont on ne vous dit jamais s’il a été choisi avant ou après avoir vu les résultats. Lequel des deux mérite votre confiance ?

Les meilleurs du domaine le savent depuis longtemps. Meb Faber, l’un des rares à publier ses modèles en intégralité, documente la stabilité de ses paramètres plutôt que d’optimiser le plus flatteur. Philip Tetlock a montré que les meilleurs prévisionnistes du monde ont un seul vrai point commun : ils révisent vite et avouent leurs erreurs. Et Karl Popper l’avait posé avant tout le monde : une affirmation qu’aucun fait ne pourrait contredire n’est pas une connaissance, c’est une croyance. Une méthode d’investissement qui n’explique pas ce qui la ferait changer d’avis appartient à la deuxième catégorie.

Alors voilà notre réponse, datée et publique. Ce qui nous ferait changer d’avis : que les trois cases robustes cessent de l’être quand on change le paramètre, que les épisodes futurs contredisent durablement les fréquences passées, ou qu’un test que nous n’avons pas encore imaginé casse ce que ceux-ci ont validé. On continuera de les chercher, et quand quelque chose cassera, vous le lirez ici. C’est moins confortable qu’une promesse. C’est aussi la seule chose qu’on puisse honnêtement vous offrir : une grille dont vous connaissez, au même titre que nous, les forces, le paramètre, la case faible et le raté historique.

Questions courantes

C'est quoi, un test de robustesse pour une méthode d'investissement ?

C’est essayer de casser sa propre méthode avant que le marché ne le fasse : changer les paramètres pour vérifier que les conclusions ne dépendent pas d’un réglage chanceux, chercher les cas où elle se trompe, et tester les améliorations avant de les adopter. Une méthode qui ne survit qu’à un seul réglage n’est pas une méthode, c’est une coïncidence.

Pourquoi une moyenne de 7 ans dans la grille des 4 climats ?

Sept ans correspond à peu près à un cycle des affaires complet. Mais le point important est ailleurs : recalculée avec une moyenne de 5 ans ou de 10 ans, la grille donne les mêmes conclusions sur trois climats sur quatre. Le choix du paramètre ne fabrique pas les résultats.

Quelle est la faiblesse de la grille des 4 climats ?

La case Récession : environ quatre épisodes en cinquante ans, trop peu pour des conclusions robustes, et ses chiffres changent selon le paramètre de mesure. Seul l’or y est resté constant dans nos mesures. La grille a aussi un angle mort documenté : l’automne 2008, où elle a lu Stagflation pendant un krach déflationniste.

Pourquoi publier les faiblesses de sa propre méthode ?

Parce qu’une méthode dont on cache les limites n’est pas une méthode, c’est un argument de vente. Le test simple pour évaluer n’importe quelle source d’analyse : demandez-lui ce qui lui ferait changer d’avis. Une réponse précise et datée ? Vous pouvez écouter. Une réponse floue ? Méfiez-vous.

Ces tests garantissent-ils que la méthode marchera demain ?

Non, et personne ne peut le garantir. Les tests montrent que les conclusions ne dépendent ni d’un paramètre chanceux ni d’une période choisie, c’est tout. Ce sont des fréquences historiques, pas des promesses. Les données indiquent. La décision vous appartient.


À propos de l’auteur

HOLDRS Research

HOLDRS Research vous donne rendez-vous macro chaque semaine, une lecture macro datée pour les investisseurs autonomes francophones. Plateforme de recherche macro éducative éditée au Luxembourg, indépendante de toute banque ou courtier.

Style contrarien assumé, indifférence aux modes, conviction sur l’horizon long. Références éditoriales publiques : Ray Dalio, Maurice Allais, Knut Wicksell, Adam Fergusson, Vaclav Smil, Hyman Minsky, Lyn Alden. Données primaires : séries de marché publiques, agrégation HOLDRS Research.

Information éducative uniquement. Pas un conseil en investissement au sens de la directive européenne MIF2. Les performances passées ne préjugent pas des performances futures. Les données indiquent. La décision vous appartient.


Sources principales (toutes publiques et vérifiables)