Votre backtest affiche +300% sur deux ans. L'equity curve monte de façon régulière, presque sans drawdown. Vous passez en réel, et en trois semaines, vous perdez 15% de votre capital.
Ce scénario, la majorité des traders algorithmiques l'ont vécu. Le responsable a un nom : l'overfitting.
Votre backtest affiche +300% ? Méfiance
Un backtest avec des résultats spectaculaires devrait être un signal d'alerte, pas une raison de célébrer. Plus les chiffres sont beaux, plus il faut se poser la question : est-ce que ma stratégie a identifié un pattern exploitable, ou est-ce qu'elle a simplement mémorisé le passé ?
Le problème, c'est qu'un backtest overfitté ressemble exactement à un excellent backtest. C'est pour ça que l'overfitting est aussi dangereux : il est invisible tant qu'on ne sait pas où chercher.
Et rappelons-le : des performances passées impressionnantes ne présagent en rien des performances futures. C'est vrai pour n'importe quelle stratégie, mais c'est encore plus vrai quand le surapprentissage est en jeu.
Qu'est-ce que l'overfitting en trading ?
L'overfitting, ou surapprentissage, c'est quand un modèle ou une stratégie s'adapte trop précisément aux données historiques. Au lieu d'apprendre des tendances générales qui se répètent sur les marchés, il apprend les particularités d'une période donnée : chaque creux, chaque pic, chaque mouvement spécifique.
Le résultat : la stratégie fonctionne parfaitement sur les données passées, parce qu'elle les connaît par cœur. Mais face à de nouvelles conditions de marché, elle est perdue.
Concrètement, si vous optimisez une stratégie sur un instrument entre janvier 2020 et décembre 2023, et que vous ajoutez suffisamment de paramètres, vous finirez par trouver une combinaison qui donne des résultats extraordinaires sur cette période précise. Mais cette combinaison n'a probablement aucune valeur prédictive pour la suite.
Comment reconnaître une stratégie overfittée
Plusieurs signaux doivent vous alerter.
Une equity curve trop parfaite. Si votre courbe de gains monte de façon quasi linéaire sans périodes de stagnation ou de baisse, c'est suspect. Les marchés traversent des régimes différents (tendance, range, volatilité forte ou faible). Une stratégie robuste aura forcément des périodes plus difficiles.
Un nombre excessif de paramètres. Plus une stratégie a de paramètres optimisables, plus elle a de liberté pour coller aux données historiques. Si votre stratégie utilise 15 indicateurs techniques avec chacun 3 paramètres, vous avez 45 degrés de liberté. C'est presque garanti que vous allez surappendre.
Des résultats qui ne fonctionnent que sur un instrument ou une période. Si votre stratégie fait +300% sur un seul instrument en 2022 mais perd de l'argent partout ailleurs, elle a probablement appris les spécificités de ce contexte, pas un véritable pattern de marché.
Un écart important entre données d'entraînement et données nouvelles. C'est le signal le plus fiable. Et il existe une méthode pour le vérifier sans passer en réel ni risquer son capital : le test out-of-sample, qu'on détaille juste après.
Pourquoi l'overfitting est si fréquent en trading algorithmique
Le trading algorithmique est particulièrement exposé au surapprentissage pour plusieurs raisons.
La première, c'est la facilité d'optimisation. Un logiciel de backtesting peut tester des milliers de combinaisons de paramètres en quelques minutes. C'est un avantage énorme, mais c'est aussi un piège : plus vous testez de combinaisons, plus vous avez de chances de trouver un résultat excellent par pur hasard statistique.
La deuxième, c'est l'ajout d'indicateurs. Quand une stratégie ne donne pas de bons résultats, le réflexe naturel est d'ajouter un filtre, un indicateur supplémentaire, une condition en plus. Chaque ajout est une opportunité supplémentaire de surapprentissage.
La troisième, c'est la quantité limitée de données. En trading, les données historiques sont finies. On ne peut pas en générer de nouvelles. Si vous optimisez trop longtemps sur un jeu de données limité, vous finirez par en extraire des patterns qui n'existent pas. Le trading comporte déjà des risques significatifs de perte en capital, le surapprentissage les amplifie en vous donnant une fausse confiance.
Avec le Machine Learning, le risque est encore plus grand. Les modèles comme LightGBM, XGBoost ou les réseaux de neurones ont une capacité d'apprentissage énorme. Ils peuvent facilement mémoriser le bruit dans les données si on ne met pas en place les garde-fous nécessaires.
La première ligne de défense : le test out-of-sample
Le principe est simple : on ne teste jamais une stratégie sur les mêmes données qui ont servi à la construire.
En pratique, on divise ses données historiques en deux parties. La première, le jeu d'entraînement (in-sample), sert à développer et optimiser la stratégie. La seconde, le jeu de test (out-of-sample), est mise de côté et n'est utilisée que pour la validation finale.
Si vous avez des données de 2018 à 2025, vous pourriez optimiser sur 2018-2023, puis valider sur 2024-2025. Des résultats comparables entre les deux périodes sont un bon signe. Un effondrement sur la période de test signale un surapprentissage.
Cette méthode a un défaut : elle ne fournit qu'un seul point de validation. Votre stratégie fonctionne sur cette période de test, mais est-ce qu'elle aurait tenu sur d'autres périodes ? C'est pour répondre à cette limite qu'existe une méthode plus avancée.
Aller plus loin : le Walk-Forward Analysis
Le Walk-Forward Analysis pousse la logique de l'out-of-sample beaucoup plus loin. Au lieu de faire un seul découpage entraînement/test, on répète l'opération sur plusieurs fenêtres successives. On entraîne sur une période, on teste sur la suivante, on décale la fenêtre, et on recommence.
On obtient ainsi plusieurs périodes de test indépendantes. Si la stratégie performe correctement sur chacune d'entre elles, c'est une bien meilleure indication de robustesse. Si elle s'effondre sur la plupart, le verdict est clair.
On détaillera le fonctionnement complet du Walk-Forward Analysis dans un prochain article. Restez connecté.
Protéger votre capital commence par protéger vos backtests
L'overfitting transforme de mauvaises stratégies en illusions convaincantes. Avec les bonnes pratiques — limiter le nombre de paramètres, valider sur des données out-of-sample, et utiliser le Walk-Forward Analysis — on peut s'en prémunir efficacement.
AlgoBacktest intègre le Walk-Forward Analysis et les outils d'analyse nécessaires pour détecter le surapprentissage avant qu'il ne vous coûte de l'argent réel. L'objectif n'est pas de trouver la stratégie parfaite sur le papier, mais celle qui tient la route face à des données qu'elle n'a jamais vues.