Come fare il backtesting di una strategia di trading

Ogni trader ha una strategia che sembra perfetta nella loro mente. Gli entry hanno senso. La logica sembra corretta. Poi mettono denaro reale su di essa e si chiedono perché i risultati non assomigliano affatto a quello che si aspettavano. Il passaggio mancante, quasi sempre, è il backtesting.

Il backtesting significa applicare una strategia di trading a dati storici dei prezzi per vedere come si sarebbe comportata. È la cosa più vicina che i trader hanno a un laboratorio. Invece di rischiare capitale per scoprire se una strategia funziona, i dati storici forniscono un ambiente controllato per testare idee, misurare le prestazioni e identificare i punti deboli prima che un singolo dollaro sia in gioco.

Ma il backtesting è anche il luogo in cui molti trader ingannano se stessi. Fatto male, produce risultati che sembrano spettacolari sulla carta e crollano nei mercati reali. Comprendere come fare il backtesting correttamente, e soprattutto come interpretare onestamente i risultati, è una delle competenze più preziose che un trader può sviluppare.

Backtesting manuale vs. automatico

Esistono due approcci fondamentali al backtesting, e ognuno ha tradeoff distinti.

Backtesting manuale

Il backtesting manuale implica scorrere i grafici storici barra per barra, identificare i setup che corrispondono alle regole della strategia, registrare gli entry e gli exit, e calcolare i risultati a mano o in un foglio di calcolo. È lento. Un backtesting manuale approfondito di una singola strategia su un mercato potrebbe richiedere giorni o addirittura settimane.

Il vantaggio è la profondità della comprensione. I trader che fanno il backtesting manuale imparano a leggere l'azione dei prezzi in un modo che i tester automatici non fanno mai. Sviluppano un'intuizione su come un setup appare effettivamente in tempo reale, inclusi i segnali disordinati e ambigui che una strategia codificata gestisce con logica pulita ma che un trader live deve interpretare al volo.

Il backtesting manuale funziona meglio per le strategie discretionarie, gli entry basati su pattern e i trader che stanno ancora imparando a identificare i setup in modo coerente.

Backtesting automatico

Il backtesting automatico utilizza un software per applicare una strategia codificata ai dati storici e generare risultati in secondi. Le piattaforme comuni includono Strategy Tester di MetaTrader, il backtester Pine Script di TradingView e script personalizzati in Python (utilizzando librerie come Backtrader o Zipline).

Il vantaggio è la velocità e la scala. Un backtesting automatico può eseguire una strategia di incrocio di medie mobili su 20 anni di dati su 50 strumenti in pochi minuti. Elimina la tendenza umana a selezionare setup favorevoli o inconsapevolmente saltare i trade in perdita. Ogni segnale viene preso, ogni risultato viene registrato.

Il lato negativo è che codificare una strategia costringe a semplificare. Sfumature come "il trend sembra forte" o "il volume sembra off" sono difficili da tradurre in regole. E la velocità del testing automatico rende dannerosamente facile l'over-ottimizzazione, un problema trattato in dettaglio di seguito.

Backtesting manuale vs. automatico

Fattore	Manuale	Automatico
Velocità	Lento (giorni/settimane)	Veloce (minuti/ore)
Dimensione del campione	Tipicamente 50-200 trade	Migliaia di trade
Competenza richiesta	Lettura dei grafici	Codifica / scripting
Migliore per	Strategie discretionarie	Sistemi basati su regole
Rischio di selezione	Più alto (bias umano)	Nessuno (tutti i segnali presi)
Rischio di over-ottimizzazione	Più basso	Più alto
Costruzione dell'intuizione	Forte	Debole

Metriche chiave che contano davvero

Un backtesting genera una montagna di numeri. Non tutti meritano uguale attenzione. Queste sono le metriche che separano i risultati utili dal rumore.

Utile netto / rendimento totale. La linea di fondo. La strategia ha guadagnato denaro? Questo è il punto di partenza, ma è anche la metrica più fuorviante in isolamento. Una strategia che ha reso il 200% ma ha avuto un drawdown del 70% lungo il percorso non è la stessa di una che ha reso l'80% con un drawdown del 15%.

Win rate. La percentuale di trade che erano redditizi. Contrariamente a quello che molti principianti assumono, il win rate da solo non dice quasi nulla sulla qualità della strategia. Una strategia con un win rate del 40% può essere altamente redditizia se i vincitori sono significativamente più grandi dei perdenti. Una strategia con un win rate dell'80% può essere un disastro se il 20% dei perdenti sono catastrofici. Il win rate ha senso solo nel contesto dei rapporti rischio-rendimento.

Profit factor. Profitti lordi divisi per perdite lorde. Un profit factor superiore a 1,0 significa che la strategia ha guadagnato denaro. Superiore a 1,5 è generalmente considerato solido. Superiore a 3,0 su un grande campione dovrebbe scatenare scetticismo, non celebrazione.

Massimo drawdown. Il più grande declino da picco a minimo nella curva di equità. Questa è probabilmente la metrica più importante per la viabilità nel mondo reale perché risponde alla domanda: quanta sofferenza infligge questa strategia prima di recuperare? Una strategia con un drawdown massimo del 50% richiede un guadagno del 100% solo per pareggiare, e la maggior parte dei trader l'abbandonerà molto prima che si verifichi questo recupero.

Sharpe ratio. Rendimento aggiustato per il rischio, calcolato come rendimento medio diviso per la deviazione standard dei rendimenti. Più alto è meglio. Un Sharpe ratio superiore a 1,0 è accettabile, superiore a 2,0 è forte. Penalizza le strategie che raggiungono i rendimenti attraverso una volatilità eccessiva.

Numero di trade (dimensione del campione). Questa è la metrica che la maggior parte dei trader ignora e quella che determina se una qualsiasi delle altre metriche significa qualcosa.

Riferimento rapido delle metriche di backtesting

Metrica	Cosa misura	Intervallo buono	Bandiera rossa
Utile netto	P&L totale	Positivo	Negativo per lungo periodo
Win Rate	% trade redditizi	40-65%	Superiore all'85%
Profit Factor	Profitto lordo / perdita lorda	1,3-2,5	Superiore a 4,0
Max Drawdown	Peggior declino di equità	Sotto il 25%	Superiore al 50%
Sharpe Ratio	Rendimento aggiustato per il rischio	Superiore a 1,0	Sotto 0,5
Numero di Trade	Dimensione del campione	200+	Inferiore a 30

Il problema della dimensione del campione

Se una strategia produce 15 trade e 12 di loro sono vincenti, il win rate è dell'80%. Sembra fantastico. Significa anche quasi nulla.

Con 15 trade, il caso casuale può facilmente produrre un win rate dell'80% da una strategia senza alcun reale vantaggio. Lancia una moneta equa 15 volte e c'è circa il 3% di possibilità di ottenere 12 o più teste. Non è astronomico. Esegui 30 strategie diverse e una di loro probabilmente colpirà quei numeri per pura fortuna.

La significatività statistica richiede volume. Come guida approssimativa:

Meno di 30 trade: I risultati sono essenzialmente insignificanti. Troppo piccoli per distinguere l'abilità dalla casualità.
30-100 trade: Solo indicazione direzionale. La strategia potrebbe avere un vantaggio, ma la fiducia è bassa.
100-200 trade: I risultati iniziano a diventare informativi. I modelli di prestazione iniziano a stabilizzarsi.
200+ trade: Soglia minima per una ragionevole confidenza. Più grande è il campione, più le metriche convergono sulla vera prestazione della strategia.

Questo è il motivo per cui le strategie ad alta frequenza sono più facili da convalidare statisticamente. Un sistema di scalping che genera 20 trade al giorno può accumulare 1.000 punti dati in due mesi. Una strategia di swing trading che prende 2-3 trade al mese ha bisogno di anni di dati per raggiungere lo stesso livello di confidenza.

Curve fitting: la trappola che cattura tutti

Il curve fitting, detto anche overfitting, è la ragione singola più comune per cui i backtesting producono risultati che non si traducono nel trading live. È anche la trappola più difficile da riconoscere quando sei tu a cadervi dentro.

Il curve fitting si verifica quando un trader continua ad aggiungere regole, filtri o aggiustamenti di parametri fino a quando il backtesting non sembra perfetto. La soglia di entrata RSI viene regolata da 30 a 27. Un filtro di volatilità elimina i tre mesi con le peggiori prestazioni. Una restrizione oraria taglia via le sessioni in perdita. Ogni aggiustamento migliora i numeri del backtesting. Ogni aggiustamento rende anche la strategia più specifica ai dati storici su cui è stata testata e meno probabilmente funzionerà su dati che non ha mai visto.

Il problema fondamentale è questo: i dati storici contengono sia segnale (veri, ripetuti pattern di mercato) che rumore (eventi casuali, una tantum). Una strategia robusta cattura il segnale. Una strategia overfitted memorizza il rumore.

Segnali di avvertimento di una strategia overfitted:

La strategia ha più di 5-6 regole o filtri
I parametri sono strangamente specifici (entry alle 14:37, RSI a 27,3, stop a 1,7 ATR)
La curva di equità è sospettosamente liscia con quasi nessun drawdown
Win rate superiore all'80-85%
Le prestazioni si degradano significativamente quando uno qualsiasi dei parametri chiave viene modificato leggermente
La strategia funziona solo su uno strumento o un periodo di tempo

Una regola utile: se una strategia non può sopravvivere a un cambio del 10-20% nei suoi parametri chiave senza crollare, è probabilmente overfitted. Le strategie robuste sono insensibili ai parametri. Un incrocio SMA che funziona con 48/198 periodi dovrebbe anche funzionare ragionevolmente bene con 50/200 e 52/205. Se funziona solo con una combinazione esatta, i risultati sono un artefatto dei dati, non un riflesso di un vero vantaggio.

Testing in-sample vs. out-of-sample

La difesa standard contro il curve fitting è dividere i dati storici in due segmenti.

Dati in-sample vengono utilizzati per sviluppare e ottimizzare la strategia. Questa è la sandbox in cui le regole vengono testate, i parametri vengono regolati e la strategia prende forma.

Dati out-of-sample vengono tenuti da parte, intoccati, finché la strategia non è finalizzata. Una volta che la strategia è bloccata, viene testata su questi dati riservati. Se le prestazioni reggono, c'è motivo per una fiducia cauta. Se crolla, la strategia era probabilmente overfitted al periodo in-sample.

Una divisione comune è 70/30: sviluppare sul 70% dei dati, convalidare sul 30%. Alcuni trader utilizzano l'analisi walk-forward, che ottimizza ripetutamente su una finestra in-sample mobile e testa sul segmento successivo, fornendo più risultati out-of-sample in diverse condizioni di mercato.

La regola critica: i dati out-of-sample possono essere utilizzati una sola volta. Nel momento in cui un trader vede i risultati out-of-sample e torna indietro per modificare la strategia, quei dati non sono più out-of-sample. Sono stati contaminati. Questo è un errore sottile ma devastante, e accade costantemente.

Bias nei dati che gonfiavano i risultati

Anche un backtesting strutturato correttamente può produrre risultati fuorvianti se i dati sottostanti sono difettosi.

Bias di sopravvivenza

La maggior parte dei database di azioni contiene solo società che attualmente esistono. Le centinaia di società che sono fallite, sono state rimosse dal listino o sono state acquisite a prezzi da saldo di liquidazione mancano. Un backtesting su "azioni dell'S&P 500" utilizzando gli attuali costituenti non sta testando l'S&P 500 come era storicamente. Sta testando un elenco curato di vincitori. Questo gonfia sistematicamente i rendimenti e rende le strategie migliori di quanto avrebbero avuto prestazioni in tempo reale.

Look-Ahead Bias

Il look-ahead bias si verifica quando un backtesting utilizza informazioni che non sarebbero state disponibili al momento del trade. Gli esempi includono l'uso di dati economici rivisti (le cifre del PIL vengono riviste regolarmente mesi dopo), l'applicazione di indicatori calcolati sul set di dati completo, o l'entrata in trade in base al prezzo di chiusura della giornata quando quel prezzo non era noto fino alla fine della sessione.

Nel backtesting automatico, il look-ahead bias spesso si insinua attraverso errori di codifica. Uno script che calcola un segnale utilizzando dati dalla barra N ed entra in un trade sulla barra N (invece che sulla barra N+1) ha il look-ahead bias incorporato in ogni segnale.

Spread e negligenza delle commissioni

Un numero sorprendente di backtesting assume costi di transazione zero. Per gli swing trader che prendono 3-4 trade al mese, questo potrebbe non cambiare materialmente i risultati. Per gli scalper che prendono 20 trade al giorno, anche uno spread di 1 pip per trade può trasformare un sistema redditizio in uno in perdita. Includi sempre spread realistici, commissioni e stime di slippage. In caso di dubbio, sovrastima i costi piuttosto che sottostimarli.

Forward testing: il ponte verso il trading live

Una strategia che passa il backtesting e la convalida out-of-sample ha ancora un ultimo ostacolo prima di meritare capitale reale: il forward testing, noto anche come paper trading.

Il forward testing significa tradare la strategia in tempo reale su un account demo o con riempimenti simulati. A differenza del backtesting, il forward testing avviene su dati che la strategia non ha mai visto, in condizioni di mercato che si stanno dispiegando in diretta. Testa non solo la logica della strategia ma anche le realtà di esecuzione: il trader può effettivamente identificare i segnali in tempo reale? I riempimenti sono realistici? La strategia funziona ancora quando non c'è la capacità di scorrere in avanti e sbirciare cosa succede dopo?

Un periodo minimo di forward testing dipende dal timeframe della strategia. Una strategia di day trading dovrebbe essere forward testata per almeno 1-2 mesi. Una strategia di swing trading ha bisogno di 3-6 mesi per accumulare abbastanza trade. L'obiettivo non è replicare esattamente i risultati del backtesting ma confermare che la strategia si comporta entro un intervallo ragionevole delle aspettative backtestabili, tenendo conto della variazione normale nel sizing delle posizioni e nell'esecuzione.

La pipeline di convalida della strategia

Fase	Scopo	Durata	Cosa passa
Backtesting in-sample	Sviluppare e ottimizzare le regole	Storico (70% dei dati)	Aspettativa positiva, metriche ragionevoli
Backtesting out-of-sample	Convalidare rispetto ai dati non visti	Storico (30% dei dati)	Le prestazioni mantengono il 20-30% dell'in-sample
Forward test (Paper)	Confermare nelle condizioni live	1-6 mesi in tempo reale	Risultati coerenti con i backtesting
Live (Piccola dimensione)	Provare la viabilità di esecuzione	1-3 mesi piccolo capitale	Nessuno slippage o problema di riempimento inaspettato
Live (Dimensione intera)	Distribuire la strategia	Continuo	Monitoraggio e revisione continui

Cosa assomigliano a risultati realistici

Una delle cose più utili che il backtesting insegna è la calibrazione. I trader che non hanno mai fatto il backtesting tendono ad avere aspettative selvaggiamente non realistiche. I trader che hanno fatto il backtesting estensivamente sanno cosa assomiglia a un vero vantaggio, ed è di solito modesto.

Una strategia con un win rate del 50-60% e un profit factor tra 1,3 e 2,0 è genuinamente solida. Potrebbe non sembrare eccitante, ma composto su centinaia di trade con una gestione del rischio disciplinata, produce rendimenti significativi. Le strategie con win rate del 90%+ hanno quasi sempre un rischio nascosto: vincono piccole quantità frequentemente e poi restituiscono tutto (e più) in rare ma catastrofiche perdite. Le strategie di vendita di opzioni sono un classico esempio di questo modello.

Un buon backtesting non prova che una strategia funzionerà. Prova che la strategia vale la pena testare ulteriormente. L'obiettivo non è la certezza; è la fiducia informata basata su prove.

Errori comuni nel backtesting

Oltre alle insidie principali trattate sopra, questi errori minano regolarmente la qualità del backtesting:

Testing su un periodo troppo breve. Una strategia testata solo su un mercato rialzista non è mai stata stress-testata. Utilizzare dati che includono almeno un ciclo di mercato completo: condizioni rialziste, ribassiste e laterali.
Ottimizzazione alla perfezione. L'insieme di parametri migliore in un backtesting è quasi mai il miglior insieme di parametri in futuro. Mirare alla robustezza, non all'ottimalità.
Ignorare i cambiamenti di regime. Una strategia di trend-following backtestata durante un mercato in tendenza sembrerà brillante. La domanda è come si comporta durante le condizioni di range. Test su diversi ambienti di mercato.
Presupporre riempimenti istantanei. Nel trading live, gli ordini limit mancano e gli ordini market slittano. Incorporare presupposti di riempimento realistici, specialmente durante i periodi volatili.
Backtesting senza un'ipotesi. Testare casualmente combinazioni di indicatori e parametri finché qualcosa non funziona è data mining, non sviluppo di strategia. Inizia con una tesi logica sul perché una strategia dovrebbe funzionare, poi testa se i dati la supportano.

Punti chiave da ricordare

Il backtesting non è una scorciatoia verso il trading redditizio. È un processo per separare le strategie che meritano ulteriori test dalle strategie che dovrebbero essere scartate. Fatto correttamente, salva i trader dal sprecare mesi e capitale significativo su idee che non reggono all'esame.

Il backtesting manuale costruisce l'intuizione; il backtesting automatico costruisce la fiducia statistica. La maggior parte dei trader seri utilizza entrambi.
La dimensione del campione è tutto. I risultati da meno di 30 trade sono rumore. Mira a 200+ trade per dati significativi.
Il curve fitting è il risultato predefinito dell'ottimizzazione incontrollata. Combatterlo con il testing out-of-sample, l'analisi di sensibilità dei parametri e l'auto-valutazione onesta.
Il forward testing non è opzionale. È il passaggio di convalida finale prima di rischiare capitale reale.
Un vantaggio realistico è modesto. Un win rate del 55% con un profit factor di 1,5 è una strategia degna di essere tradarta. Un win rate del 95% con un profit factor di 5,0 è quasi sicuramente troppo bello per essere vero.

Disclaimer: Questo contenuto è solo a scopo educativo e non costituisce consulenza finanziaria. Il trading comporta un rischio sostanziale di perdita. Le prestazioni passate non garantiscono risultati futuri.

Backtesting manuale vs. automatico

Backtesting manuale

Backtesting automatico

Metriche chiave che contano davvero

Il problema della dimensione del campione

Curve fitting: la trappola che cattura tutti

Testing in-sample vs. out-of-sample

Bias nei dati che gonfiavano i risultati

Bias di sopravvivenza

Look-Ahead Bias

Spread e negligenza delle commissioni

Forward testing: il ponte verso il trading live

Cosa assomigliano a risultati realistici

Errori comuni nel backtesting

Punti chiave da ricordare

Articoli correlati

Rapporti Rischio-Rendimento: Come Impostare Target che Rendono Profittevole la Tua Strategia

Fare trading sulle notizie: come gli eventi economici muovono il forex e cosa farne

Cosa Sono i CFD? Come Funzionano i Contratti per Differenza e Quando Usarli

Come funzionano effettivamente la leva finanziaria e il margine: calcoli, rischi e richieste di margine

Fai trading con intelligenza, non con il clamore