blog
In questo articolo ti parlo di due concetti fondamentali in statistica, soprattutto nel campo della medicina: sensibilità e specificità.
Questi due indicatori vengono utilizzati per valutare l'affidabilità dei test diagnostici e delle valutazioni statistiche. Scopriamo come.
Fare un test non basta. Soprattutto in ambito medico, dobbiamo sempre capire quanto questo test sia affidabile, cioè con quale percentuale dice la verità.
Come facciamo a risalire a questo dato? Attraverso due parametri.
La sensibilità di un test diagnostico indica la sua capacità di IDENTIFICARE correttamente i VERI POSITIVI tra tutti i casi malati.
In altre parole, la sensibilità misura quanto è affidabile un test nel rilevare una condizione quando questa è effettivamente presente.
Ad esempio, un test diagnostico con alta sensibilità sarà in grado di individuare correttamente la malattia in pazienti affetti da essa.
La specificità di un test diagnostico indica la sua capacità di IDENTIFICARE correttamente i VERI NEGATIVI tra tutti i casi sani.
In sostanza, la specificità misura quanto è affidabile un test nel riconoscere i soggetti sani come tali.
Un test con alta specificità sarà in grado di evitare falsi allarmi, identificando correttamente i soggetti sani.
Lo abbiamo visto: sensibilità e specificità non sono sinonimi. Danno indicazioni differenti riguardo l'affidabilità di un certo test diagnostico.
Nota anche come tasso di veri positivi, si calcola in situazioni dove abbiamo bisogno di non perdere un singolo caso di malattia.
Per esempio, nei test per malattie gravi e trattabili come il cancro o infezioni gravi, una sensibilità elevata assicura che quasi tutti i pazienti affetti vengano identificati e ricevano il trattamento necessario.
Un test altamente sensibile minimizza il numero di falsi negativi, ovvero casi in cui la malattia è presente ma il test fallisce nel rilevarla.
La specificità, d'altra parte, misura la capacità di un test di identificare correttamente gli individui che non hanno la condizione testata.
È particolarmente importante in contesti in cui un falso positivo può portare a conseguenze serie, come trattamenti inutili, invasivi o costosi.
Ad esempio, in screening di massa come quelli per il cancro al seno o alla prostata, una specificità elevata riduce il numero di persone sane sottoposte inutilmente a ulteriori procedure diagnostiche invasive o a trattamenti con effetti collaterali significativi.
La sensibilità si calcola dividendo il numero di VERI POSITIVI (soggetti MALATI e con test POSITIVO) per il TOTALE DEI MALATI (Veri Positivi + Falsi Negativi).
SENSIBILITÁ = Veri Positivi / Totale Malati
La sensibilità è la probabilità di individuare un malato quando la malattia è davvero presente.
Dal punto di vista statistico è la probabilità che il test risulti positivo, dato che un individuo è malato.
La specificità si calcola dividendo il numero di VERI NEGATIVI (soggetti SANI e con test NEGATIVO) per il TOTALE DEI SANI (Veri Negativi + Falsi Positivi).
SPECIFICITÁ = Veri Negativi / Totale Sani
La specificità è la probabilità di individuare un sano quando la malattia è davvero non presente.
Dal punto di vista statistico è la probabilità che il test risulti negativo, dato che un individuo è sano.
E' l'errore che si genera quando il test risulta NEGATIVO ma l'individuo è effettivamente MALATO.
1 - Sensibilità = Falsi Negativi / Totale Malati
Dal punto di vista statistico è la probabilità che il test sia negativo, dato che un individuo è malato.
E' l'errore che si genera quando il test risulta POSITIVO ma l'individuo è invece SANO.
1 - Specificità = Falsi Positivi / Totale Sani
Dal punto di vista statistico è la probabilità che il test sia positivo, dato che un individuo è sano.
L'accuratezza di un test misura la percentuale di osservazioni che sono state correttamente classificate.
ACCURATEZZA = ( Veri Positivi + Veri Negativi ) / Totale
Dal punto di vista statistico è la probabilità che il test sia corretto.
Un altro aspetto importante quando si esegue un test di questo tipo è quello di valutare il valore predittivo del test.
Il valore predittivo positivo si calcola dividendo il numero di VERI POSITIVI (soggetti MALATI e con test POSITIVO) per il TOTALE DEI POSITIVI (Veri Positivi + Falsi Positivi).
VALORE PREDITTIVO POSITIVO = Veri Positivi / Totale Positivi
Dal punto di vista statistico è la probabilità che un individuo sia malato dato che è il test è risultato positivo.
Questo valore è influenzato dalla percentuale dei malati presenti. Se tale percentuale è bassa, il valore predittivo positivo risulterà molto basso anche in presenza di valori di specificità e/o sensibilità vicini a 1.
Il valore predittivo negativo si calcola dividendo il numero di VERI NEGATIVI (soggetti SANI e con test NEGATIVO) per il TOTALE DEI NEGATIVI (Veri Negativi + Falsi Negativi).
VALORE PREDITTIVO NEGATIVO = Veri Negativi / Totale Negativi
Dal punto di vista statistico è la probabilità che un individuo sia sano dato che è il test è risultato negativo.
Non esiste una funzione predefinita in Excel che sia progettata per calcolare sensibilità e specificità. Tuttavia, puoi implementare questi calcoli manualmente, inserendo le formule appropriate.
Segui le mie indicazioni. Ti saranno utili per semplificare e velocizzare il processo, specialmente se hai un grande set di dati.
Prima di tutto, organizza i tuoi dati in Excel come la tabella che ti ho messo sopra. Hai bisogno di quattro categorie principali:
Assicurati che ciascuna di queste categorie sia nella cella corretta.
Seleziona una cella vuota dove desideri che appaia il risultato. La formula che devi riprodurre selezionando le celle opportune è
Sensibilità = VP / ( VP + FN )
Seleziona un'altra cella vuota per il risultato della specificità. La formula che devi riprodurre selezionando le celle opportune è
Specificità = VN / ( VN + FP )
Dopo aver inserito le formule, premi Invio per eseguirle.
Excel calcolerà automaticamente i valori basandosi sui dati forniti.
La sensibilità e la specificità sono utilizzate anche nelle scale di valutazione in vari ambiti, inclusi la medicina, la psicologia e la ricerca educativa.
Questi indicatori aiutano a determinare l'affidabilità e la validità delle scale utilizzate per misurare fenomeni complessi come la gravità di una malattia, il benessere psicologico, o il rendimento accademico.
Nelle scale di valutazione, la sensibilità si riferisce alla capacità dello strumento di rilevare correttamente i soggetti che presentano il tratto o la condizione di interesse.
Una scala altamente sensibile è in grado di identificare correttamente coloro che possiedono la caratteristica o il sintomo specifico che si desidera misurare.
Per esempio, in una scala di valutazione dell'ansia, una alta sensibilità significa che la scala può rilevare efficacemente gli individui che effettivamente sperimentano livelli significativi di ansia, minimizzando il rischio di falsi negativi (persone ansiose non rilevate).
La specificità, d'altra parte, indica la capacità della scala di identificare correttamente coloro che non possiedono il tratto o la condizione.
Una scala con alta specificità esclude accuratamente gli individui che non hanno il tratto, condizione o malattia in questione.
Continuando con l'esempio della scala di ansia, una specificità elevata assicura che la scala non classifichi erroneamente come ansiosi quegli individui che sono tranquilli o non presentano ansia.
La combinazione di alta sensibilità e specificità in una scala di valutazione aiuta a:
Una curva ROC traccia la sensibilità (tasso di veri positivi) sul l'asse Y contro 1-specificità (tasso di falsi positivi) sull'asse X per ogni possibile punto di cutoff di un test diagnostico o un modello predittivo.
Non sai cos’è il punto di cutoff?
Si tratta di un valore soglia scelto per classificare i risultati del test in positivi o negativi. Modificando questo valore, si possono osservare diverse combinazioni di sensibilità e specificità.
L'area sotto la curva ROC (AUC) è un indicatore della capacità del test di discriminare tra le condizioni con e senza la malattia.
Le curve ROC sono particolarmente utili quando i test diagnostici o i modelli predittivi producono risultati in forma continua e non è immediatamente chiaro quale soglia di cutoff dovrebbe essere utilizzata per massimizzare sia la sensibilità che la specificità. Esse aiutano a:
Non esiste un comando specifico, ma bisogna costruire la tabella e fare i calcoli come mostrato in precedenza
Non esiste un comando specifico ma bisogna calcolarle dopo aver trovato la tabella a doppia entrata che si esegue con questo comando:
Analizza >>> Statistiche descrittive >>> Tabelle di contingenza
Iscriviti alla Newsletter