Le Cose di Rudy



Il paradosso di Simpson



Paradosso descritto dallo statistico inglese E. H. Simpson  nel 1951, nel quale due insiemi di dati che, separatamente, sono a sostegno di una ipotesi, possono essere a favore della conclusione opposta quando sono considerati insieme.


Ad esempio si considerino due test riguardo all'efficacia di due farmaci A e B.

Primo test
il farmaco A risulta efficace per 100 pazienti su 1˙000 (10%)
il farmaco B risulta efficace per 2˙000 pazienti su 10˙000 (20 %)  
 
Secondo test
il farmaco A risulta efficace per 4˙000 pazienti su 10˙000 (40%)
il farmaco B risulta efficace per 600 pazienti su 1˙000 (60 %)

Anche se, come è ovvio, il farmaco B risulta più efficace in ciascuno dei test, se si aggregano i risultati di questi, risulta che

il farmaco A è riuscito a curare 4˙100 pazienti su 11˙000 (37%)
il farmaco B è riuscito a curare solo 2˙600 pazienti su 11˙000 (24%)

Morali della storia
a) un test è "onesto" se è fatto su campioni con lo stesso numero di elementi;
b) è facile imbrogliare la gente con le statistiche;
c) rendiamoci conto di come funzionino i sistemi elettorali...