diumenge, de desembre 17, 2023

La desviació típica

Aquesta setmana a la premsa s’ha tornat a escriure sobre el salari mitjà. En un article anterior ja vam veure que conèixer la mitjana d’un conjunt de dades sense informar de la mediana la informació queda esbiaixada massa vegades. La mitjana i la mediana són paràmetres estadístics anomenats de centralització perquè informen dels valors centrals d’una mostra de dades. En aquest article d’avui tractarem sobre un altre paràmetre estadístic, la desviació típica o desviació estàndard que es representa per la lletra grega sigma minúscula σ. Tot i que el seu càlcul ja s’utilitzava anys enrere el nom li posà Karl Pearson el 1894. Aquest paràmetre, que sempre ha de ser positiu, és una mesura de la dispersió de la mostra, és a dir, ens dona una idea sobre si les dades estan molt juntes o separades.

Per a calcular la desviació típica d’una sèrie de dades cal primer calcular la seua mitjana aritmètica. Un cop calculada aquesta mitjana cal restar-la de cadascuna de les dades i elevar el resultat d’aquesta resta al quadrat. Un cop haguem fet l’operació amb totes les dades sumem els resultats obtinguts, ho dividim entre el total de dades (algun cop entre el total menys un, segons si tenim les dades de tota una població o només d’una mostra) i finalment fem l’arrel quadrada. Sí, una mica llarg d’explicar i de calcular, però aquesta operació la podeu fer en qualsevol full de càlcul de manera molt directa i fins i tot algunes calculadores ja la porten incorporada..

Vegem-ho amb un exemple molt senzill. Imaginem que al míster del Força Lleida Gerard Encuentra li arriben les puntuacions de 6 partits de dos jugadors diferents. El jugador 1 ha fet unes valoracions de 17-20-20-20-21-22 i el jugador 2 ha obtingut unes valoracions de 10-10-21-24-26-29. Si calculem la mitjana aritmètica de les valoracions de cadascun dels jugadors tant un jugador com l’altre tenen una valoració mitjana de 20. En canvi si calculem la desviació típica de les valoracions de cadascun dels jugadors observem que el primer jugador té una desviació d’1,53 i el segon jugador té una desviació típica de 7,46. Quina informació ens està dient això? En un principi els dos jugadors semblen igual de bons ja que ambdós han obtingut una valoració igual de 20, però el primer jugador és molt més regular que el segon ja que la seua desviació típica és molt més baixa. Les valoracions del jugador 2 són molt més irregulars que les del jugador 1, és a dir, el jugador 2 té valors molts més allunyats de la seua mitjana que el jugador 1.

En aquest exemple hem pogut comparar fàcilment els dos jugadors perquè tenien la mateixa mitjana, però per comparar distribucions diferents Karl Pearson va introduir el coeficient de variació de Pearson (CV) i que es defineix com la divisió entre la desviació típica i la mitjana. Quant més petit sigui el coeficient CV menor dispersió té la distribució de les dades. Aquest paràmetre no es pot usar si la mitjana és un valor massa petit i proper a zero ja que una divisió entre un nombre molt petit pot donar resultats molt erronis a l’hora d’interpretar-los.

El gràfics ens ajuden

Mitjançant les representacions gràfiques de les dades estadístiques és molt senzill veure si una mostra de dades és més o menys dispersa que una altra. En el gràfic podem veue dos mostres amb la mateixa mitjana, però la roja té una desviació molt més petita que la blava, en la qual les dades són molt més disperses.

(Article publicat al Lectura el 22 d'octubre de 2023)