dijous, de setembre 13, 2018

Població i mostra

L’agost ha estat mogudet a la Paeria a falta de nou mesos per a les properes eleccions municipals. Aquest ball a l’alcaldia i la relativa proximitat als comicis del proper maig ja han fet aflorar les primeres enquestes electorals sobre la futura composició de la Paeria amb la conseqüència de males interpretacions d’alguns conceptes estadístics.

Cal distingir els conceptes de població i mostra. A l’hora de fer una enquesta electoral la població és formada pel nombre total de persones amb dret a vot (a la ciutat de Lleida 92.161 l’any 2017), però és evident que per falta de temps i, sobretot, per falta de pressupost l’empresa realitzadora de l’enquesta no pot contactar amb tota la població i per això n’ha de triar només una part. Aquesta part que s’escull s’anomena mostra. La forma com es tria aquesta mostra és importantíssima perquè cal que representi tota la població.

El primer que cal saber és quina mida ha de tenir aquesta mostra, és a dir, a quanta gent cal entrevistar. I aquest valor depèn del marge d’error, el nivell de confiança i de la mida de la població, coses que s’han d’incloure en la fitxa tècnica de l’enquesta. Què vol dir que un partit polític té una intenció de vot del 45% amb un nivell de confiança del 95% i un marge d’error del 3%? Sense entrar en detalls matemàtics que afectarien intencions de vot petites (el famós p=q=0,5) amb aquestes dades podem afirmar amb un 95% de seguretat que aquest partit tindria una intenció de vot d’entre el 45-3=42% i el 45+3=48%.

La mida de la població també influeix a l’hora d’escollir la quantitat de persones que cal entrevistar per  a realitzar una enquesta. En poblacions petites, a mesura que augmenta la població cal anar augmentant la mida de la mostra, però en poblacions grans el valor de la mostra s’estabilitza. Per exemple, amb un marge d’error del 3%, si una població té 1.000 habitants caldrien 517 enquestes; amb 2.000 habitants, 696 entrevistes; amb 5.000 en calen 880; amb 10.000 en calen 965; amb 20.000 habitants en calen 1.014 i a partir d’aquí la cosa s’estanca: amb 50.000 habitants en calen 1.045, amb 100.000 n’hi hauria prou amb 1.056 i amb una població d’un milió fan falta 1.066 entrevistes. Evidentment si es vol que el marge d’error sigui més petit cal augmentar molt més el nombre d’entrevistes, cosa que fa augmentar molt més el pressupost de l’enquesta.

Gairebé més important que la mida de la mostra és escollir bé aquesta mostra. L’any 1936 un sondeig d’una prestigiosa revista dels EUA sobre les eleccions entre Landon i Roosevelt va fallar estrepitosament tot i haver pres una mostra de 2.300.000 enquestes. El motiu va ser que la gent a qui es va enquestar fou escollida a partir de la guia telefònica, en un temps en que el telèfon només estava a disposició de les classes socials més elevades. Evidentment la mostra no representava tal com era la població.


(Article publicat al Lectura el 2/9/2018)