divendres, de juny 07, 2024

Intervals de confiança

Avui, dia de jornada electoral, toca escriure sobre matemàtiques electorals. En altres articles d’aquesta mateixa secció ja hem fet repàs de diferents mètodes d’assignació d’escons a partir dels vots i també hem parlat d’alguns aspectes matemàtics de les enquestes electorals.

Avui ens tornem a centrar en les enquestes i explicarem què són els famosos intervals de confiança. Un cop l’empresa que realitza l’enquesta d’intenció de vot ha fet la consulta a la mostra de persones escollides mitjançant alguna tècnica de mostreig (en un article anterior ja vam explicar com es realitza el càlcul d’aquest nombre de persones necessari) cal fer el càlcul de quin percentatge de vot obté cadascuna de les formacions polítiques. Però clar, aquestes, posem per cas, 1500 persones entrevistades poden arribar a generalitzar tota la població catalana que té dret a vot? Perquè a nosaltres no ens interessa saber l’opinió d’aquests 1500 entrevistats sinó aproximar-nos amb la major precisió possible a les opinions de la població. A aquest treball de generalització dels resultats d’una mostra a tota la població se l’anomena inferència estadística.

Quan es fa una enquesta telefònica es cometen errors, entre d’altres, a causa de l’atzar a l’hora d’escollir la mostra. Aquest error s’anomena error mostral i matemàticament el podem quantificar. Per a poblacions grans (més de 100.000) aquest error depèn de la mida de la mostra, del percentatge obtingut a partir de les enquestes de la mostra i del nivell de confiança. El nivell de confiança, que habitualment és d’un 95%, ens indica la probabilitat que realment la proporció o percentatge buscat de tota la població electoral es trobi dins de l’interval que donarem com a resultat. El càlcul es fa a partir de l’anomenada llei normal o gaussiana que ens diu que la major part de la població serà semblant a la de la mostra. Un cop fet el càlcul de l’error, aquest error s’ha de restar i sumar al valor que hem calculat de la intenció de vot a partir de la mostra i el resultat és un interval de confiança de la intenció de vot d’un determinat partit polític. Com més gran sigui el nivell de confiança que vulguem més ample serà aquest interval.

Vegem-ho amb un exemple. Suposem que el Partit Matemàtic Lleidatà (PML) obté, després de la realització d’una enquesta a partir d’una mostra de la població, una intenció de vot del 45% (45 de cada 100 enquestats han afirmat que votarien el PML). L’error mostral, després del càlcul corresponent a un nivell de confiança del 95%, resulta que és del 2%. Això ens està informant que amb una probabilitat del 95% l’estimació de vot del PML estarà situada en l’interval [45-2, 45+2]=[43, 47]. És a dir, inferim que el votaran entre el 43% i el 47% dels electors. Després això cal traduir-ho en escons i d’aquí surten el que en llenguatge periodístic s’anomenen les forquilles. 

Jerry Neyman

En el món de la probabilitat i l’estadística no és tan conegut com Fisher, Pearson o Gosset però aquest matemàtic rus fou qui proposà la teoria dels intervals de confiança, imprescindible avui dia per a l’anàlisi de dades. Neyman va fer moltes altres aportacions estadístiques que són actualment utilitzades en meteorologia i biologia.

(Article publicat al Lectura el 12 de maig de 2024)