divendres, de juny 07, 2024

Intervals de confiança

Avui, dia de jornada electoral, toca escriure sobre matemàtiques electorals. En altres articles d’aquesta mateixa secció ja hem fet repàs de diferents mètodes d’assignació d’escons a partir dels vots i també hem parlat d’alguns aspectes matemàtics de les enquestes electorals.

Avui ens tornem a centrar en les enquestes i explicarem què són els famosos intervals de confiança. Un cop l’empresa que realitza l’enquesta d’intenció de vot ha fet la consulta a la mostra de persones escollides mitjançant alguna tècnica de mostreig (en un article anterior ja vam explicar com es realitza el càlcul d’aquest nombre de persones necessari) cal fer el càlcul de quin percentatge de vot obté cadascuna de les formacions polítiques. Però clar, aquestes, posem per cas, 1500 persones entrevistades poden arribar a generalitzar tota la població catalana que té dret a vot? Perquè a nosaltres no ens interessa saber l’opinió d’aquests 1500 entrevistats sinó aproximar-nos amb la major precisió possible a les opinions de la població. A aquest treball de generalització dels resultats d’una mostra a tota la població se l’anomena inferència estadística.

Quan es fa una enquesta telefònica es cometen errors, entre d’altres, a causa de l’atzar a l’hora d’escollir la mostra. Aquest error s’anomena error mostral i matemàticament el podem quantificar. Per a poblacions grans (més de 100.000) aquest error depèn de la mida de la mostra, del percentatge obtingut a partir de les enquestes de la mostra i del nivell de confiança. El nivell de confiança, que habitualment és d’un 95%, ens indica la probabilitat que realment la proporció o percentatge buscat de tota la població electoral es trobi dins de l’interval que donarem com a resultat. El càlcul es fa a partir de l’anomenada llei normal o gaussiana que ens diu que la major part de la població serà semblant a la de la mostra. Un cop fet el càlcul de l’error, aquest error s’ha de restar i sumar al valor que hem calculat de la intenció de vot a partir de la mostra i el resultat és un interval de confiança de la intenció de vot d’un determinat partit polític. Com més gran sigui el nivell de confiança que vulguem més ample serà aquest interval.

Vegem-ho amb un exemple. Suposem que el Partit Matemàtic Lleidatà (PML) obté, després de la realització d’una enquesta a partir d’una mostra de la població, una intenció de vot del 45% (45 de cada 100 enquestats han afirmat que votarien el PML). L’error mostral, després del càlcul corresponent a un nivell de confiança del 95%, resulta que és del 2%. Això ens està informant que amb una probabilitat del 95% l’estimació de vot del PML estarà situada en l’interval [45-2, 45+2]=[43, 47]. És a dir, inferim que el votaran entre el 43% i el 47% dels electors. Després això cal traduir-ho en escons i d’aquí surten el que en llenguatge periodístic s’anomenen les forquilles. 

Jerry Neyman

En el món de la probabilitat i l’estadística no és tan conegut com Fisher, Pearson o Gosset però aquest matemàtic rus fou qui proposà la teoria dels intervals de confiança, imprescindible avui dia per a l’anàlisi de dades. Neyman va fer moltes altres aportacions estadístiques que són actualment utilitzades en meteorologia i biologia.

(Article publicat al Lectura el 12 de maig de 2024)

La concentració de la mesura

“De manera contraintuïtiva, quan un procés depèn d'una sèrie de diferents fonts d'aleatorietat, en lloc de complicar-se, és possible que els diferents factors aleatoris es compensin entre si i produeixin resultats més previsibles.” Així explica l'Acadèmia Noruega de Ciències i Lletres el fenomen probabilístic de la concentració de la mesura, un fenomen estudiat pel matemàtic francès Michel Talagrand i pel qual (entre altres àrees d’estudi més) ha estat guardonat amb l’Abel Prize 2024, l’equivalent en matemàtiques del Nobel i del qual ja n’hem parlat en anteriors articles.

Per entendre bé això de la concentració de la mesura pensem en el llançament d’una moneda a l’aire. Si la moneda no està trucada i la llancem un sol cop tenim un 50% de possibilitats que surti cara i un 50% que surti creu. Si la llancem dos cops, la probabilitat que surti almenys una cara és del 75% i que en surtin exactament dos és del 25%. Amb tres llançaments hi ha un 87,5% de probabilitat que surti almenys una cara, i un 50% que surtin almenys dos cares. A mesura que anem augmentant el nombre de tirades la cosa es va complicant. Amb deu tirades, la probabilitat que surtin 4, 5 o 6 cares és del 65,6%. Amb 15 tirades, la probabilitat d’obtenir 6, 7, 8 o 9 cares és del 69,8%; en canvi la probabilitat d’obtenir-ne 1, 2 o 3 és només de l’1,75%. Amb 100 llançaments hi ha una probabilitat del 72,9% d’obtenir entre 45 i 55 cares. Amb 500 tirades la probabilitat d’obtenir entre 235 i 265 cares és del 83,4% però gairebé nul·la si volem obtenir-ne més de 300. Gràcies a la concentració de la mesura podem estimar que si llancem la moneda 1000 vegades hi ha una probabilitat del 99,7% que surtin entre 450 i 550 cares, mentre que la probabilitat que surtin més de 600 cares és de 0,000005%.

Llançar una moneda és un procés aleatori els resultats dels quals es distribueixen segons una corba anomenada campana de Gauss, on tenim probabilitats altes en la part central i molt baixes en els extrems. Tot i que aquestes distribucions han estat estudiades des de fa segles i modelitzen moltíssimes situacions quotidianes -és coneguda com a llei normal-, Talagrand va demostrar un conjunt de desigualtats que intenten explicar de la forma més precisa possible què succeeix en aquestes situacions a mesura que ens allunyem del centre.

Amb aquests estudis els matemàtics volen entendre la relació que hi ha entre els resultats individuals aleatoris i el comportament conjunt quan aquest esdeveniment es repeteix, de tal manera que esdeveniments aleatoris poden conduir a resultats molt predictibles encara que cada resultat sigui impossible de predir.

Michel Talagrand
Talagrand no ha rebut l’Abel només pel seu treball en la concentració de la mesura, sinó també per l’estudi de seqüències aleatòries anomenades processos estocàstics i per l’spin glass, l’estudi de patrons en materials i que ajudà a Giorgio Parisi a rebre el Nobel de Física el 2021.

(Article publicat al Lectura el 14 d'abril de 2024)