(in Portuguese only)

A capacidade preditiva das sondagens tem sido matéria de constante discussão, quer em Portugal quer um pouco pelo mundo inteiro. O nosso grupo tem estado a desenvolver uma nova metodologia para analisar sondagens e prever resultados eleitoriais. Decidimos pô-lo à prova nestas eleições legislativas.

O nosso modelo de previsão eleitoral tem duas componentes: um agregador de sondagens e um simulador da eleição. Na primeira parte, permite obter informação análoga ao do POPSTAR, desenvolvido pela equipa liderada pelo Pedro Magalhães e que está agora a ser usado pela Rádio Renascença na sua “Sondagem das Sondagens”. No entanto, é na segunda componente que julgamos poder trazer uma novidade ao poder obter probabilidades para o número de lugares que cada partido vai eleger.

O nosso agregador de sondagens usa um de dois métodos de cálculo para obter uma previsão do resultado nacional das eleições: o LOESS ou a média móvel. Na verdade, como esta previsão é obtida apenas com base na informação das sondagens e não inclui qualquer tipo de extrapolação das tendências que possam existir, é mais rigoroso dizer que se trata de uma previsão do resultado da eleição se ela se realizasse hoje. De notar que esta publicação está a ser feita na quinta-feira, dia 3 de outubro, antes de saírem as ultimas sondagens pré-eleitorais.

O nosso modelo usa uma regressão local (em Inglês, locally estimated scatterplot smoothing ou LOESS) ou, em alternativa, uma média móvel, em ambos os casos com uma janela de 10 sondagens. Assim é possível obter um gráfico com as linhas de tendência (Fig. 1) e o último valor de cada linha dá a previsão do resultado. Os valores obtidos pelos dois métodos são bastante próximos entre si e também muito próximos dos que são obtidos pelo filtro de Kalman do modelo POPSTAR que está a ser usado pela Rádio Renascença na sua “Sondagem das Sondagens” (Tabela 1).

Figura 1 – Agregador de sondagens com regressão local (LOESS).

Agregador de sondagens com regressão local; tendência dos vários partidos desde o início de 2019, com o PS entre 35 e 40%, PSD entre 20 e 27% e todos os outros partidos sempre abaixo dos 10%

Tabela 1 – Previsão do resultado da eleição se ela se realizasse hoje (3/10/2019) calculado pelos diferentes métodos.

Partido

Média Móvel

(n = 10)

LOESS

(n = 10)

Filtro de Kalman

(POPSTAR, RR)

PSD 26,6% 26,9% 26,8%
PS 37,9% 37,4% 37,7%
BE 9,9% 9,9% 9,7%
CDS-PP 5,0% 4,8% 4,7%
CDU 6,7% 6,9% 6,9%
PAN 3,8% 3,7% 3,5%
Livre 1,0% 1,1%
Aliança 1,3% 1,2%
Chega 1,0% 1,0%
IL 1,0% 1,2%

Prever percentagens não é o mesmo que prever número de assentos parlamentares. Isto porque Portugal está dividido por círculos eleitorais e a distribuição dos votos por partido varia bastante de região para região. Na segunda componente do algoritmo, os dados descritos acima são alimentados no simulador da eleição por círculo. Este, além da incerteza da previsão do resultado nacional tem também incerteza associada à própria distribuição por círculo. Deste modo são gerados um grande número de resultados possíveis. Numa aplicação do método de Monte Carlo, atribui-se ao resultado de cada partido em cada círculo eleitoral uma distribuição normal com o valor central desviado a partir do resultado das últimas eleições. O desvio face à última eleição é assumido uniforme em todo o país, à falta de sondagens regionais.

Foram usados os resultados da regressão LOESS para a fração nacional dos votos e tomou-se a última eleição legislativa, de 2015, como base para a distribuição dos votos por círculo. Aqui, foi necessário repartir os votos do PSD e CDS, que anteriormente concorreram coligados. No caso dos partidos que se candidatam pela primeira vez a eleições legislativas (Aliança, Chega e IL) não há dados de base e, por isso, assume-se que os votos são uniformemente distribuídos. Isto pode significar que se subestima a probabilidade de um destes partidos conseguir eleger, no caso de os seus votos virem a estar mais concentrados nos círculos eleitorais mais populosos.

Assim, após correr 10000 eleições simuladas, conseguimos obter uma distribuição de probabilidades para o número de lugares de cada partido. Conseguimos também o valor mais provável e um intervalo de número de eleitos com uma dada probabilidade.

Figura 2 – Distribuição de probabilidade do número de eleitos de cada partido.

Tabela 2 – Valores médios e intervalo central com 60% de probabilidade para cada partido (isto é, estimamos 60% de probabilidade do valor estar no intervalo indicado).

Partido Média

Intervalo

com P = 60%

PSD 77

69 – 80

PS 109

106 – 115

BE 21

18 – 23

CDS-PP 6

6 – 7

CDU 14

11 – 16

PAN 3

2 – 5

Livre 0

0 – 1

Aliança 0

0 – 0

Chega 0

0 – 0

IL 0

0 – 0

Figura 3 – Representação do número de mandatos no hemiciclo

Representação do hemiciclo do Parlamento com a previsão de mandatos por partido

Finalmente, este modelo permite calcular a probabilidade de diferentes cenários. Por exemplo, a probabilidade de uma maioria absoluta do PS é calculada em 17%. A probabilidade de o Livre conseguir eleger é 34%.

Na próxima semana, depois das eleições, regressaremos a estes resultados para ver o quão bons foram a prever.