Introdução
O objetivo deste projeto de modelagem era prever o resultado da eleição de 2024 usando dados de saúde pública, demográficos e históricos. A abordagem única depende de preditores que são um proxy para o apoio público ao Partido Democrata dentro de uma população. Nos EUA, enfrentamos uma escolha binária, Democrata ou Republicano, e nossa eleição é decidida pelos votos eleitorais de cada estado. Portanto, a métrica de resposta prevista foi simplesmente a margem de vitória dentro de um estado.
Por causa do Colégio Eleitoral, prever a eleição é essencialmente uma questão de prever um punhado de estados. A maioria dos estados tem um histórico confiável de uma ampla margem de vitória para um partido ou outro, enquanto alguns não. Os dados e o modelo serão precisos na medida em que preveem com precisão esses estados. Devido ao menor tamanho da amostra das eleições nacionais recentes e à importância dos pontos de dados recentes no modelo, ele não será capaz de produzir previsões altamente precisas para estados com margens estreitas de vitória. Portanto, o sucesso deste modelo dependerá de sua capacidade de detectar quais estados indecisos podem ter mais apoio para os democratas (ou republicanos) do que o que está sendo detectado atualmente nas pesquisas.
Antecedentes e Suposições
Nos últimos dois ciclos de eleições presidenciais, vimos pesquisas públicas falharem de maneiras importantes. Em 2016, quase todas as principais pesquisas e veículos de mídia falharam em detectar o grau de apoio público entre democratas e independentes que levou à vitória de Trump em estados-chave e no Rust Belt. Em 2020, os veículos de pesquisa novamente subestimaram o apoio a Trump em estados-chave. Desde então, a confiança na capacidade da mídia de investigar e chegar à verdade diminuiu ainda mais.
Esta análise busca encontrar preditores que reflitam um estado mais preciso da preferência política do público que não esteja sujeito às fraquezas dos vieses da indústria de pesquisas. Devido à natureza hiperpolarizada da pandemia de Covid-19 e às linhas explicitamente claras onde o apoio à vacina contra a Covid-19 caiu, a aceitação pública para a versão "nova" de cada ano de uma vacina contra a Covid-19 é altamente correlacionada com o apoio ao Partido Democrata. Como há uma nova vacina contra a Covid-19 a cada ano, presume-se que a aceitação contínua indique fidelidade ao voto democrata. Outros indicadores, como taxa de migração doméstica e solicitações de cédula de votação pelo correio, são fortemente correlacionados com o apoio democrata nos últimos quatro anos.
Além disso, dados populacionais de fontes de saúde pública têm sido usados como variáveis de controle ou preditivas, incluindo taxa de mortalidade, taxa de natalidade e saúde mental. Algumas dinâmicas demográficas e populacionais estão associadas a estados mais republicanos e outras a estados democratas, e essas relações se mantiveram ao longo do tempo na história recente. Outras medidas, como a taxa de migração líquida, têm fortes associações, mas são mais recentes e foram afetadas pela pandemia da Covid-19, durante a qual muitos estados azuis bloqueados tiveram uma perda líquida, e estados vermelhos abertos tiveram um ganho líquido. A popularidade da vacina anual contra a Covid-19 está diminuindo ano após ano, e os dados foram ajustados para medir a popularidade relativa, com estados com maior aceitação geral do que a média refletindo maior apoio do partido democrata.
No geral, esta análise busca combinar tendências de longo prazo e tendências mais recentes para estimar o nível atual de apoio ao Partido Democrata. Como o modelo deve ser treinado em dados disponibilizados apenas nos meses (Covid-Vax) e semanas (solicitações de cédula de votação ausente) que antecedem a eleição, ele não será capaz de detectar nenhuma mudança de última hora.
Como George Box disse, “Todos os modelos estão errados, mas alguns são úteis”. Minha esperança com esta análise é que ela possa ser útil para detectar sinais que podem não estar presentes em pesquisas eleitorais tradicionais. Além da previsão (que é principalmente para diversão), incluí algumas análises de estados indecisos que acho que podem lançar alguma luz sobre mudanças importantes que têm acontecido nos últimos quatro anos.
De Depósito
Como a explicabilidade e a interpretação são críticas no contexto eleitoral, fiquei com modelos simples. Os modelos de Modelagem Linear Generalizada, Regressão Logística e Floresta Aleatória foram todos treinados em dados de 2020-2022. O resultado, ou resposta, foi a margem de vitória do Partido Democrata. Para o modelo logístico, a resposta prevista foi uma vitória ou derrota binária para aquele estado. Como cada modelo tem seus próprios pontos fortes e fracos, juntamente com suas próprias taxas de erro, a classificação final de uma vitória ou derrota será determinada pelo voto da maioria. Enviei meu código e dados para github, e qualquer pessoa é bem-vinda para criticar, corrigir ou fornecer feedback.
Limitações
Por causa da minha decisão de usar a vacinação contra a Covid-19 entre os estados como um preditor, isso limita o cronograma e os dados que podem ser coletados. Devido a isso, espero que o modelo tenha um viés em direção aos democratas. Dos 50 estados, cinco caíram dentro da faixa de erros. Todos os cinco estados são considerados estados indecisos. Para fins de categorização, apenas os estados que ficarem claramente fora dos erros dos meus modelos serão categorizados como uma vitória para aquele partido. Os que estiverem dentro das faixas de erro serão categorizados como indecisos.
Discussão
Como nos EUA as eleições são uma escolha binária, a análise olha apenas para Democrata vs. Republicano e não consegue detectar mudanças no apoio a um candidato entre eleitores do partido oposto. Isso revela uma suposição central do modelo, de que esta eleição ainda é principalmente sobre fidelidade partidária em vez do candidato individual.
Para a candidata democrata Kamala Harris, acredito que essa suposição seja verdadeira, pois ela não foi eleita por voto popular durante as primárias, e grande parte da campanha tem sido sobre criar uma persona estrategicamente elaborada de uma mulher que até recentemente tinha sido amplamente ignorada, descartada e até mesmo ridicularizada. Podemos ver que, nos últimos meses, os debates, tentativas de assassinato e outros momentos importantes simplesmente não tiveram nenhum efeito importante nas tendências das pesquisas.
Para Donald Trump, não acredito que essa suposição se sustente. A persona bem conhecida de Trump é dominante e onipresente. De sua presidência de 2017 a 2021 e suas batalhas contínuas com processos, tentativas de assassinato e obsessão pela mídia, a vitória de Trump diz muito mais sobre ele do que sobre o Partido Republicano. O Partido Democrata é uma máquina, e o Partido Republicano só solidificou relutantemente o apoio a Trump após anos de lutas internas e divisão entre seus líderes.
Como o modelo usa dados tanto da eleição presidencial de 2020 quanto das eleições para o senado de 2022, ele é treinado para modelar o apoio partidário, daí sua fraqueza inerente. As pesquisas recentes mudaram a favor de Trump, mas tem grandes estados indecisos empatados. Mantendo-me fiel aos meus métodos e à intenção deste exercício, nenhum desses dados está incluído.
Análise de Swing State
O resultado da eleição será determinado por um punhado de estados. Atualmente, as disputas acirradas no Arizona, Nevada, Wisconsin, Michigan, Carolina do Norte, Geórgia e Pensilvânia são suficientes para fazer a eleição pender a favor de qualquer um deles. Desses estados, o modelo categorizou Michigan e Pensilvânia como democratas com oscilação segura. Os estados restantes estavam todos dentro da margem de erro do modelo e, portanto, foram categorizados como indecisos.
Para fornecer algum contexto visual de como essa análise funciona, aqui estão algumas análises de alguns dos preditores para os estados que são geralmente considerados estados indecisos.
Taxas de migração doméstica: 2019-2023*
No geral, há uma relação negativa entre a taxa de migração líquida e a margem de vitória democrata. Nos últimos 4 anos, muitos estados azuis têm perdido pessoas, enquanto os estados vermelhos estados ganharam. Para esses estados indecisos, alguns são “vermelhos” em relação aos governadores e ao governo estadual, e outros são “azuis”. No geral, Pensilvânia e Michigan são os únicos 2 que tiveram taxas de migração negativas nos últimos 4 anos.
Solicitações de cédulas por correio
Alguns estados, como Califórnia, Colorado e Nevada, são estados “All Mail”. Isso significa que cada eleitor registrado recebe uma cédula de papel por padrão. Com exceção de Utah (e possivelmente Nevada), quase todos esses estados são estados azuis e são solidamente azuis. Nevada é o único estado indeciso que é um estado all-mail, como você pode ver, suas solicitações permanecem estáveis. A tendência geral com a maioria dos outros, exceto o Arizona, é uma diminuição nas solicitações de Mail-In-Ballot.
Tomada anual de vacinas contra a Covid-19**
Uma vez que o modelo utiliza a vacinação anual contra a Covid como um forte preditor de apoio do Partido Democrata, mas a popularidade geral está diminuindo, o modelo usa pontuação relativa para comparar cada estado com o outro dentro do ano. Além de Wisconsin, os estados restantes tiveram uma absorção de vacina contra a Covid-19 ligeiramente abaixo da média em 2021**, 2022 e 2024.
*As taxas de migração doméstica são as mesmas do ano anterior.
**Como as vacinas contra a Covid-19 não estavam disponíveis até 2021, os dados de 2021 foram pareados com os dados dos resultados das eleições de 2020. Para 2022 e 2024, os dados refletem a aceitação da nova versão daquele ano.
Para ter uma noção de quão importantes os preditores são para o modelo, o gráfico abaixo classifica cada medida pelo quanto ela afeta uma das previsões do modelo. Como você pode ver, a tomada de vacina da Covid-19 é classificada logo abaixo de “vitória democrata anterior”.
Resultados
O modelo tem Harris ganhando com segurança 260 votos eleitorais dos estados que prevê que serão seguramente democratas. Se Pensilvânia e Michigan estiverem de fato na disputa, então apenas 226 deles são seguramente democratas.
O modelo prevê que Trump conquistará com segurança 219 votos eleitorais nos estados que ele prevê que serão seguramente republicanos.
Os estados indecisos Wisconsin, Geórgia, Carolina do Norte, Nevada e Arizona estão todos em disputa e representam 59 votos eleitorais. Se Pensilvânia e Michigan estiverem na disputa, são 93 votos eleitorais em disputa.
O caminho de Harris para vencer
O caminho de Harris para a vitória parece mais fácil. Com um Voto Eleitoral inicial mais alto "na bolsa", ela pode coletar um punhado de estados indecisos. Pensilvânia e Michigan estão aparecendo como vitórias para ela no modelo, e se ela os ganhar, ela simplesmente precisa de qualquer um dos Arizona, Carolina do Norte, Wisconsin ou Geórgia para bloqueá-lo. Se ela ganhar um ou outro da Pensilvânia ou Michigan, ela então precisa substituir a perda por 1-2 estados indecisos adicionais.
O caminho de Trump para a vitória
É importante olhar para o caminho de Trump com uma mentalidade de “tudo pode acontecer”. Ele superou as expectativas em ambas as eleições anteriores. A maioria dos guardiões de informações, especialistas tradicionais e pesquisadores eleitorais erraram no passado.
Com 219 na bolsa, Trump deve levar todos os estados indecisos do Arizona, Geórgia, Carolina do Norte, Wisconsin e Nevada. Se Trump ganhar na Pensilvânia e/ou Michigan, então seu caminho se torna mais fácil, o que significa que ele ainda precisaria de 2-3 dos estados indecisos restantes.
Dê uma olhada no Dashboard abaixo. Interaja para ver como o caminho de cada candidato para a vitória vencendo os estados indecisos e veja gráficos de dispersão para previsões medidas por estado.
Minhas previsões pessoais com base no modelo
Tenho mais intuição sobre a Carolina do Norte e a Geórgia, já que passei um tempo lá, e estou apostando nelas para Trump. Não tenho essa intuição para Arizona, Nevada ou Wisconsin. Então, leve isso com um grão de sal. Mas sendo fiel ao método, meu modelo aposta na Pensilvânia e Michigan para Harris, e acredito que ela vai apostar em pelo menos 2-3 estados indecisos adicionais. Espero estar errado.
Referências:
Laboratório Eleitoral do MIT https://electionlab.mit.edu/data#data
Fatos dos EUA https://usafacts.org/economy/
Laboratório Eleitoral da UF https://election.lab.ufl.edu/voter-turnout/
Votação e Registro nas Eleições de Novembro de 2022 https://www.census.gov/data/tables/time-series/demo/voting-and-registration/p20-586.html
CDC https://data.cdc.gov/NCHS/Indicators-of-Anxiety-or-Depression-Based-on-Repor/8pt5-q6wp/about_data
CMS https://data.cms.gov/provider-data/dataset/avax-cv19
CDC https://www.cdc.gov/covidvaxview/weekly-dashboard/vaccine-administration-coverage-jurisdiction.html
Cinco trinta e oito https://github.com/fivethirtyeight/election-results/blob/main/election_results_senate.csv
Monitor de vacinas KFF https://www.kff.org/coronavirus-covid-19/dashboard/kff-covid-19-vaccine-monitor-dashboard/
Laboratório Eleitoral da UF https://election.lab.ufl.edu/2024-presidential-nomination-contests-turnout-rates/
Centro Nacional de Estatísticas da Saúde https://www.cdc.gov/nchs/data_access/VitalStatsOnline.htm CDC https://www.cdc.gov/nchs/data/vsrr/vsrr035.pdf Censo.Gov https://www.census.gov/data/tables/time-series/demo/popest/2020s-state-total.htmlCDC https://www.cdc.gov/covidvaxview/interactive/adults.html
Centro Nacional de Estatísticas da Saúde https://www.cdc.gov/nchs/fastats/state-and-territorial-data.htm
Censo- Pobreza https://www.census.gov/data/tables/time-series/demo/income-poverty/historical-poverty-people.html
Censo - Mudança populacional por estado https://www.census.gov/newsroom/press-kits/2023/national-state-population-estimates.html
Projeto Eleitoral dos EUA https://electproject.github.io/
Reeditado do autor Recipiente
Publicado sob um Licença Internacional Creative Commons Attribution 4.0
Para reimpressões, defina o link canônico de volta ao original Instituto Brownstone Artigo e Autor.