Nasze ostatnie podsumowanie dokładności sondaży w amerykańskich wyborach wzmocniło coś, co mówiliśmy już od jakiegoś czasu: Sondaże są w porządku. W szczególności, sondaże dotyczące prezydenckich wyborów powszechnych były historycznie dość dokładne.
Sondaże przeprowadzone w ciągu ostatnich 21 dni przed ostatnimi pięcioma prezydenckimi wyborami powszechnymi miały średni ważony błąd wynoszący 4,0 punkty.1 (Definiujemy błąd jako absolutną różnicę pomiędzy marżą sondażu pomiędzy dwoma głównymi kandydatami a rzeczywistą marżą udziału w głosach. Na przykład, jeśli sondaż dał kandydatowi Republikanów przewagę 3 punktów procentowych, ale Demokrata wygrał wybory o 2 punkty, sondaż ten był obarczony 5-punktowym błędem). I nawet w 2016 roku, kiedy wiele osób obwiniało sondaże za to, że nie przewidziały zwycięstwa Prezydenta Trumpa, sondaże w ciągu 21 dni od wyborów wypadły przyzwoicie, ze średnim ważonym błędem wynoszącym 4,9 punktu.
Ale w Stanach Zjednoczonych Kolegium Elektorskie wybiera zwycięzcę wyborów prezydenckich, co oznacza, że sondaże stanowe są tym, co naprawdę się liczy. A sondaże stanowe miały w 2016 r. gorszy rok (choć wciąż dość blisko długoterminowej średniej). Ich średni ważony błąd wyniósł 5,3 punktu, w porównaniu z 3,2 w przypadku sondaży krajowych. W dodatku błąd ten systematycznie przeszacowywał Demokratów: Sondaże stanowe miały średni ważony błąd statystyczny (metryka, która mówi nam, w którym kierunku biegł błąd) o 3,5 punktu w kierunku Hillary Clinton.
Jednakże nie jest niczym niezwykłym, że sondaże stanowe są mniej dokładne niż krajowe (chociaż w 2016 roku bardzo się rozbiegły). Od 2000 roku sondaże stanowe mają średni ważony błąd na poziomie 4,3 punktu, podczas gdy sondaże krajowe mają średni ważony błąd na poziomie 2,9 punktu. Niektóre stany mają jednak dokładniejsze sondaże niż inne. Dzięki naszemu zestawowi ocen ankieterów, możemy określić, które sondaże w wyborach prezydenckich są najbardziej i najmniej dokładne, co pomoże nam lepiej zrozumieć sondaże, które otrzymamy w tym roku.
Poniżej znajduje się tabela średniego ważonego błędu i błędu statystycznego sondaży z każdego stanu w ostatnich pięciu wyborach prezydenckich dla stanów, które miały co najmniej 15 sondaży przeprowadzonych w ciągu ostatnich 21 dni kampanii. Eliminuje to stany, w których wielkość próby sondaży jest zbyt mała, aby wyciągnąć znaczące wnioski, i zawęża listę do głównych stanów walki w każdych wyborach (które i tak najczęściej są badane).
Pierwszą rzeczą, która może Ci się rzucić w oczy, są punkty problematyczne w wyborach 2016 roku – wiele sondaży stanowych miało statystyczny błąd w kierunku Demokratów, na przykład. W Michigan sondaże miały średnią ważoną statystycznego odchylenia o 4,4 punktu w stronę Demokratów, a w Pensylwanii sondaże miały średnią ważoną statystycznego odchylenia o 4,6 punktu w stronę Demokratów. Karolinie Północnej i Ohio poświęca się mniej uwagi, ale były one jeszcze bardziej niedokładne.
Ale odkładając na bok rok 2016, najbardziej spójną historią, jaką opowiada tabela, jest to, jak dobre są zazwyczaj sondaże w swing-state. Ich średni ważony błąd zazwyczaj nie jest tak wysoki – nawet w stanach, które potknęły nas w 2016 roku. W 2008 roku, na przykład, sondaże w Karolinie Północnej miały średni ważony błąd wynoszący zaledwie 2,4 punktu. I choć sondaże z Ohio nie trafiły w dziesiątkę w 2016 roku, to w 2012 roku nie miały sobie równych (1,8 punktu). Średni ważony błąd sondaży z Florydy wynosił poniżej 4,0 w czterech z pięciu wyborów. Sondaże z Pensylwanii wykazywały bardzo niskie średnie ważone błędy na poziomie 2,0 (w 2004 r.) i 2,4 (w 2008 r.), zanim w 2016 r. nie zaczęły się psuć. Sondaże w innych prawdopodobnych stanach 2020, takich jak Arizona (2,4 w 2016 roku) i Wisconsin (2,9 w 2012 roku), również charakteryzowały się bardzo niskimi średnimi błędami ważonymi w przeszłości.
Żaden z tych stanów nie wydaje się być systematycznie trudny do badania. Podobnie jak sondaże nie stają się mniej lub bardziej dokładne z biegiem czasu, błąd i błąd statystyczny w sondażach stanowych odbija się w sposób nieprzewidywalny z roku na rok. Chociaż istnieją pewne powody do niepokoju, że niektóre błędy w sondażach stanowych z 2016 roku, w tym brak ważenia według wykształcenia, nie zostały naprawione, dokładność sondaży stanowych w jednych wyborach nie wydaje się mieć żadnego wpływu na ich dokładność w następnych.
Więc, gdy wkraczamy w sam środek wyborów powszechnych w 2020 roku, możemy być bezpieczni wiedząc, że sondaże stanów wahających się są tak wiarygodne, jak tylko sondaże mogą być – choć oczywiście sondaże nie są doskonałe. Nawet błąd o 3 punkty może stanowić różnicę w bliskich wyborach.
Aby uniknąć przyznania zbyt dużego wpływu płodnym ankieterom, ważymy naszą średnią przez liczbę sondaży, które przeprowadził każdy ankieter. Dokładniej, wagi oparte są na pierwiastku kwadratowym z liczby sondaży przeprowadzonych przez daną firmę. Na przykład, ankieter, który przeprowadził 16 sondaży dotyczących danego typu wyborów w danym cyklu, będzie miał czterokrotnie większą wagę niż ankieter, który przeprowadził tylko jeden sondaż. Ankieterzy, którzy zostali wykluczeni przez FiveThirtyEight, ponieważ wiemy lub podejrzewamy, że fałszowali dane, są wyłączeni ze wszystkich obliczeń w tym artykule. Punktem odcięcia dla włączenia sondażu jest to, czy miał on medianę 21 dni przed wyborami.
The best of FiveThirtyEight, delivered to you.
Dodaj komentarz