W proteście wyborczym promowanym przez Romana Giertycha na portalu X
Przeczytałem i popieram. Podpisujcie wszyscy! To obszerniejszy protest od mojego. Kto ma drukarkę niech drukuje, podaje adres, PESEL, podpisuje i do poniedziałku włącznie wysyła pocztą. Liczy się dzień wysyłki, więc każdy kto wyśle w poniedziałek zmieści się w terminie. https://t.co/vLb919j4YL
— Roman Giertych (@GiertychRoman) June 13, 2025
stawiany jest zarzut, że był większy odsetek głosów nieważnych w II turze w tych komisjach, w których w I turze wygrał Rafał Trzaskowski. Autorzy protestu uważają to za anomalię statystyczną. Link do protestu z polecenia Giertycha
Jednak wyjaśnienie takiego stanu jest banalnie proste – tam, gdzie wygrał w I turze Rafał Trzaskowski, tam dobry wynik uzyskał Adrian Zandberg. A wielu wyborców Zandberga było przeciwko Trzaskowskiemu i przeciwko Karolowi Nawrockiemu. Na przykład Ostatnie Pokolenie i zwolennicy tej organizacji zarzucają Trzaskowskiemu kłamstwa i oszustwa: Ostatnie Pokolenie oskarża Trzaskowskiego i KO. "Kłamie i oszukuje ludzi"
Nikogo nie powinno dziwić, że te osoby, mocno zaangażowane politycznie i społecznie (tak jak rozumieją swoją misję), pokazały w głosowaniu w II turze wyraz dezaprobaty dla obu kandydatów. Oddały bądź pustą kartkę wyborczą, bądź zaznaczając obu kandydatów (ten sposób jest o tyle właściwszy, że takiej karty nie da się sfałszować).
Pozwoliłem sobie uzupełnić tabelkę z protestu wyborczego a’la Giertych o kolumnę poparcia dla Zandberga w I turze.
Adrian Zandberg uzyskał 4,86% głosów w I turze w skali kraju. Wszystkie 20 komisji OKW z najwyższą liczbą głosów nieważnych w II turze, jakie przytacza protest wyborczy „od Giertycha”, miały wyższe poparcie dla Zandberga od jego wyniku w skali kraju. To, co najciekawsze, to że średnia arytmetyczna poparcia dla Zandberga w tych komisjach wyniosła aż 13,1%.
Znalazła się anomalia, której autorzy protestu szukali.
Najpierw cytat z protestu:
Wykres „Ruski Ogon” zawiera histogram frekwencji, w którym każdemu pełnemu punktowi procentowemu (FREKWENCJA, 1 – 100%) przypisano liczbę obwodowych komisji (LICZBA KOMISJI). Pokazuje więc, jak często występowała dokładnie dana frekwencja. Dzięki takiemu zestawieniu natychmiast widać nietypowy „ogon” przy skrajnych wartościach (zwłaszcza nagromadzenie komisji z frekwencją ≥ 99%), co jest sygnałem możliwych korekt kart lub innych anomalii w procesie wyborczym.
Autorzy, którzy skomponowali ten protest, nie zauważyli oczywistej oczywistości. Obwody z frekwencją 100% i bliską tej wartości wynikają ze specyfiki tworzenia obwodów zamkniętych.
Pierwsze 117 obwodowych komisji z frekwencją równą dokładnie 100% (bez zaokrąglania) to głównie zakłady lecznicze (64), DPS-y (25), oraz zagranica (13), stałe (10), zakłady karne (3), dom studenta (1), statek (1).
Autorzy nie podają, czy uwzględnili obwodowe komisje zagraniczne do puli tych z najwyższą frekwencją. Jeśli tak, to zapewne nie wiedzieli, że wysoka frekwencja w komisjach zagranicznych wynika z innego sposobu jej obliczania – nie liczy się jej w stosunku do uprawnionych mieszkańców ze spisu, a w stosunku do tych, którzy zadeklarowali chęć głosowania.
W 117 komisjach ze 100% frekwencją Rafał Trzaskowski uzyskał 60,6% poparcia.
Z tego wynika, że „ruskie ogony” zagrały na korzyść Rafała Trzaskowskiego. Chyba nie takie intencje mieli wnoszący protest wyborczy z polecenia Romana Giertycha.
Jeśli odliczymy komisje zagraniczne (autorzy protestu nie podają, czy je uwzględnili) to nadal w „ruskim ogonie” wygrywa Rafał Trzaskowski z poparciem wynoszącym 56,3%.
Najpierw dwa cytaty z protestu, ze wstępu do zarzutu i z jego podsumowania:
NARUSZENIE PRAWA BENFORDA - DOWÓD MANIPULACJI DANYCH
Analiza wszystkich komisji wyborczych pokazuje rozkład pierwszych cyfr w danych dotyczących liczby kart wyjętych z urn narusza prawo Benforda. (...) W naturalnych zbiorach danych cyfra "1" powinna być pierwszą cyfrą w około 30,1% przypadków, cyfra "2" w 17,6% przypadków, itd.
Zgodnie z zasadami dowodzenia statystycznego, przy 8 stopniach swobody przekroczenie wartości χ² = 15,51 zdarza się w najwyżej 5 % naturalnych zbiorów danych. Tymczasem analizowana liczba kart wyjętych z urn daje χ² = 948,70, a liczba głosów oddanych na Karola Nawrockiego – χ² = 4 148,53.
Dlaczego prawo Benforda nie może mieć tutaj zastosowania? Gdyż wielkość liczb jest ograniczona przez wielkość komisji, są to narzucone limity. Prawo Benforda nie działa dla danych, które nie mają naturalnego rozkładu w skali logarytmicznej.
Łatwo to wyjaśnić na przykładzie. Mamy dwie obwodowe komisje wyborcze i w każdej z nich uprawnionych do głosowania jest 1000 osób. Frekwencja wyniosła 75%. W jednej komisji głos oddało 740 osób, w drugiej 760 osób. W obu przypadkach pierwsza cyfra w tych liczbach to 7. Ale gdzieś obok jest komisja w której uprawnionych do głosowania będzie 2000 osób. Przy frekwencji 75% głos odda tam 1500 osób. Pierwsza cyfra w tej liczbie to 1.
Podział komisji według wielkości osób uprawnionych do głosowania jest sztucznie narzucony, te sztuczne limity wpływają na rozkład pierwszych cyfr z liczb głosów oddanych. Prawo Benforda tutaj nie ma prawa działać.
Drugi przykład na danych rzeczywistych. Skoro autorzy protestu wyborczego próbują stosować prawo Benforda do liczby wyjętych kart z urn to danymi do sprawdzenia może również być liczba uprawnionych wyborców w obwodowych komisjach. W końcu liczba oddanych głosów w każdej komisji przy danej frekwencji jest zależna od liczby wyborców w każdej komisji.
Wynik jest następujący:
Zgodnie z zasadami dowodzenia statystycznego, przy 8 stopniach swobody przekroczenie wartości χ² = 15,51 zdarza się w najwyżej 5 % naturalnych zbiorów danych. Tymczasem analizowana liczba wyborców daje χ² = 2427,83.
Rozkład cyfr pierwszych z liczb wyborców w komisjach sugeruje, że dane są nienaturalne :)
Czy z tego względu uzasadniony jest zarzut, że wybory zostały sfałszowane już na etapie tworzenia obwodów?
Link do testu chi-kwadrat (χ²) zgodności pierwszych cyfr liczb wyborców z rozkładem Benforda
Autorzy protestu przedstawiali jeszcze – ich zdaniem – niewłaściwe liczby głosów na kandydatów na podstawie analiz opartych na sondażach informujących o przepływach elektoratów. Pomijając wartość takich danych jak sondażowe przepływy elektoratów (Kamala Harris w podobnych sondażach wygrała prezydenturę) autorzy chyba nie zamieścili nigdzie linku do swoich wyliczeń. Także nie ma jak się do tego odnieść, sąd chyba też będzie musiał wróżyć z fusów.
Proponowałbym autorom, żeby następnym razem posługiwali się nie sondażami, a danymi takimi jak elektoraty z I tury. Specjaliści od wyborów na bazie wieloletnich doświadczeń wskazywali na Karola Nawrockiego jako tego, który powinien wygrać. Podział na elektoraty kandydatów, w tym przypadku umownie prawicowych i lewicowych, przewidział wynik wyborów w II turze.
Dodatkowo znaczenie miał jeszcze niuans elektoratu Zandberga, w rzeczywistości spora jego część (mimo umownej przynależności do głosów na Rafała Trzaskowskiego) była przeciwna obu kandydatom.
Reasumując, wyższy odsetek głosów nieważnych w II turze w komisjach w których w I turze wygrał Rafał Trzaskowski jest skorelowany z bardzo dobrym wynikiem Adriana Zandberga. To jest powód oddawania większej liczby głosów nieważnych – głosowanie przeciwko obu kandydatom.
Pół żartem, tzw. „ruskie ogony” mogłyby być co najwyżej zawarte w proteście wyborczym na rzecz Karola Nawrockiego, gdyż to Rafał Trzaskowski uzyskał w tych komisjach zdecydowanie lepszy wynik od średniego. W rzeczywistości „ruskie ogony” wynikają ze specyfiki obwodów zamkniętych (często małych, w których to losowość znacząco wpływa na frekwencję – znajdziemy też takie obwody z bardzo niską frekwencją).
Rozkład Benforda nie może mieć zastosowania do liczb kart wyjętych z urny, podobnie jak do liczb wyborców w komisjach. Występowanie tych liczb zostało sztucznie ograniczone, a brak ograniczeń jest warunkiem działania prawa Benforda.
Powoływanie się na przepływy elektoratów to już zupełna fantasmagoria. To tak jakby Demokraci w USA uważali, że wybory prezydenckie sfałszowano bo Kamala Harris wyraźnie wygrała w sondażach.
Najdziwniejsze jest to, że tak słaby merytorycznie i
zapewne niezweryfikowany protest wyborczy popiera
adwokat.
Moim zdaniem Roman Giertych albo nie wie czego nie wie
albo lekceważy wymiar sprawiedliwości.
Zapoznałem się z analizę pana Kontka i uznałem, że autorowi brak wyobraźni. Zdziwiło mnie, że znalazły się osoby, które pisały skrypty w pythonie i nie potwierdziły się tezy Kontka. Nie miały prawa.
W ramach obszarów – nazwijmy je pocztowych – występują różne preferencje wyborców. Na przykład miasto Płock głosowało na Trzaskowskiego, a już obrzeża miasta Płock na Nawrockiego. Kody pocztowe na obrzeżach Płocka są podobne do kodów pocztowych dla okolic Płocka. Jeśli ustalimy średnią oczekiwaną, ewentualnie medianę, to obszar dominujący będzie miał przeważający wpływ na wynik i natychmiast pojawią się „anomalie” z obszaru który był w mniejszości.
Kolejna rzecz to komisje zamknięte np. zakłady lecznicze i DPSy. One również w takim modelu bardzo często będą sztuczną anomalią.
Pod tym samym kodem (lub sąsiednim) może być osiedle ze starszymi mieszkańcami oraz nowe osiedle z młodszymi wyborcami.
Różna wielkości komisji to także generator anomalii. Połączenie komisji obejmujących wielu wyborców z tymi, które mają mało wyborców będzie generowało anomalie tam gdzie ich nie ma. Rozkład głosów w małych komisjach jest zwyczajnie bardziej losowy (nie działa prawo wielkich liczb). Tych sztucznie wygenerowanych anomalii będzie więcej jeśli stosuje się medianę, a nie wartość oczekiwaną.
Metodologia jaką przyjął Krzysztof Kontek nie uwzględnia rzeczywistego rozkładu głosów i generuje sztuczne anomalie. Zabawny wątek tej analizy, to że pan Kontek uznał, że skoro większość komisji gdzie są prawdziwe anomalie (np. zamienione głosy) znalazły się wśród jego anomalii to znaczy, że to potwierdza słuszność jego analizy. Ale tak to nie działa. Jeśli metoda wykazuje nadmiarowe anomalie to z założenia wykazuje też duże nienadmiarowe odchylenia. W istocie to dziwne, że w analizie Kontka gdzie są setki podejrzanych komisji nie pojawiły wszystkie komisje z faktycznymi błędami przy liczeniu głosów (oczywiście jest to możliwe bo wszystko zależy od skali błędu-anomalii; zwracam jedynie uwagę na fakt, że to, że rzeczywiste błędy przy liczeniu głosów są w zbiorze faktycznych błędów i nadmiarowych anomalii nie jest w tym przypadku potwierdzeniem słuszności analizy).
Na X jest osoba o nazwisku Krzyszytof Kontek. Polecam obejrzeć konto https://x.com/KrzysztofKontek, są tam tylko 2 wpisy z grudnia 2016 r., wpisy skierowane do @Platforma_org, @Nowoczesna, @SchetynadlaPO, @RyszardPetru. Konto najpewniej zostało porzucone, a hasło zapomniane, co przypuszczalnie jest powodem, że z owymi wpisami możemy się zapoznać.
Jarosław Supłacz
Subskrypcja Newsletter