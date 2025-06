Dr Krzysztof Kontek, ekonomista zajmujący się naukowo m.in. analizą ocen jurorów w konkursach artystycznych, opublikował artykuł, w którym zaadaptował metodologię detekcji obserwacji odstających (ang. outlier detection) na potrzeby analizy wyników drugiej tury wyborów prezydenckich w Polsce w 2025 roku.

Wykorzystując narzędzia statystyczne stosowane we wspomnianej ocenie sędziowskiej wykazał istnienie licznych „anomalii” w danych wyborczych, które jego zdaniem mogą świadczyć o fałszerstwach na korzyść jednego z kandydatów, mianowicie Karola Nawrockiego.

Publikacja ta została szeroko nagłośniona w mediach i była cytowana m.in. przez Gazetę Wyborczą, TVN24, TVP, w rozmowie z braćmi Siekielskimi, czy też w wypowiedziach znanych polityków takich, jak Marek Kalisz czy Roman Giertych.

Metodologia zastosowana przez dr. Kontka

W swojej analizie podzielił on ponad 32 tysiące obwodowych komisji wyborczych na tzw. „lokalne grupy”, najczęściej obejmujące od 6 do 35 komisji, które zostały przypisane na podstawie kodów pocztowych. W każdej grupie poszukiwał on komisji wykazujących „nietypowe” zachowania, które zdefiniował jako odstępstwa w odniesieniu do pozostałych komisji w danej grupie. Jako potencjalnie podejrzane wskazywał komisje, w których występowały co najmniej dwie z czterech zdefiniowanych przez niego anomalii:

Nadmiernie wysokie poparcie dla Karola Nawrockiego w II turze w porównaniu do mediany (wartości środkowej) poparcia w grupie lokalnej, Nadmierny przyrost poparcia dla Nawrockiego między I a II turą w porównaniu do przyrostu poparcia dla Rafała Trzaskowskiego również miedzy I a II turą, Przewaga Nawrockiego w komisji w II turze w sytuacji, gdy Trzaskowski przeważał w pozostałych komisjach danej grupy, Spadek poparcia dla Trzaskowskiego między I a II turą.

W wyniku takiej procedury Kontek zidentyfikował 1482 komisje, w których przy wysokim progu wykrywania (im większy próg wykrywalności, tym mniej obserwacji traktowanych jest jako anomalia) równym 3 występowały przynajmniej dwie spośród tych anomalii. Dla podkreślenia trafności swojej metody wskazał, że 9 z 12 komisji, które zostały objęte decyzją Sądu Najwyższego z 12 czerwca 2025 r. o ponownym przeliczeniu głosów, zostało przez jego metodologię wykrytych. Była to m.in. słynna już komisja nr 95 w Krakowie, gdzie rzeczywiście błędnie przypisano głosy kandydatom.

W kolejnej części analizy Kontek przeprowadził korektę wyników wyborów polegającą na tym, że w każdej komisji, w której wykryto choć jedną (już nie dwie jak poprzednio) z wymienionych anomalii, zastąpił liczbę oddanych na Nawrockiego głosów medianą (wartością środkową) dla grupy komisji zawierającej anomalną komisję. W efekcie uzyskał, jak twierdzi, zawyżenie poparcia dla Nawrockiego wynoszące 315 256 głosów. Natomiast w przypadku zastosowania niższego progu wykrywania różnica zwiększyła się aż do 457 624 głosów. Wartość ta, przekraczająca margines zwycięstwa w II turze sugeruje, według autora, skalę nieprawidłowości mających wpływ na końcowy wynik wyborów.

Krytyczna ocena metodologii i założeń dr. Kontka

W naszej ocenie analiza Kontka zawiera szereg poważnych błędów metodologicznych, które podważają jej wiarygodność. Są to między innymi:

Porównywanie komisji o skrajnie różnej liczbie oddanych głosów. W analizie traktuje się jednakowo komisje, w których oddano zaledwie kilka głosów (np. 73 komisje miały mniej niż 10 ważnych głosów) oraz takie, w których głosowało ponad 2000 osób (253 komisje). W takiej sytuacji naturalne odchylenia w ujęciu procentowym są znacznie większe w małych komisjach, co zwiększa prawdopodobieństwo wykrycia rzekomych „anomalii”.

Pomijanie specyfiki niektórych komisji takich, jak szpitale, domy opieki, czy zakłady karne. W tych miejscach rotacja głosujących między I i II turą może być bardzo wysoka, a profile społeczno-demograficzne odbiegają od lokalnej średniej, co może prowadzić do wyników nietypowych, ale niekoniecznie nieprawidłowych.

Nieadekwatne wykorzystanie kodów pocztowych do wyznaczania grup lokalnych, w skład których wchodziło wspomniane 6 do 35 komisji. W rzeczywistości bliskie liczbowo kody mogą oznaczać obszary geograficznie znacznie od siebie oddalone, a tym samym niespójne społecznie i demograficznie (np. kod o pierwszych cyfrach 14 obejmujący Ostródę, Morąg, Pasłęk, Iławę, Braniewo nie jest geograficznie blisko Białegostoku, którego kod rozpoczyna się od cyfr 15).

Fundamentalny błąd Kontka: asymetryczność analizy

Najpoważniejszym naszym zarzutem wobec analizy Kontka nie jest jednak sposób doboru grup czy parametrów statystycznych, lecz fundamentalna asymetria metodologiczna. Kontek bada wyłącznie „anomalie” korzystne dla jednego kandydata, mianowicie Karola Nawrockiego. Nie analizuje sytuacji, w których jedna z czterech badanych anomalii mogłaby wystąpić w drugą stronę, czyli na korzyść Rafała Trzaskowskiego (np. uzyskanie przez niego nietypowo wysokiej liczby głosów).

W podejściu naukowym rzetelność wymaga symetrycznego traktowania obu stron. Dopiero porównanie częstotliwości występowania „anomalii” korzystnych zarówno dla jednego jak i drugiego kandydata pozwala odpowiedzieć na pytanie, czy mamy do czynienia z jednostronnym zjawiskiem mogącym sugerować manipulację, czy raczej z naturalnym efektem wynikającym ze zmienności czy złożoności danych.

Dodatkowo warto zauważyć, że wiele przypadków uznanych przez Kontka za anomalię można racjonalnie wytłumaczyć. Przykładowo w komisjach nr 53 i 54 w Grudziądzu Nawrocki uzyskał zaledwie 17% głosów, co według przyjętych kryteriów mogłoby sugerować manipulację. Jednak po weryfikacji okazuje się, że są to zakłady karne, gdzie preferencje wyborców różnią się od wartości przeciętnych w tym mieście. Podobnie 100% głosów oddanych na jednego kandydata może wydawać się podejrzane, ale jest to jedyny możliwy wynik w tych komisjach, w których oddano tylko jeden ważny głos. Z kolei komisje działające w szpitalach i domach opieki zdrowotnej są zazwyczaj małe i charakteryzują się dużą rotacją wyborców, którzy najczęściej są pacjentami. Ich liczba też może się zmieniać w krótkim czasie. Nie powinna zatem dziwić sytuacja, gdy kandydat w II turze uzyskuje mniej głosów poparcia niż w I turze.

Replikacja wyników dr. Kontka a wyniki naszej analizy

Grupa badaczy z SGH oraz California State University – Fullerton (USA) zdecydowała się odtworzyć metodologię zaproponowaną przez Kontka, zachowując jego procedury, ale wzbogacając je o pełną symetrię. Oznacza to, że oprócz uwzględnionych przez niego „anomalii” korzystnych dla Nawrockiego, przeanalizowano również identyczne anomalie przemawiające na korzyść Trzaskowskiego (pominięte w pierwotnym badaniu).

Wyniki tej analizy zostały opublikowane w wersji roboczej artykułu, dostępnej pod adresem: https://archive.org/details/analiza-krytyczna-kontka. Warto dodać, że, mając na względzie transparentność naukową, wszystkie dane, opisy zmiennych, algorytmy oraz kod w języku R zostały udostępnione publicznie w repozytorium: https://osf.io/3ynfs/. Dzięki temu każdy zainteresowany może samodzielnie przeanalizować zastosowaną metodologię, zweryfikować wyniki oraz wykorzystać kod w swoich badaniach.

W wyniku przeprowadzonej analizy odtworzono zbliżoną liczbę poszczególnych typów „anomalii”, która wystapiła w badaniu Kontka. Okazało się jednak, że symetryczne „anomalie” na korzyść Trzaskowskiego występowały w porównywalnej liczbie. Przykładowo, liczba komisji, w których odnotowano co najmniej dwa typy „anomalii” na rzecz Nawrockiego wyniosła 1127, podczas gdy analogiczna liczba dla Trzaskowskiego to 921.

Szacowana liczba głosów, o które – zgodnie z metodologią Kontka – wynik Nawrockiego mógł być „zawyżony”, wyniosła w naszej analizie 365 tysięcy (w porównaniu do 315 tysięcy wskazywanych przez Kontka). Z drugiej strony, analogiczne „zawyżenie” wyniku Trzaskowskiego wyniosło 699 tysięcy głosów, co nie tylko równoważy „zawyżenie” wyniku Nawrockiego, ale znacznie je przewyższa.

Bilans netto wskazuje zatem na przewagę „anomalii” sprzyjających Trzaskowskiemu. Gdyby przyjąć logikę interpretacyjną Kontka, mogłoby to sugerować ewentualną manipulację wynikami wyborów właśnie na korzyść Trzaskowskiego. Tym samym wniosek z pełnej i symetrycznej analizy jest odwrotny do tego, który wyciągnął Kontek na podstawie jednostronnego podejścia.

W przeciwieństwie do dr. Kontka, autorzy replikacji nie twierdzą jednak, że uzyskane wyniki stanowią dowód na nieprawidłowości w liczeniu głosów. Uważamy, że tego typu statystyczne „odchylenia” są naturalne przy analizie danych o tak dużej skali i złożoności, a zaobserwowane anomalie w dużym stopniu się wzajemnie znoszą. Taki wynik sugeruje, że w przeważającej większości nie są to obserwacje nietypowe, lecz możliwe do wyjaśnienia przy użyciu dodatkowych czynników nieuwzględnionych w naszej analizie.

W związku z tym nie ma podstaw statystycznych, by twierdzić, że wyniki wyborów zostały zmanipulowane na korzyść któregokolwiek z kandydatów w sposób, który mógłby wpłynąć na ostateczny rezultat głosowania.

Podsumowanie

Analiza dr. Krzysztofa Kontka, mimo swojej medialnej atrakcyjności, nie spełnia podstawowych standardów rzetelności naukowej. Zawiera dyskwalifikujące błędy metodologiczne, ignoruje kluczowe czynniki wpływające na dane oraz, co najważniejsze, została przeprowadzona w sposób jednostronny i tendencyjny.

Zastosowanie jego własnej metodologii w sposób symetryczny prowadzi do wniosku odwrotnego: anomalie wyborcze są rozłożone mniej więcej równomiernie pomiędzy oboma kandydatami i wynikają z naturalnych różnic pomiędzy komisjami, a nie z działań fałszujących wyniki.

Parafrazując wybitnego pisarza i mysliciela G.K. Chestertona: błędem jest przypuszczenie, że analiza Kontka jest tylko nieprawdziwa – jest także niegodziwa (Nieznaczność statystyczna, London Illustrated News 4 listopada, 1905).

Autorzy:

Paweł Kalczyński jest profesorem systemów informacyjnych i nauk o podejmowaniu decyzji w College of Business and Economics na California State University w Fullerton w USA. Autor ponad 50 recenzowanych artykułów opublikowanych w renomowanych czasopismach takich, jak IISE Transactions, European Journal of Operational Research, Omega, Computers and Operations Research oraz Journal of the Operational Research Society. Jego wkład naukowy obejmuje różne dziedziny, w tym analizę lokalizacji, optymalizację oraz analitykę biznesową. Obecnie jego badania koncentrują się na modelach lokalizacji obiektów, optymalizacji niekonwekcyjnej oraz analityce predykcyjnej.

Mariusz Kozakiewicz jest doktorem nauk matematycznych. Od oku 2008 jest adiunktem w Zakładzie Algorytmów i Zastosowań w Katedrze Ekonomii Matematycznej w Kolegium Nauk Ekonomicznych Szkoły Głównej Handlowej w Warszawie. Jest autorem kilkunastu prac naukowych z zakresu prognozowania szeregów czasowych i badań operacyjnych. Jest konsultantem naukowym i projektantem rozwiązań informatycznych w zakresie prognozowania i optymalizacji wielkoskalowej.

Bogusz Lewandowski jest absolwentem Uniwersytetu im. Adama Mickiewicza w Poznaniu, gdzie uzyskał tytuł magistra w dwóch dziedzinach: matematyki oraz informatyki. Ukończył również studia podyplomowe w European University Institute we Florencji, uzyskując tytuł Master of Research in Economics. Jest dyplomowanym pianistą – tytuł magistra sztuki w zakresie gry na fortepianie otrzymał w Akademii Muzycznej im. Feliksa Nowowiejskiego w Bydgoszczy. Obecnie pracuje jako zawodowy pianista operowy.

Michał Lewandowski uzyskał tytuł Doctor of Philosophy w dziedzinie ekonomii w Europejskim Instytucie Uniwerysteckim we Florencji. Obecnie pracuje jako adiunkt w Katedrze Ekonomii Ilościowej w Szkole Głównej Handlowej w Warszawie i kieruje zespołem naukowców w ramach grantu OPUS Narodowego Centrum Nauki badając problem pomiaru niepewności oraz modelując optymalne decyzje w warunkach niepewności według różnych jej źródeł. Publikuje w renomowanych czasopismach naukowych, takich jak Management Science, Journal of Risk and Uncertainty, Theory and Decision, Journal of Mathematical Psychology, Journal of Informetrics.