Goryle we mgle statystyki

Na początek kilka słów na marginesie lektury raportu „Polaryzacja polityczna w Polsce: jak bardzo jesteśmy podzieleni?” przygotowanego przez Paulinę Górską z Centrum Badań nad Uprzedzeniami (CBU) przy Wydziale Psychologii UW. Rzecz narobiła sporego szumu tu i ówdzie, zwłaszcza jedno z ustaleń przedstawionych w raporcie, zgodnie z którym zwolennicy i zwolenniczki obecnej opozycji mają darzyć zwolenników Prawa i Sprawiedliwości większą niechęcią niż zwolennicy PiS zwolenników opozycji. (Choć nie odnosimy się do tej kwestii w tym wpisie, znaczące jest, że wszelkie pytania w omawianym kwestionariuszu i raporcie zadawane były w odniesieniu do „kandydatów”, „zwolenników” i „oponentów”, z pominięciem „kandydatek”, „zwolenniczek” i „oponenetek”.)

Stwierdzenie to opiera się zasadniczo na jednym z pytań zadawanych uczestnikom badania przeprowadzonego przez Górską; pytanie to, dotyczyło dehumanizacji przeciwników politycznych i wykorzystywało ono znany skądinąd obrazek pt. The Ascent of Man:

Pod obrazkiem znajdowała się skala liczbowa od 1 (lewy kraniec) do 9 (prawy kraniec), zaś pytanie zadawane badanym brzmiało tak (zob. Polaryzacja …, str. 8):

Czasem ludzie wydają się innym bardziej bądź mniej ludzcy. W oczach innych ludzi niektórzy wydają się być bardzo rozwinięci, inni zaś zdają się znajdować na wcześniejszych stadiach ewolucji. Posługując się obrazkiem zamieszczonym [powyżej], proszę określić, na jakim stadium ewolucji umieścił(a)by Pan/i zwolenników partii opozycyjnych / zwolenników partii rządzącej?

Po zebraniu danych, odpowiedzi badanych na to pytanie przekształcono w taki sposób, aby większe wartości wskazywały na większą dehumanizację. Po tym przekształceniu, średnia miara dehumanizacji wśród zwolenników i zwolenniczek obecnej opozycji wyniosła 3,72, zaś wśród zwolenników i zwolenniczek PiS 2,69 (Polaryzja …, str. 9). Jak zatem widzimy, osoby popierające opozycję umieszczają zwolenników PiS bliżej krańca dehumanizacji niż na odwrót. Różnica ta wynosi nieco ponad punkt (na skali dziewięciopunktowej) i, jak podaje autorka raportu w przypisie na str. 9, jest ona statystycznie istotna.

Przyjrzyjmy się temu rezultatowi bliżej. Zauważmy najpierw, że w badaniu przeprowadzonym przez Górską udział wzięło 1000 osób, 517 kobiet i 483 mężczyzn, w wieku od 18 do 75 lat; próba miała charakter ogólnopolski i została wylosowana z rejestru PESEL (w raporcie brakuje jednak informacji o tym, jaka była stopa realizacji w tym badaniu). Respondentów pytano najpierw, na kogo zagłosowaliby, gdyby „w najbliższą niedzielę” miały odbyć się wybory parlamentarne. Na podstawie uzyskanych odpowiedzi, badanych podzielono na zwolenników PiS (261 osób) oraz zwolenników opozycji (373 osoby, które wskazały Platformę Obywatelską, Nowoczesną, Polskie Stronnictwo Ludowe, Sojusz Lewicy Demokratycznej lub Razem). Opisywane w raporcie analizy dotyczą tych dwóch grup badanych, łącznie 634 osoby.

Biorąc uwagę osoby popierające PiS i te popierające opozycję łącznie, średnia wartość miary dehumanizacji w próbie wyniosła 3,30 przy odchyleniu standardowym 2,77 (Polaryzcja …, str. 8). Odchylenie standardowe jest po prostu pierwiastkiem kwadratowym z wariancji, stanowiącej bodaj najważniejszą miarę rozproszenia zmiennej; wariancja miary dehumanizacji wynosi więc 2,772 = 7,7. Jest to informacja o tym, jak bardzo odpowiedzi wszystkich badanych uwzględnionych w analizie są rozproszone wokół wartości średniej w próbie.

Jak pamiętamy, średnia wartość miary dehumanizacji wśród zwolenników i zwolenniczek PiS wyniosła 2,69, zaś wśród zwolenników i zwolenniczek opozycji — 3,72. Możemy więc powiedzieć, że nie tylko indywidualne odpowiedzi są rozproszone wokół średniej, lecz również że średnie grupowe odbiegają od średniej dla całej próby. Tym samym możemy zapytać, jaką część łącznej wariancji stanowi wariancja międzygrupowa lub, mówiąc nieco inaczej, jaki udział w wariancji łącznej zmiennej mierzącej dehumanizację ma podział na zwolenników PiS i zwolenników opozycji. Składową międzygrupową wariancji oblicza się następująco:

$$
(2,69 – 3,30)^2\cdot\frac{261}{634} + (3,72 – 3,30)^2\cdot\frac{373}{634} = 0,26
$$

Dzieląc uzyskaną wielkość przez wariancję całkowitą miary dehumanizacji otrzymujemy:

$$
\frac{0,26}{7,7} = 0,033
$$

Innymi słowy, podział na zwolenników i zwolenniczki PiS i zwolenniczki i zwolenników opozycji „tłumaczy” zaledwie 3% całkowitej wariancji miary dehumanizacji. 3%! A zatem 97% łącznego zróżnicowania tej miary wynika z różnic między badanymi w obrębie każdej z tych grup! Owszem, wynik ten jest statystycznie istotny, ale jego praktyczna istotność jest znikoma, albowiem zależność między poglądami politycznymi (mówiąc w dużym skrócie) a stopniem dehumanizacji przeciwnika politycznego jest po prostu bardzo słaba.

W tym miejscu potrzebne jest drobne zastrzeżenie. Adnotacja pod wykresem podsumowującym wynik pytania o dehumanizację (Polaryzcja …, str. 9), wskazuje, iż w analizie uwzględniono 603 osoby, nie zaś wszystkie 634 zaliczone do grupy osób popierających opozycję bądź osób popierających PiS, jak zakładaliśmy w tych obliczeniach. Na te „brakujące” 31 osób składają się najprawdopodobniej respondenci i respondentki, którzy odmówili odpowiedzi na to pytanie lub odpowiedzieli „nie wiem, trudno powiedzieć”. W raporcie brakuje jednak informacji, jak te „braki danych” rozkładają się między obie grupy. W praktyce nie ma to jednak większego znaczenia, możemy bowiem sprawdzić różne warianty: wariant, w którym wszystkie 31 osób, które odmówiło odpowiedzi lub odpowiedziało „nie wiem” to zwolennicy i zwolenniczki opozycji; wariant, w którym 30 z nich to zwolennicy i zwolenniczki opozycji, 1 zaś jest zwolennikiem lub zwolenniczką PiS; wariant, w którym 29 z nich to zwolennicy lub zwolenniczki opozycji, zaś 2 pozostałe osoby, to zwolennicy lub zwolenniczki PiS, itp., itd. Następnie możemy powtórzyć powyższe obliczenia dla każdego z powyższych wariantów i sprawdzić, jak rozmieszczenie braków danych między grupy wpływa na wyniki. Otóż w ogóle nie wpływa: bez względu na to, jak wspomniane braki danych rozkładają się między obie grupy, udział składowej międzygrupowej w całkowitej wariancji miary dehumanizacji jest taki sam i wynosi ok. 3%. Mówiąc inaczej, występowanie braków danych, a zwłaszcza ich rozmieszczenie między obie grupy, nie wpływają w tym akurat przypadku na ogólny obraz zależności między dehumanizacją a preferencjami politycznymi badanych. Powtórzmy, różnice pod względem dehumanizacji przeciwnika politycznego w znacznie większym stopniu wynikają z różnic indywidualnych między badanymi niż z różnic przekonań politycznych.

Dehumanizacja kogo i w porównaniu z kim?

Miara dehumanizacji wykorzystana przez Górską nie jest jej autorskim pomysłem. Po raz pierwszy została przedstawiona w pracy Noura Kteily’ego i jego współpracowników jako miara dehumanizacji, hm, „bezwstydnej” (blatant), tzn. takiej, która nawet nie próbuje nawet udawać, że jest czymś innym. W przeprowadzonym przez siebie badaniu (zob. Study 1), Kteily i jego współpracownicy i współpracowniczki zadawali pytanie o dehumanizację przedstawicieli i przedstawicielek różnych narodowości czy grup etnicznych lub religijnych (m.in. osób ze Szwajcarii, Austrii, Islandii, Japonii, Chin, Meksyku, o pochodzeniu arabskim czy wyznającym islam), ale też o dehumanizację osób stanowiących grupę własną (innych Amerykanów i Amerykanki). Uczestnicy badania byli Amerykan(k)ami. Ponieważ dobrano ich spośród osób korzystających z platformy Amazon Mechanical Turk, nie stanowią losowej próbki amerykańskiej populacji. Tym niemniej, najbardziej „odczłowieczaną” przez uczestników i uczestniczki badania grupą okazali się wyznawcy islamu. Na skali od 0 (najmniej „rozwinięci”) do 100 (najbardziej „rozwinięci”) osoby wyznające islam uzyskały średnio 77,6 punktów — o 14 mniej niż osoby amerykańskie. Stopień dehumanizacji Amerykanów/Amerykanek przez amerykańskich respondentów i respondentki stanowi punkt odniesienia dla oceny, w jakim stopniu dehumanizowane są inne grupy. W porównaniu z Amerykan(k)ami, Muzułmanie i Muzułmanki są uznawani za najmniej „rozwiniętych” (w sensie ewolucyjnym), a tym samym — są najbardziej odczłowieczani.

Zwróćmy zatem jeszcze raz uwagę na subtelną, choć znaczącą różnicę między opisywanymi tu badaniami. Kteily i jego zespół pytali najpierw o postrzegany stopień rozwoju ewolucyjnego osób z Ameryki, a następnie — szeregu innych grup. Mówiąc bardziej ogólnie, schemat tego badania zakładał pytanie w pierwszym kroku o postrzeganie grupy własnej, a kolejnych krokach — o postrzeganie różnych grup obcych. Gdyby Górska konsekwentnie zastosowała ten schemat w swoim badaniu, napierw pytałaby przedstawiciel(k)i każdej z grup o postrzeganie grupy własnej, a dopiero potem o postrzeganie przeciwników (i może nawet przeciwniczek) politycznych. Dla przykładu, typową zwolenniczkę PiS zapytałaby o to, w jakim stopniu rozwinięci są jej zdaniem „zwolennicy PiS”, a w kolejnym kroku — o to, w jakim stopniu rozwinięci są jej zdaniem zwolennicy opozycji. Analogicznie, typowego zwolennika opozycji pytano by najpierw o to, w jakim stopniu rozwinięci są zwolennicy opozycji, a potem — o to, w jakim stopniu rozwinięci są zwolennicy PiS. Dopiero wtedy można miarodajnie ocenić, w jakim stopniu przedstawiciele i przedstawicielki danej grupy dehumanizują przeciwników politycznych (a nawet przeciwniczki), gdyż wówczas punktem odniesienia jest stopień dehumanizacji grupy własnej. Gdyby Kteily i jego zespół posłużyli schematem użytym przez Górską, wybraliby grupę Amerykanów i Amerykanek i zapytaliby ich o dehumanizację Muzułmanów i Muzułmanek, a następnie wybraliby grupę osób wyznających islam i zapytali ich o dehumanizację Amerykanów i Amerykanek. Porównanie odpowiedzi obu grup byłoby w tym przypadku niemiarodajne, gdyż grupy te mogą się różnić „bazową stopą” dehumanizacji, stąd też potrzeba relatywizowania wskaźnika dehumanizacji danej grupy do wskaźnika dehumanizacji grupy własnej.

2 thoughts on “Goryle we mgle statystyki”

  1. Ciekawe, dzięki za ten post! Pytanie: jaka jest teoretyczna podstawa pytania o własną grupę najpierw, i jak się to ma do tzw. anchoring effect? Możecie powiedzieć coś więcej?

    1. Dziękujemy za pytanie i bardzo, bardzo przepraszamy za skandalicznie wprost długi czas oczekiwania na odpowiedź. Obiecujemy poprawę.
      Jeśli chodzi o teoretyczną podstawę uzasadniającą umieszczenie pytania o ocenę grupy własnej przed pytaniami o ocenę innych grup czy kategorii, to dość dobrze kwestia ta jest wyjaśniona w oryginalnej publikacji Kteilyego et al. (2015), do której link znajduje się w poście.
      „Bezwstydna” dehumanizacja jest w artykule zdefiniowana jako przekonanie o niższości jakiejś grupy w porównaniu do grupy własnej. Testy hipotez dotyczących różnic pomiędzy „bezwstydną” dehumanizacją a jej bardziej subtelnymi formami oraz korelatów tej pierwszej wymagają pomiaru przekonań co do grupy własnej. W przyjętej w publikacji teorii, efekt zakotwiczenia jest zatem niejako w nią wbudowany — zakotwiczeni jesteśmy na grupie własnej i do niej porównujemy inne.
      Istota naszego zastrzeżenia dotyczyła właśnie tego, że schemat badania zastosowany przez Górską de facto nie daje podstaw do wniosków, które ona wyciąga. Jak staraliśmy się pokazać, wniosek ten wymaga ustalenia różnicy między postrzeganiem grupy własnej a grupy obcej. Sondaż przeprowadzony przez Górską w ogóle jednak nie pozwala na określenie tej różnicy. Z tego punktu widzenia kolejność, w jakiej zadawano pytania o ocenę poszczególnych grup, jest sprawą wtórną.

Comments are closed.