Statystyka wielkości efektu: jak obliczyć iloraz szans z tabeli chi-kwadrat z tabelą krzyżową

Statystyka wielkości efektu: jak obliczyć iloraz szans z tabeli chi-kwadrat z tabelą krzyżową

Abyście nie wierzyli działające lustro dzisiaj, że ilorazy szans są jedynie domeną regresji logistycznej, powiem wam, że to nieprawda.

Jednym z najprostszych sposobów obliczenia ilorazu szans jest użycie tabeli krzyżowej.

Zazwyczaj te tabele analizujemy za pomocą kategorycznego testu statystycznego. Istnieje kilka opcji, w zależności od wielkości próbki i projektu, ale najczęstsze to test niezależności lub jednorodności Chi-kwadrat lub dokładny test Fishera.

I chociaż ten test daje ci wartość p, nie daje dobrej statystyki rozmiaru efektu.

Wraz ze statystykami powiązań, takimi jak phi, iloraz szans jest dobrą statystyką standaryzowanego rozmiaru efektu dla tabeli takiej jak ta.

Oto na przykład prosty zestaw danych z tabelą krzyżową między dwiema zmiennymi binarnymi: czy ktoś biega więcej niż 25 km/tydzień i czy odczuwa ból stawów.

To dość duża próbka. Jak uzyskujemy iloraz szans?

Jak obliczyć iloraz szans

Wrócimy do tego, jak to interpretować, ale najpierw porozmawiajmy o tym, jak obliczyć iloraz szans.

Istnieją różne możliwe ilorazy szans, które możemy wyciągnąć z tej tabeli, ale wybiorę ten, który ma dla mnie największy sens z perspektywy badawczej: porównany iloraz szans dla biegaczy doświadczających bólu stawów dla osób, które nie biegają.

Zaczynamy od obliczenia dwóch prawdopodobieństw: prawdopodobieństwa wystąpienia bólu stawów u biegaczy oraz prawdopodobieństwa wystąpienia bólu stawów u osób niebiegających. (Tak, nazywam osoby, które biegają 24 km/tydzień, nie biegającymi. Bez obrazy. Potrzebuję prostej nazwy dla grup).

Szanse, że biegacz ma ból stawów:

Szanse, że biegacz odczuwa ból stawów, są oparte na jego prawdopodobieństwie. Szacujemy to na podstawie odsetka osób niebiegających, które odczuwają ból stawów. 33%

Teraz prawdziwe prawdopodobieństwo jest w skali od 0 do 1, a nie w skali od 0 do 100, jaką jest wartość procentowa. Więc najpierw dzielimy to przez 100, aby uzyskać 0,33.

Nazwijmy to Pbiegaczami: prawdopodobieństwo, że biegacz ma ból stawów.

Teraz, gdy mamy prawdopodobieństwo wystąpienia bólu stawów u biegaczy, możemy obliczyć szanse bólu stawów u biegaczy. Szansa na ból stawów dla biegaczy to prawdopodobieństwo wystąpienia bólu stawów podzielone przez prawdopodobieństwo nie bólu stawów.

Wygląda to tak: P/(1-P). W tym przypadku jest to 0,33/0,67 = 0,49.

Mówimy to tak: prawdopodobieństwo wystąpienia bólu stawów u biegacza wynosi 0,49 do 1.

Interpretujemy to tak: na każdych 49 biegaczy cierpiących na ból stawów, 100 nie. Musiałem przełączyć się na 49 i 100, ponieważ nie ma sensu mówić „na każdego biegacza za 0,49, który ma ból stawów, 1 nie”. Lub “na każde 4,9 biegaczy, którzy mają bóle stawów, 10 nie. Ale oba są technicznie dokładne, ponieważ tak naprawdę chodzi o wyrażenie proporcji.

Tak. Zgadza się, szanse same w sobie są ilorazem. Ale to nie jest iloraz szans, który próbujemy obliczyć. To tylko kursy.

Wiem. Super mylące, że kurs, który jest stosunkiem dwóch prawdopodobieństw, nie jest ilorazem szans, którego szukamy. Ale to prawda.

Współczynnik szans, którego szukamy, jest w rzeczywistości stosunkiem dwóch kursów. Musimy więc obliczyć kolejny.

Szanse, że osoba, która nie biega, ma ból stawów:

Nazwijmy to Pniebiegaczami: prawdopodobieństwo, że osoba nieuczestnicząca ma ból stawów.

Obliczamy to dokładnie w ten sam sposób, ale teraz używamy liczb z Non-Runners’ wiersz danych.

Albo możemy powiedzieć: na każde 35 osób niebiegających, które mają ból stawów, 100 nie.

Widać, że jest on mniejszy niż kurs dla biegaczy, który wynosił 0,49.

Współczynnik szans

Teraz, gdy mamy oba kursy, możemy obliczyć iloraz szans. Jest to stosunek tych dwóch kursów: Szansebiegaczy/Szansenie biegaczy.

Więc iloraz szans u biegacza rozwijającego ból stawów w porównaniu z niebiegaczem wynosi 1,4.

Co oznacza iloraz szans?

Jednym ze sposobów powiedzenia jest to, że prawdopodobieństwo wystąpienia bólu stawów u biegacza jest 1,4 razy większe niż u niebiegacza. To bardziej prawdopodobne.

Często jednak łatwiej jest myśleć o współczynniku jako o wartości procentowej. 1,4 razy więcej to tyle samo, co 40% więcej.Najprościej więc pomyśleć o tym, że prawdopodobieństwo* wystąpienia bólu stawów jest około 40% wyższe u biegaczy niż u niebiegających.

Zdaję sobie sprawę, że nadal trochę trudno jest myśleć w kategoriach szans, a nie prawdopodobieństw, ponieważ większość z nas jest do tego przyzwyczajona. Ale jeśli trochę go rozpakujesz, możesz nauczyć się myśleć o tym w ten sposób.

Zarówno te szanse: 49:100 dla biegaczy i 35:100 dla niebiegających są porównaniem do 100 osób bez bólu stawów.

Więc w porównaniu do każdych 100 osób w tej grupie bez bólu, grupa biegaczy ma o 40% więcej bólu.

*Zauważ, że użyłem konkretnie słowa “kursy” w tym zdaniu, a nie “prawdopodobnie.” Odkryłem, że jeśli użyjesz terminu “prawdopodobnie” większość ludzi zinterpretuje to jako oznaczające 40% wyższe prawdopodobieństwo. Więc chociaż nie jest to technicznie niedokładne, może być nieumyślnie mylące.

Nowości ze świata sportu

Generacja O: Vegas prognozuje historyczną punktację w 5 tygodniu

Sportsbooks otworzyli sześć meczów NFL w tygodniu 5 z łączną liczbą 50 lub wyższą.

Szanse na Toyota Save Mart 350 na rok 2021: zaskakujące typy NASCAR w Sonoma, najlepsze prognozy ze sprawdzonego modelu

Nascar Cup Series powraca na Sonoma Raceway w niedzielę po raz pierwszy od prawie dwóch lat.

Aplikacja SugarHouse Casino

Chcesz wiedzieć, gdzie możesz zagrać w ponad 200 gier, wideo pokera, gry wirtualne i Slingo, wszystko z telefonu komórkowego?