Student’s t két mintás teszt — példa számítás

Nem olyan régen körbejártam, milyen esetekben használunk Student’s t eloszlást. Most nézzük meg, hogyan valósítjuk meg ezt két minta esetén.


Tegyük fel, hogy van n darab mintánk egy Normál eloszlású populációból. Nevezzük őket X_1,\dots , X_n és feltételezzük, hogy az populáció igazi átlaga \mu_1, míg a varianciája \sigma_1^2.

Legyen egy másik mintánk is egy eltérő populációból. Ennek a jellemzői: elemei a Y_1,\dots , Y_m, átlaga \mu_2, míg a varianciája \sigma_2^2. Ebben a példában a Null hipotézisünk, hogy az X populáció átlaga kisebb minta az Y-é. Vagyis a Null és Alternatív hipotézis:

(1)  H_0: \mu_1 \le \mu_2 \\  H_1: \mu_1  > \mu_2

Mit is jelent ez a hipotézis lényegében? Azt, hogy azt szeretnénk bizonyítani, hogy a két populáció különbsége a jobb oldali kritikus értéknél nagyobb. Mivel két Normál eloszlású populációnk van, ez nem probléma, mivel ezek különbsége is normál, mégpedig:

(2)   X-Y \approx N\left(\mu_1-\mu_2, \frac{\sigma_1^2}{n}+\frac{ \sigma_2^2 }{m} \right)

A mintavétel során a következő eredményekre jutottunk:

X populációY populáció
Átlag\bar{X_n} =  6,2   \bar{Y_m} = 6
Variancia\hat{\sigma_1}^2 = 0,1\hat{\sigma_2}^2 = 0,2
Mintanagyságn = 50m = 50

Első lépésben számoljuk ki a Student’s t szabadsági fokát. Ehhez pedig a
Welch-Satterthwaite formulát fogjuk használni. Ami:

(3)   \nu_{\chi'} \approx \frac{\left( \frac{\hat{\sigma_1}^2}{n}+\frac{ \hat{\sigma_2}^2 }{m}\right) }{\sqrt{ \frac{ (\hat{\sigma_1}^2) ^2}{n^2(n-1)}+\frac{ (\hat{\sigma_2}^2) ^2}{m^2(m-1)} } }

Behelyettesítés után:

(4)  \nu_{\chi'} \approx \frac{\left( \frac{0,1}{50}+\frac{0,2}{50}\right) }{\sqrt{ \frac{0,1^2}{50^2(50-1)}+\frac{0.2^2}{50^2(50-1)} } }  \approx 88,2

Amit mindig lefelé kerekítünk, szóval a szabadsági fok 88-lesz.

Most számoljuk ki a (2)-nak megfelelő t értéket:

(5)  T_n = \frac{\bar{X_n}-\bar{Y_m}}{\sqrt{\frac{ \hat{\sigma_1}^2 }{n}+\frac{ \hat{\sigma_2}^2 }{m}}}

import numpy as np
tn = (6.2-6)/(np.sqrt(0.1/50+0.2/50))

Ami kb. 2,582. Oké, akkor mi lesz az (1)-nak megfelelő tesztünk? Ugye:

(5)  \psi_{\alpha} = 1(T_n > q_{\alpha})

Már csak az a kérdés mi a q_{\alpha} ? Egy n-1 szabadsági fokú Student’s t eloszláshoz tartozó kvantilis. Nézzük meg mi lesz ha \alpha mondjuk 5%:

from scipy.stats import t
print(t.ppf(1-0.05, 88))

Ami kb. 1,66. Vagyis az (5)-ben számolt értéknek ennél kellene nagyobbnak lennie ahhoz, hogy elutasítsuk azt a feltevést, hogy a X populáció átlaga kisebb mint a Y-é. Ugye ez igaz, tehát elutasítjuk a Null hipotézist.

Igazából azt is megtehetnénk, hogy egyből megnézzük a valószínűséget, hogy elfogadjuk a Null hipotézist. Vagyis kiszámítjuk a p-értéket:

import scipy.stats
t.sf(tn, 88)

Ez pedig kb. 0,574%. Ami meg lényegesen alacsonyabb, mint bármilyen értelmes teszt határérték.

Hírdetés

Vélemény, hozzászólás?

Adatok megadása vagy bejelentkezés valamelyik ikonnal:

WordPress.com Logo

Hozzászólhat a WordPress.com felhasználói fiók használatával. Kilépés /  Módosítás )

Twitter kép

Hozzászólhat a Twitter felhasználói fiók használatával. Kilépés /  Módosítás )

Facebook kép

Hozzászólhat a Facebook felhasználói fiók használatával. Kilépés /  Módosítás )

Kapcsolódás: %s