Wald’s teszt

A Wald’s teszt lényegében egy Hipotézis teszt annak eldöntésére, hogy az adatok egy bizonyos populációs paraméterrel magyarázhatók-e.


Ugye az, hogy tudjuk egy adott populáció eloszlásnak típusát nem jelenti azt, hogy ha tudjuk annak paraméterét is1. Ha magára a paramétere vagyunk kíváncsiak ilyenkor paraméter becslést végzünk. De ez arra válaszol, mi a legvalószínűbb értéke a paraméternek. Általában ezek a tesztek nem adják vissza a valós paramétert, hanem egy jó közelítést adnak rá. Ez egyszerűen abból az egyszerű tényből következik, hogy folytonos esetben végtelen számú lehetősége van, és 0 a valószínűsége egyetlen pontnak. Mit teszünk ha mondjuk az jön ki, hogy egy Normál eloszlás átlaga 4.00002, a varianciája pedig 7.312312. Ilyenkor elfogadható feltételezésnek tűnik, hogy az átlag 4, a variancia pedig 7. Ami nem biztos, hogy igaz, de mindenféleképpen egy szebb modell lenne. Szóval szeretnénk tesztelni, hogy lehetséges-e, hogy ez igaz. Ezt fogjuk megtenni a Wald’s teszt segítségével. Vagyis van egy elméletünk, hogy az adatok egy bizonyos eloszláscsalád, egy bizonyos paraméter beállításából származnak. Jelen esetben ez az elmélet az, hogy N(4,7)-ból származnak az adatok.

Mint említettem a Wald’s teszt egy hipotézis teszt, tehát kell egy Null és egy Alternatív hipotézis. Ez a következő lesz:

(1)  H_0: \hat{\theta}_{MLE} = \theta_{0} \\  H_1:  \hat{\theta}_{MLE} \ne \theta_{0}

Ahol:

Lényegében, a Null hipotézis az, hogy az MLE becslés hibahatáron belül van a Null hipotézisben feltételezett eloszláshoz. Vegyünk észre valamit. Az általános gyakorlattal szemben, itt nem az Alternatív hipotézisnek hanem a Null hipotézisnek szurkolunk.

Ha a null hipotézis igaz, és a MLE aszimptotikus, akkor következő is igaz:

(2)  \sqrt{n} \cdot  I(\theta_{0})^{-1/2}   \cdot   \left(   \hat{\theta}_{MLE} -  \theta_{0}  \right)  \xrightarrow[n \to \infty]{d}  N_d(0,I_d)

Ahol:

Amire Wald Ábrahám rájött, hogy:

(3)  n\cdot \left(   \hat{\theta}_{MLE} -  \theta_{0}  \right)^T \cdot I\left(  \theta_{MLE}  \right)  \cdot  \left(   \hat{\theta}_{MLE} -  \theta_{0}  \right) \xrightarrow[n \to \infty]{d} \chi^2_d

Vagyis, hogy a Null hipotézis és az MLE különbségének eloszlása egy Khí-négyzet eloszlást követ, ha az MLE aszimptotikus. Az, hogy aszimptotikus, fontos kitétel! A Wald teszt nem használható olyan eloszlásokra, pl. uniform, amikor ez nem igaz.

Azt is vegyük észre, hogy az (2)-ben szereplő I(\theta_{0}) helyett a (3)-ban a MLE Fisher információját használjuk.

Innen már az általános hipotézis teszt lépéseit kell csak követnünk. Ugye a null hipotézis esetén ennek a távolságnak kicsinek kell lennie, így a teszt statisztika a következő lesz:

(4)  \Psi^{Wald}_{\alpha} = 1 \left(n\cdot I\left( \theta_0\right) \cdot \left( \hat{\theta}_{MLE} - \theta_0\right)^2 > q_{\alpha}(\chi_d^2) \right)

Amit felírhatunk Khí-négyzet eloszlás helyett, standard normál eloszlással is:

(5) \Psi^{Wald}_{\alpha} = 1\left( n\cdot I\left( \theta_0\right) \cdot \left( \hat{\theta}_{MLE}-\theta_0  \right)^2 > q_{\alpha/2}\left(N(0,1_d)\right)^2 \right)

Már csak az a kérdés mi a d. Ez a Null hipotézisben szereplő modellünk paramétereinek száma.

Ezt már nem is ragoznám tovább, mivel innen már tényleg a szokásos.


Lábjegyzet

  1. Ugye ez a kérdés csak akkor merül fel, ha paraméteres eloszlásunk van.
Hírdetés

Vélemény, hozzászólás?

Adatok megadása vagy bejelentkezés valamelyik ikonnal:

WordPress.com Logo

Hozzászólhat a WordPress.com felhasználói fiók használatával. Kilépés /  Módosítás )

Twitter kép

Hozzászólhat a Twitter felhasználói fiók használatával. Kilépés /  Módosítás )

Facebook kép

Hozzászólhat a Facebook felhasználói fiók használatával. Kilépés /  Módosítás )

Kapcsolódás: %s