Az előző részben megismertük, hogy a logisztikus regressziós modell készítésének hátterét, a mai bejegyzésben megnézzük a modellünk mennyire használható. Ehhez a lineáris regresszióval kapcsolatban megismert determinációs együtthatót és p-értéket fogjuk használni. McFadden áldeteminációs együttható A McFadden ugyanazt a logikát követi mint a lineáris modell determinációs együtthatója. Vagyis a determinációs együttható a legjobb és a legrosszabb … Logisztikus regresszió 2. rész — determinációs együttható és p-érték olvasásának folytatása
Címke: Maximum likelihood
Logisztikus regresszió 1. rész — modell készítése
A mai bejegyzésben egy népszerű osztályozó modellt fogunk megismerni. Alapesetben két csoport modellezésére szokták használni, de ki lehet terjeszteni több csoportra is. A logisztikai regressziót már említettem korábban a ROC görbe alatti területről szóló bejegyzés során. Ott elhangzott, hogy a kimenete annak a valószínűsége, hogy egy megfigyelés egyik vagy másik csoportba tartozik e. Hogy megértsük … Logisztikus regresszió 1. rész — modell készítése olvasásának folytatása
Eloszlások távolsága
A mai bejegyzésben több Statisztikai alakkérdést fogunk körbejárni: mit jelent hogy két eloszlás különbözik egymástól? Hogy számszerűsíthetjük a különbséget? Miként lehet ezt paraméterbecslésre használni? A bejegyzés végére a relatív entrópián keresztül el fogunk jutni a likelihood fogalmáig.
Paraméterbecslés a Momentumok módszerével — példa számítás
Ebben a bejegyzésben a Maximum likelihood után a második legnépszerűbb paraméterbecslési eljárást fogjuk megvizsgálni: a Momentumok módszerét. A Method of moments-t 1887-ben Pafnutyij Lvovics Csebisev publikálta, ami mai napig tartó népszerűségét annak köszönheti, hogy nagyon könnyű számolni. Ezt mindjárt be is mutatjuk. Az alap ötlet lényegében a többismeretlenes egyenletrendszerek megoldásán alapul. Mint tudjuk ezekben az … Paraméterbecslés a Momentumok módszerével — példa számítás olvasásának folytatása
Elvárás-maximalizáló algoritmus
Ma egy olyan robusztus osztályozó eljárást ismertetek, amit hiányos adatsorokra is tudunk alkalmazni. Az Elvárás-maximalizáló algoritmust 1977-ben publikálta Arthur Dempster, Nan Laird és Donald Rubin.1 A céljuk az volt, hogy kidolgozzanak egy olyan általános eljárást, amivel hiányos adatok esetén is lehetséges a maximum likelihood modellezés. Kezdjük egy egyszerű osztályozási problémával: van sok megfigyelésünk, amik K … Elvárás-maximalizáló algoritmus olvasásának folytatása
A Loss függvény – statisztika alapok
A sorozat célja, hogy a Statisztika alap fogalmait tisztázza minél közérthetőben. A Loss függvényt tipikusan optimalizációs problémák megoldására szokták alkalmazni. A kérdés amire válaszol: melyik az a modell ami leginkább illeszkedik a mintavételi pontjainkra. Mint mindent, ezt is egy példa alapján lehet a legjobban megérteni, ezért nézzünk is egyet. Az alábbi példában van egy 20 … A Loss függvény – statisztika alapok olvasásának folytatása
Paraméterbecslés Maximum likelihood módszerrel — példa számítás
Statisztikai elemzéséknél gyakran kell paraméterbecslést végeznünk. Ez a következő probléma: van egy ismert típusú populációnk, viszont nem ismerjük azt a paramétert, ami a konkrét populációra jellemző. Ebben a posztban megpróbálom bemutatni, hogy határozhatjuk meg ezt a nem ismert paramétert a maximum likelihood módszerrel.1 Most érdekes elméleti kérdések helyett csak egy számítási sorvezető következik. Azért írtam … Paraméterbecslés Maximum likelihood módszerrel — példa számítás olvasásának folytatása