ROC görbe alatti terület

A mai bejegyzésben megismerkedünk egy módszerrel, amivel két osztályos klasszifikáció modellek teljesítményét tudjuk mérni és optimalizálni. Ez a módszer a "ROC görbe alatti terület" (angolul: "Area under the ROC curve"). Klasszikus teljesítménymérés Bár a blogon nem volt téma eddig, de gondolom a legtöbbeknek ismerős az "igazságmátrix" ( angolul: "Confusion_matrix") fogalma. Annak, akiknek mégsem lenne, nagy … ROC görbe alatti terület olvasásának folytatása

Hírdetés

HDBSCAN

A mai bejegyzésben klasztereket fogunk keresni. A blogon korábban már volt szó egy klaszteranalízisre használt eljárásról. Az Elvárás-maximalizáló algoritmus abból a feltételezésből indul ki, hogy az egyes homogén csoportok jól meghatározható eloszlásból származnak. A mai bejegyzésben egy olyan eljárást fogunk megvizsgálni, ami nem ezt feltételezi. Ez lesz a Hierarchical Density-Based Spatial Clustering of Applications with … HDBSCAN olvasásának folytatása

Robusztosság – statisztika alapok

Aki már végzet bármiféle statisztikái elemzést vagy foglalkozott gépi tanulással, az tudja, hogy a valós adatok gyakran tartalmaznak olyan adatokat, amik szokatlanul távol esnek a megfigyelések átlagától. Ezeket kiugró értékeknek szoktuk nevezni. A mai bejegyzésben megnézzük, milyen probémát tudnak ezek a megfigyelések okozni és mit lehet ezzel kezdeni.

Két kevert Gaussian eloszlás paraméterbecslése — Momentumok módszerével

A mai bejegyzés egy statisztikatörténeti szempontból fontos cikkel fog foglalkozni. Mi történik, ha a megfigyelésünk nem egy populációból, hanem két populáció keverékéből származik. Ez a kérdés foglalkoztatta Karl Pearson-t a XIX. század végén. Megoldása áttörést hozott a statisztikában és elterjesztette a Momentumok módszerét. 1892-ben Walter Frank Raphael Weldon Cambridge-i biológus és felesége húsvéti vakációra utaztak … Két kevert Gaussian eloszlás paraméterbecslése — Momentumok módszerével olvasásának folytatása

Főkomponens-analízis

Mai bejegyzésünkben egy nagyon elterjedt dimenziócsökkentő eljárást fogunk megismerni, a Főkomponens-analízist (angolul: Principal component analysis). A bejegyzés Lantos Gábor közreműködésével született. Gábor írt a főkomponens analízis felhasználói oldaláról a saját oldalán, én pedig a háttérben levő matematikai alapokat tárgyalom itt.

Mesterséges kontroll csoport

A randomizált, kontroll vizsgálatról szóló bejegyzésben már találkoztunk azzal a problémával, hogy ideális esetben ugyanazon a kísérleti alanyon szeretnénk megvizsgálni a kezelés hatását és a kezelés hiányának következményeit. Ez persze lehetetlen, de a randomizált kontroll csoport létrehozása általában segít ebben a problémában. A mai bejegyzésben viszont egy olyan esetet fogunk megnézni, amikor nem lehet kontroll … Mesterséges kontroll csoport olvasásának folytatása

Neyman randomizált, kontrollált vizsgálatot — statisztikai alapok

Az előző részben bemutattam, a kontrollált vizsgálat alapjait, és eljutottunk annak felismeréséig, hogy az Átlagos Kezelési Hatás naiv alkalmazása teljesen rossz eredményt produkálhat bizonyos esetekben. Azután megnéztük Fisher módszerét a probléma megkerülésére. A mai bejegyzésben megnézzük, hogy mit tehetünk ha nem akarjuk megkerülni a problémát. Jerzy Neymant nem a „sharp” Hulla érdekelte; Fisherrel ellentétben; hanem … Neyman randomizált, kontrollált vizsgálatot — statisztikai alapok olvasásának folytatása