Aki már végzet bármiféle statisztikái elemzést vagy foglalkozott gépi tanulással, az tudja, hogy a valós adatok gyakran tartalmaznak olyan adatokat, amik szokatlanul távol esnek a megfigyelések átlagától. Ezeket kiugró értékeknek szoktuk nevezni. A mai bejegyzésben megnézzük, milyen probémát tudnak ezek a megfigyelések okozni és mit lehet ezzel kezdeni.
Címke: Huber loss
Reguláció
Egy korábbi bejegyzésben volt szó a túlillesztés problémájáról. Ma az egyik lehetséges megoldási lehetőséget nézzük át: a regulációt. A reguralizáció az összetettebb modellek büntetése az egyszerűbbekkel szemben. Miért jó ez? Mint tudjuk, hajlamosak vagyunk olyan esetekben is összefüggéséket felfedezni, amikor nincsenek. Ennek köszönhetően egyre összetettebb modelleket alkotunk, amik újabb és újabb "összefüggésekkel" egészítik ki az … Reguláció olvasásának folytatása
A Loss függvény – statisztika alapok
A sorozat célja, hogy a Statisztika alap fogalmait tisztázza minél közérthetőben. A Loss függvényt tipikusan optimalizációs problémák megoldására szokták alkalmazni. A kérdés amire válaszol: melyik az a modell ami leginkább illeszkedik a mintavételi pontjainkra. Mint mindent, ezt is egy példa alapján lehet a legjobban megérteni, ezért nézzünk is egyet. Az alábbi példában van egy 20 … A Loss függvény – statisztika alapok olvasásának folytatása