Lineáris modell determinációs együttható — statisztika alapok

A mai bejegyzésben körbejárjuk, hogyan tudjuk eldönteni két lineáris modell közül melyik a jobb. A Loss fügvényről szóló bejegyzésben már megemlítettük, hogy készítünk egyetlen lineáris modellt: Kipróbálunk egy rakás lineáris modellt, és a végén az kerül kiválasztásra, aminél a loss függvény eredménye a legkisebb. Ez a modell lesz az adott függő és független változók esetén … Lineáris modell determinációs együttható — statisztika alapok olvasásának folytatása

Hírdetés

Robusztosság – statisztika alapok

Aki már végzet bármiféle statisztikái elemzést vagy foglalkozott gépi tanulással, az tudja, hogy a valós adatok gyakran tartalmaznak olyan adatokat, amik szokatlanul távol esnek a megfigyelések átlagától. Ezeket kiugró értékeknek szoktuk nevezni. A mai bejegyzésben megnézzük, milyen probémát tudnak ezek a megfigyelések okozni és mit lehet ezzel kezdeni.

Bayesian szemlélet — statisztika alapok

Az elöző bejegyzésben megismerkedtünk a Bayes-tételel, ma körbejárjuk a tétel köré épített szemlélet miben tér el a klasszikus statisztikai szemlélettől. Szóval mi olyan különleges a Bayes-tételben? Bár elsőre talán nem látszik, de ez egy teljesen eltérő hozzáállás az adatokhoz és a tudományos bizonyításhoz, mint a klasszikus megközelítés. A klasszikus tudományos bizonyítás során az Megfigyelésből indulunk … Bayesian szemlélet — statisztika alapok olvasásának folytatása

Randomizált, kontrollált vizsgálat — statisztikai alapok

A mai bejegyzésben egy nagyon elterjedt, és megbízhatónak tartott vizsgálati módszert fogunk megnézni, nevezetesen a „Randomizált, kontrollált vizsgálatot”. Ezt olyan esetekben használjuk, ha arra vagyunk kíváncsiak, hogy egy beavatkozásnak (kezelésnek) mi a várható eredménye. Gondolkozzunk el egy kicsit a felhasználási területén! Mint említettem, akkor használjuk, ha arra vagyunk kíváncsiak, hogy mi egy beavatkozás várható eredménye. … Randomizált, kontrollált vizsgálat — statisztikai alapok olvasásának folytatása

Bayes-tétel — statisztika alapok

Az egyik legizgalmasabb terület számomra a statisztikában a Bayesian gondolkodás. Korábban írtam egy bejegyzést erről a témáról, de az elmélettel még nem foglalkoztam. Most ezt fogom pótolni. Kicsit távolról indítok, de feltétlenül tisztáznunk kell az elvárásokat a Bayesian statisztikával szemben, hogy értékelni lehessen a jelentőségét. Amikor Statisztikai analízist végzünk belülről haladunk kifele. Először megépítjük a … Bayes-tétel — statisztika alapok olvasásának folytatása

Centrális határeloszlás-tétel — statisztika alapok

A Centrális határeloszlás-tétele a statisztika egyik legfontosabb tétele, lényegében az összes aszimptotikus eset erre épül. Nézzük mi is ez egyszerűen. A Klasszikus Centrális határeloszlás-tételt lényegében egyetlen mondatba össze lehet foglalni: ha egy populációból független mintákat veszünk, akkor a mintából számolt átlagok normál eloszlást fognak követni. Mit is jelent ez. Nézzünk egy példát. Legyen például egy … Centrális határeloszlás-tétel — statisztika alapok olvasásának folytatása

Szórásnégyzet – statisztika alapok

A sorozat célja, hogy a Statisztika alap fogalmait tisztáz minél közérthetőben. Lényegében annak a mértéke, hogy egy valószínűségi változó menyire tér el a várható értéktől. Pontosabban mint ahogy a neve is mutatja ennek az eltérésnek a négyzete. Hogy miért a négyzetre emelés? Mert ez deriválható. Nézzük a definicióját diszkrét esetre: (1)  $latex Var(X) = \frac{1}{n} … Szórásnégyzet – statisztika alapok olvasásának folytatása

Conjugate prior – statisztika alapok

A sorozat célja, hogy a Statisztika alap fogalmait tisztáz minél közérthetőben. Nézzük mi a Conjugate prior. Lényegében csak azt jelenti, hogy a Bayesian statisztikában a prior és a posterior ugyanabba az eloszlás családba tartozik. Ennek a fogalomnak számítástechnikai hozadéka van. Lévén ha a család nem változik akkor sokkal könnyebb számolni, mivel csak a paraméterek változását … Conjugate prior – statisztika alapok olvasásának folytatása

Várható érték – statisztika alapok

A sorozat célja, hogy a Statisztika alap fogalmait tisztázza minél közérthetőbben. A várható érték minden bizonnyal a legelemibb statisztikai fogalom. A: Mi a legvalószínűbb eredmény? kérdésre válaszol. A valószínűségszámításra ugye akkor van szükség ha nem determinisztikus, hanem valamilyen szinten sztochasztikus folyamatokkal van dolgunk. A 2+3-nál nincs szükségünk rá, mert az eredmény mindig ugyanazt. Ha egy … Várható érték – statisztika alapok olvasásának folytatása

A Loss függvény – statisztika alapok

A sorozat célja, hogy a Statisztika alap fogalmait tisztázza minél közérthetőben. A Loss függvényt tipikusan optimalizációs problémák megoldására szokták alkalmazni. A kérdés amire válaszol: melyik az a modell ami leginkább illeszkedik a mintavételi pontjainkra. Mint mindent, ezt is egy példa alapján lehet a legjobban megérteni, ezért nézzünk is egyet. Az alábbi példában van egy 20 … A Loss függvény – statisztika alapok olvasásának folytatása