Pearsonova distribucija: definicija, uporaba

Kazalo:

Pearsonova distribucija: definicija, uporaba
Pearsonova distribucija: definicija, uporaba
Anonim

Kaj je Pearsonov zakon o distribuciji? Odgovor na to široko vprašanje ne more biti preprost in jedrnat. Pearsonov sistem je bil prvotno zasnovan za modeliranje vidnih popačenih opazovanj. Takrat je bilo dobro znano, kako prilagoditi teoretični model tako, da se ujema s prvima dvema kumulantoma ali trenutkom opazovanih podatkov: vsako porazdelitev verjetnosti je mogoče neposredno razširiti, da tvori skupino lokacijskih lestvic.

Pearsonova hipoteza o normalni porazdelitvi meril

Razen v patoloških primerih se lahko lokacijska lestvica poljubno ujema z opazovanim povprečjem (prvi kumulant) in varianco (drugi kumulant). Vendar ni bilo znano, kako sestaviti verjetnostne porazdelitve, v katerih bi lahko enako prosto nadzorovali poševnost (standardiziran tretji kumulant) in kurtosis (standardiziran četrti kumulant). Ta potreba je postala očitna, ko smo poskušali prilagoditi znane teoretične modele opazovanim podatkom,ki je pokazal asimetrijo.

V spodnjem videu si lahko ogledate analizo Pearsonove chi-distribucije.

Image
Image

Zgodovina

V svojem izvirnem delu je Pearson identificiral štiri vrste porazdelitve (oštevilčene od I do IV) poleg normalne porazdelitve (ki je bila prvotno znana kot tip V). Razvrstitev je odvisna od tega, ali so porazdelitve podprte v omejenem intervalu, na pol osi ali na celotni realni črti in ali so bile potencialno poševne ali nujno simetrične.

Dve izpustitvi sta bili popravljeni v drugem prispevku: na novo je definiral porazdelitev tipa V (prvotno je bila le normalna porazdelitev, zdaj pa z inverzno gama) in uvedel porazdelitev tipa VI. Prva dva članka skupaj pokrivata pet glavnih tipov Pearsonovega sistema (I, III, IV, V in VI). V tretjem članku je Pearson (1916) predstavil dodatne podtipe.

Pearsonove porazdelitvene funkcije
Pearsonove porazdelitvene funkcije

Izboljšajte koncept

Rind je izumil preprost način za vizualizacijo prostora parametrov Pearsonovega sistema (ali porazdelitve kriterijev), ki ga je kasneje sprejel. Danes to metodo uporabljajo številni matematiki in statistiki. Za vrste Pearsonovih porazdelitev sta značilni dve količini, ki ju običajno imenujemo β1 in β2. Prvi je kvadrat asimetrije. Drugi je tradicionalni kurtosis ali četrti standardizirani trenutek: β2=γ2 + 3.

Sodobne matematične metode definirajo eksces γ2 kot kumulante namesto trenutkov, torej za normalnoporazdelitev imamo γ2=0 in β2=3. Tukaj je vredno slediti zgodovinskemu precedensu in uporabiti β2. Diagram na desni prikazuje, katere vrste je določena Pearsonova porazdelitev (označena s piko (β1, β2).

Pearsonova statistika
Pearsonova statistika

Mnoge poševne in/ali nemezokurtične distribucije, ki jih poznamo danes, še niso bile znane v zgodnjih 1890-ih. To, kar je zdaj znano kot beta porazdelitev, je Thomas Bayes uporabil kot posteriorni parameter Bernoullijeve porazdelitve v svojem prispevku iz leta 1763 o inverzni verjetnosti.

Distribucija beta se je povečala zaradi svoje prisotnosti v Pearsonovem sistemu in je bila do štiridesetih let prejšnjega stoletja znana kot Pearsonova distribucija tipa I. Porazdelitev tipa II je poseben primer tipa I, vendar običajno ni več izpostavljena.

Porazdelitev gama izvira iz njegovega lastnega dela in je bila znana kot normalna porazdelitev Pearson tipa III, preden je v 1930-ih in 1940-ih pridobila svoje sodobno ime. Znanstvenik iz leta 1895 je distribucijo tipa IV, ki vsebuje Studentovo t-distribucijo, predstavil kot poseben primer, ki je bil nekaj let pred kasnejšo uporabo Williama Seelyja Gosseta. Njegov dokument iz leta 1901 je predstavil distribucijo z inverzno gama (tip V) in beta praštevili (tip VI).

Še eno mnenje

Po Ordu je Pearson razvil osnovno obliko enačbe (1) na podlagi formule za izvod logaritma funkcije gostote normalne porazdelitve (ki daje linearno deljenje s kvadratnimstrukturo). Številni strokovnjaki se še vedno ukvarjajo s testiranjem hipoteze o porazdelitvi Pearsonovih meril. In dokazuje svojo učinkovitost.

Alternativna Pearsonova distribucija
Alternativna Pearsonova distribucija

Kdo je bil Karl Pearson

Karl Pearson je bil angleški matematik in biostatik. Zaslužen je za ustvarjanje discipline matematične statistike. Leta 1911 je na University College London ustanovil prvi oddelek za statistiko na svetu in pomembno prispeval na področju biometrije in meteorologije. Pearson je bil tudi zagovornik socialnega darvinizma in evgenike. Bil je varovanec sira Francisa G altona in biograf.

Biometrics

Karl Pearson je bil ključnega pomena pri ustvarjanju biometrične šole, ki je bila konkurenčna teorija za opis evolucije in dedovanja populacij na prelomu 20. stoletja. Njegova serija osemnajstih člankov "Matematični prispevki k teoriji evolucije" ga je uveljavila kot ustanovitelja biometrične šole dedovanja. Pravzaprav je Pearson večino svojega časa v letih 1893-1904 posvetil razvoj statističnih metod za biometrijo. Te metode, ki se danes pogosto uporabljajo za statistično analizo, vključujejo test hi-kvadrat, standardni odklon, korelacijske in regresijske koeficiente.

Pearsonov korelacijski koeficient
Pearsonov korelacijski koeficient

Vprašanje o dednosti

Pearsonov zakon dednosti pravi, da je zarodna plazma sestavljena iz elementov, podedovanih od staršev, pa tudi od bolj oddaljenih prednikov, katerih delež se je spreminjal glede na različne značilnosti. Karl Pearson je bil G altonov privrženec, in čeprav njihovDela so se v nekaterih pogledih razlikovala, je Pearson uporabil veliko količino statističnih konceptov svojega učitelja pri oblikovanju biometrične šole za dedovanje, kot je zakon regresije.

Pearsonova distribucija
Pearsonova distribucija

Šolske funkcije

Biometrijska šola, za razliko od Mendelovaca, ni bila osredotočena na zagotavljanje mehanizma za dedovanje, ampak na zagotavljanje matematičnega opisa, ki ni bil vzročne narave. Medtem ko je G alton predlagal diskontinuirano teorijo evolucije, v kateri bi se vrste spreminjale z velikimi skoki in ne z majhnimi spremembami, ki so se kopičile skozi čas, je Pearson opozoril na pomanjkljivosti tega argumenta in dejansko uporabil svoje ideje za razvoj neprekinjene teorije evolucije. Mendelci so imeli raje diskontinuirano teorijo evolucije.

Medtem ko se je G alton osredotočil predvsem na uporabo statističnih metod pri preučevanju dednosti, sta Pearson in njegov kolega Weldon razširila svoje sklepanje na tem področju, variacije, korelacije naravne in spolne selekcije.

Tipična distribucija
Tipična distribucija

Pogled na evolucijo

Za Pearsona teorija evolucije ni bila namenjena identifikaciji biološkega mehanizma, ki pojasnjuje vzorce dedovanja, medtem ko je mendelski pristop razglasil gen za mehanizem dedovanja.

Pearson je kritiziral Batesona in druge biologe, ker niso sprejeli biometričnih metod pri svojih študijah evolucije. Obsodil je znanstvenike, ki se niso osredotočili nastatistična veljavnost njihovih teorij, ki navaja:

"Preden lahko sprejmemo [kakršen koli vzrok progresivnih sprememb] kot dejavnik, ne smemo samo pokazati njegove verodostojnosti, ampak, če je mogoče, pokazati njegovo kvantitativno sposobnost."

Biologi so podlegli "skoraj metafizičnim špekulacijam o vzrokih dednosti", ki so nadomestile postopek zbiranja eksperimentalnih podatkov, kar lahko znanstvenikom dejansko omogoči, da zožijo potencialne teorije.

statistični most
statistični most

Zakoni narave

Za Pearsona so bili zakoni narave uporabni za natančne napovedi in za povzemanje trendov v opazovanih podatkih. Razlog je bila izkušnja, "da se je določeno zaporedje zgodilo in ponovilo v preteklosti."

Tako identifikacija določenega mehanizma genetike ni bila vredna prizadevanja za biologe, ki bi se morali namesto tega osredotočiti na matematične opise empiričnih podatkov. To je deloma privedlo do ostrega spora med biometristi in mendelci, vključno z Batesonom.

Potem ko je slednji zavrnil enega od Pearsonovih rokopisov, ki opisuje novo teorijo variacije ali homotipije potomcev, sta Pearson in Weldon leta 1902 ustanovila podjetje Biometrika. Čeprav je biometrični pristop k dedovanju sčasoma izgubil svojo mendelsko perspektivo, so metode, ki so jih takrat razvili, ključnega pomena za študij biologije in evolucije danes.

Priporočena: