Osnovni koncepti matematične statistike. Uporaba matematične statistike

Kazalo:

Osnovni koncepti matematične statistike. Uporaba matematične statistike
Osnovni koncepti matematične statistike. Uporaba matematične statistike
Anonim

Matematična statistika je metodologija, ki vam omogoča sprejemanje premišljenih odločitev v negotovih razmerah. Preučevanje metod za zbiranje in sistematizacijo podatkov, obdelavo končnih rezultatov eksperimentov in eksperimentov z množično naključnostjo ter odkrivanje kakršnih koli vzorcev je tisto, kar počne ta veja matematike. Razmislite o osnovnih konceptih matematične statistike.

Razlika s teorijo verjetnosti

Metode matematične statistike se tesno sekajo s teorijo verjetnosti. Obe veji matematike se ukvarjata s preučevanjem številnih naključnih pojavov. Obe disciplini sta povezani z mejnimi izreki. Vendar pa je med temi znanostmi velika razlika. Če teorija verjetnosti določa značilnosti procesa v resničnem svetu na podlagi matematičnega modela, potem matematična statistika naredi nasprotno – nastavi lastnosti modela nana podlagi opazovanih informacij.

Teorija verjetnosti in mat. statistika
Teorija verjetnosti in mat. statistika

Koraki

Uporaba matematične statistike se lahko izvaja le v zvezi z naključnimi dogodki ali procesi, oziroma s podatki, pridobljenimi z njihovim opazovanjem. In to se zgodi v več fazah. Prvič, podatki o poskusih in poskusih so podvrženi določeni obdelavi. Narejeni so zaradi jasnosti in enostavnosti analize. Nato se naredi natančna ali približna ocena zahtevanih parametrov opazovanega naključnega procesa. Lahko so:

  • ocena verjetnosti dogodka (njegova verjetnost sprva ni znana);
  • preučevanje obnašanja funkcije nedoločene porazdelitve;
  • ocena pričakovanj;
  • ocena variance
  • itd.
Osnove mat. statistika
Osnove mat. statistika

Tretja faza je preverjanje morebitnih hipotez, postavljenih pred analizo, torej pridobitev odgovora na vprašanje, kako rezultati eksperimentov ustrezajo teoretičnim izračunom. Pravzaprav je to glavna faza matematične statistike. Primer bi bil razmisliti, ali je vedenje opazovanega naključnega procesa znotraj normalne porazdelitve.

Prebivalstvo

Osnovni koncepti matematične statistike vključujejo splošne in vzorčne populacije. Ta disciplina se ukvarja s preučevanjem niza določenih predmetov glede na neko lastnost. Primer je delo taksista. Upoštevajte te naključne spremenljivke:

  • obremenitev ali število strank: na dan, pred kosilom, po kosilu, …;
  • povprečni čas potovanja;
  • število prispelih vlog ali njihove priloge v mestne četrti in še veliko več.

Omeniti velja tudi, da je mogoče preučiti nabor podobnih naključnih procesov, ki bodo prav tako naključna spremenljivka, ki jo je mogoče opazovati.

Prebivalstvo
Prebivalstvo

Torej se v metodah matematične statistike celotna množica preučenih predmetov ali rezultati različnih opazovanj, ki se izvajajo pod enakimi pogoji na določenem objektu, imenuje splošna populacija. Z drugimi besedami, matematično strožje, je naključna spremenljivka, ki je definirana v prostoru elementarnih dogodkov, v njej pa je označen razred podmnožic, katerih elementi imajo znano verjetnost.

Vzorčna populacija

Obstajajo primeri, ko je iz nekega razloga (stroška, čas) nemogoče ali nepraktično izvajati neprekinjeno študijo za preučevanje vsakega predmeta. Na primer, odpiranje vsakega kozarca zaprte marmelade, da bi preverili njegovo kakovost, je dvomljiva odločitev in poskus oceniti pot vsake molekule zraka v kubičnem metru je nemogoč. V takih primerih se uporablja metoda selektivnega opazovanja: iz splošne populacije izberemo (običajno naključno) določeno število objektov in jih analiziramo.

Vzorec iz generalkeagregati
Vzorec iz generalkeagregati

Ti koncepti se morda sprva zdijo zapleteni. Zato, da bi v celoti razumeli temo, morate preučiti učbenik V. E. Gmurmana "Teorija verjetnosti in matematična statistika". Tako je vzorčni niz ali vzorec niz predmetov, izbranih naključno iz splošnega nabora. Strogo matematično gledano, je to zaporedje neodvisnih, enakomerno porazdeljenih naključnih spremenljivk, za vsako od katerih porazdelitev sovpada s tisto, ki je navedena za splošno naključno spremenljivko.

Osnovni koncepti

Na kratko razmislimo o številnih drugih osnovnih konceptih matematične statistike. Število predmetov v splošni populaciji ali vzorcu se imenuje volumen. Vzorčne vrednosti, ki jih dobimo med poskusom, imenujemo realizacija vzorca. Da bi bila ocena splošne populacije, ki temelji na vzorcu, zanesljiva, je pomembno imeti tako imenovani reprezentativni ali reprezentativni vzorec. To pomeni, da mora vzorec v celoti predstavljati populacijo. To je mogoče doseči le, če imajo vsi elementi populacije enako verjetnost, da so v vzorcu.

Osnovni koncepti
Osnovni koncepti

Vzorci razlikujejo med vračilom in nevračanjem. V prvem primeru se v vsebini vzorca ponovljeni element vrne v splošni niz, v drugem primeru pa ne. Običajno se v praksi uporablja vzorčenje brez zamenjav. Opozoriti je treba tudi, da velikost splošne populacije vedno bistveno presega velikost vzorca. Obstajativeliko možnosti za postopek vzorčenja:

  • preprosto - predmeti so izbrani naključno enega za drugim;
  • typed - splošna populacija je razdeljena na vrste in izbira je možna med vsakim; primer je anketa med prebivalci: moški in ženske ločeno;
  • mehanski - na primer izberite vsak 10. element;
  • serial - izbor se izvede v nizih elementov.

Statistična porazdelitev

Po Gmurmanu sta teorija verjetnosti in matematična statistika izjemno pomembni disciplini v znanstvenem svetu, predvsem v njegovem praktičnem delu. Upoštevajte statistično porazdelitev vzorca.

Predpostavimo, da imamo skupino študentov, ki so bili testirani iz matematike. Kot rezultat imamo nabor ocen: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - to je naš primarni statistični material.

Najprej ga moramo razvrstiti ali izvesti operacijo razvrščanja: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - in tako dobiti variacijsko serijo. Število ponovitev vsake od ocen se imenuje frekvenca ocenjevanja, njihovo razmerje do velikosti vzorca pa relativna frekvenca. Naredimo tabelo statistične porazdelitve vzorca ali samo statistično serijo:

ai 1 2 3 4 5
pi 1 1 2 4 3

ali

ai 1 2 3 4 5
pi 1/11 1/11 2/11 4/11 3/11

Imemo naključno spremenljivko, na kateri bomo izvedli vrsto poskusov in videli, kakšno vrednost ima ta spremenljivka. Recimo, da je vzela vrednost a1 - m1-krat; a2 - m2-krat itd. Velikost tega vzorca bo m1 + … + mk=m. Niz ai, kjer i variira od 1 do k, je statistična serija.

Intervalna porazdelitev

V knjigi VE Gmurmana "Teorija verjetnosti in matematična statistika" je predstavljena tudi intervalna statistična serija. Njegovo sestavljanje je možno, ko je vrednost preučevane značilnosti neprekinjena v določenem intervalu in je število vrednosti veliko. Razmislite o skupini študentov ali bolje rečeno, njihovo višino: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 14, 71 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - skupaj 30 študentov. Očitno je višina osebe stalna vrednost. Določiti moramo intervalni korak. Za to se uporablja Sturgesova formula.

h= največ - min = 190 - 156 = 33 = 5, 59
1+log2m 1+log230 5, 9

Tako lahko za velikost intervala vzamemo vrednost 6. Povedati je treba tudi, da je vrednost 1+log2m formula zadoločanje števila intervalov (seveda z zaokroževanjem). Tako se v skladu s formulami dobi 6 intervalov, od katerih ima vsak velikost 6. In prva vrednost začetnega intervala bo število, določeno s formulo: min - h / 2=156 - 6/2=153. Naredimo tabelo, ki bo vsebovala intervale in število učencev, katerih rast je padla v določenem intervalu.

H [153; 159) [159; 165) [165; 171) [171; 177) [177; 183) [183; 189)
P 2 5 3 9 8 3
P 0, 06 0, 17 0, 1 0, 3 0, 27 0, 1

Seveda to še ni vse, saj je v matematični statistiki veliko več formul. Upoštevali smo le nekaj osnovnih konceptov.

Razpored distribucije

Distribucijski grafikoni
Distribucijski grafikoni

Osnovni koncepti matematične statistike vključujejo tudi grafični prikaz porazdelitve, ki ga odlikuje jasnost. Obstajata dve vrsti grafov: poligon in histogram. Prvi se uporablja za diskretno statistično serijo. Za neprekinjeno distribucijo pa drugo.

Priporočena: