Esitlus laaditakse üles. Palun oodake

Esitlus laaditakse üles. Palun oodake

Testi valimine: Alustame selle vaatamisest, kas on pidev või mitte.

Seotud esitlused


Teema esitlus: "Testi valimine: Alustame selle vaatamisest, kas on pidev või mitte."— Esitluse väljavõte:

1 Testi valimine: Alustame selle vaatamisest, kas on pidev või mitte.

2 Testi võimsuseks nimetatakse tõenäosust leida statistiliselt
oluline seos antud olukorras; - st teame tegelikku seost ja valimi parameetreid. „Leidmaks seost tugevusega r=0.2 oli antud olukorras meie testi võimsus 85%“ Kaks kasutusala - katse planeerimine - kui suur valim võtta? - järeldamaks midagi negatiivsest tulemusest. Mittesign tulemus iseenesest pole kuigi tugev argument. NB seose puudumist (või olemist täpselt null vms.) ei saa tõestada!

3 Saab tõestada, et pole suurem kui miski (biol relevantne
väärtus), ei saanud seost statistiliselt oluliseks, kui aga seos oleks olnud tugevam kui ...., oleks selle oluliseks saamine olnud väga tõenäone (nt 84,5% - see ongi võimsus), kuna me aga ei saanud, siis ju siis üldkogumis nii tugevat seost ei olnud. Lihtsam viis - parameetrite usalduspiirid.

4 Hüpoteesi testimine: nullhüpotees ja sisukas hüpotees: HO: - erinevust pole; H1: - erinevus on; Esimest tüüpi viga (type I error): kuulutame H1 õigeks, kui ta tegelikult pole; Teist tüüpi viga (type II error): jääme HO juurde, kuigi tegelt on H1 õige. Konservatiivse testi puhul on väike esimest tüüpi vea risk; ... aga suurem teist tüüpi vea risk.

5 Informatsioonikriteeriumid mudeli valimisel,
AIC – Akaike Information Criterion, IT-approach; mudeli lihtsustamisel, millised muutujad võtta/jätta? rakendub olukordades, kus uurime, millest kõigest mõõdetust sõltuv tunnus sõltub, eriti kui ennustada tahame, liigi esinemine maastikul... Mudeleid (sõltumatute muutujate komplekte) võrreldakse - terve mudel saab „headuspunkte“; - mitte üksikute efektide p-väärtuste põhjal.

6 Saab võrrelda erinevaid mudeleid nende AIC’de alusel, sõltub:
- mudeli sobivusest (tõepära – likelyhood); - mudeli keerukusest; parimaks kuulutada see, mille AIC on väikseim, Mudeli sobivus (nt R-ruut) on keerulisemal alati suurem; AIC lähenemise korral saab keerulisusest miinuseid; kas mudeli keerulisemaks tegemine (uue muutuja lisamine) parandas mudeli sobivust piisavalt?

7 Millest sõltub kärnkonnade arvukus?
- nälkjate arvukus - vihmausside arvukus - lompide tihedus

8

9

10 Kaks viisi järelduse tegemiseks:
tehakse järeldused parima (AIC väikseim) mudeli põhjal; tegeletakse mudelite keskmistamisega (model averaging): leitakse hulk hästi sobivaid mudeleid, neile antakse kaalud (weights) vastavalt AIC väärtustele, järeldused mitme mudeli põhjal; tagasi ühe muutuja tasemele: kõrge kaaluga mudelites esinemise eest antakse muutujale rohkem punkte, - saadud punktide järgi (importance) reastatakse sõltumatud muutujad.

11 Model averaging: tähniksinitiiva esinemine Saaremaal, Margus Vilbas et al. 2015

12

13 Bayes’i statistika, ... meil on valim ja eelnev teave sellest, milline parameetri väärtus on kui tõenäone; ... tavastatistikas on meil ainult valim; .... valimi põhjal muudame oma arusaama; ... tõenäosusega 99% on positiivne seos = 1 % tõenäosusega saime valimisse seose juhuslikult; .... tavalist p väärtust nii ei tõlgenda!

14 Bayesi statistika pikemalt
.... täringuga viskame kuue, …. tavatäring ja sohitäring; .... tavatäringu korral tõenäosus 16,7%, see on p. … see on tõenäosus saada „6“ juhuslikult, see on p. … aga see pole ju tõenäosus, et „6“ on saadud juhuslikult (= tõenäosus, et täring on OK); ... sõltub sellest, kui sageli sohki tehakse!

15 Aga kui ette teame, et pooltel juhtudel kasutab sohitäringut, saame arvutada, et
85,7% vs 14,3% Siin see 50:50 on eeljaotus (prior distribution) 85,7:14,3 on järeljaotus (posterior distribution) Järeljaotus on siis arvutatav eeljaotuse ja valimi põhjal! Tulemus sõltub eeljaotusest!

16 Saame täringuga „kuue“; tõenäosus, et on sohitäring (või siis
OK täring) sõltub - tõenäosusest saada „6“ õige täringuga; - tõenäosusest, et kasutatakse sohitäringut; * * * Püüame metsast 6 emast ja 10 isast karu, saame arvutada, kui suur on tõenäosus saada selline valim olukorras, kui üldkogumis on suhe 1:1, see on p; - ainult valimit vaja teada; vastamaks küsimusele „kui tõenäone on, et meie karupopulatsioon on isaste enamusega“, peame teadma selliste populatsioonide esinemise tõenäosust looduses. Kui neid on väga vähe, on tõenäosem, et saime emaste enamusega populatsioonist kogemata veidra valimi.

17 … ja sama asi pidevate tunnuste korrelatsiooniga:

18 Ühes rühmas on oluline seos, teises mitte,
kas rühmadevaheline erinevus on oluline? Uuriti väetamise mõju haava ja kase kasvule, kaks treatmenti (väetati ja mitte), sõltuv muutuja puukese pikkus. Haava puhul leiti väetamise mõju (p = 0,01), kase puhul ei leitud (p = 0,08). kas võib öelda, et väetamise mõju erineb (statistiliselt oluliselt) puuliikide vahel?

19 Testima peab puuliik*väetamine interaktsiooni!
Ei või öelda. Testima peab puuliik*väetamine interaktsiooni! nullmõju oluline mõju mõju tugevus haab kask

20 Päris ausalt peaks hüpotees olema olemas enne andmete vaatamist -
Mis on p hüpoteesile, et käesoleva kursuse viimane loeng toimub 14. kuupäeval? nullhüpotees ja sisukas hüpotees: HO: katseandmete analüüsi viimane loeng toimub misiganes kuupäeval; H1: katseandmete analüüsi viimane loeng toimub 14. kuupäeval; p = ???

21 Päris ausalt peaks hüpotees olema olemas enne andmete vaatamist -
Mis on p hüpoteesile, et käesoleva kursuse viimane loeng toimub 14. kuupäeval? p = 1/30 = 0,0333 Kas siis see on statistiliselt oluline, et 14. kuupäeval? Ei, sest genereerisime hüpoteesi andmete peale vaadates, peaks olema andmetest sõltumatu!

22 statistika ei vasta küsimusele
põhjuslikkuse kohta; pidevat muutujat ei jaga klassidesse, küll aga joonisel, joonis ei pea vastama analüüsile;

23 „Miski ei paljasta matemaatilist
kirjaoskamatust paremini kui liigne täpsus arvutustes“.


Alla laadida ppt "Testi valimine: Alustame selle vaatamisest, kas on pidev või mitte."

Seotud esitlused


Google'i reklaam