BAZELE STATISTICIIBAZELE STATISTICII- anul universitar 2014-2015 -
6. Testarea statistic6.1. Aspecte generale ale testrii statistice
6.1.1. Obiectivele testrii statistice6.1.2. Demersul testrii statistice 6.1.3. Teste parametrice versus teste neparametrice
6.2. Testarea ipotezelor asupra unui eantion6.2.1 Testarea ipotezelor asupra mediei: testul t, testul Z6.2.2 Testarea ipotezelor asupra proporiei: testul t, testul Z
6. Testarea statistic6.3. Testarea ipotezelor privind dou eantioane (cazul
eantioanelor independente)- verificarea egalitii mediilor.
6.4. Testarea ipotezelor privind 3 i mai multe eantioane6.4. Testarea ipotezelor privind 3 i mai multe eantioaneindependente (Testul Fisher ANOVA)
6.1. Aspecte generale ale testrii statisticeNecesitatea testrii
6.1.1. Obiectivele testrii statistice- verificarea ipotezelor asupra unui parametru al unei populaii;- verificarea ipotezelor privind legea de distribuie a unei
populaii;- verificarea ipotezelor privind dou sau mai multe populaii.
6.1.2. Demersul testrii statistice
6.1. Aspecte generale ale testrii statistice
a) Formularea ipotezelor statisticeO ipotez este o presupunere cu privire la valoarea unuiparametru, legea de distribuie a variabilei studiate, etc.H0 : egalitatea unui parametru cu o valoare fix; oH0 : egalitatea unui parametru cu o valoare fix; opresupunere cu privire la legea de repartiie a unei variabile.H1: este opusul ipotezei nule.
6.1. Aspecte generale ale testrii statisticeTest bilateral:
Test unilateral la dreapta:0100
:H:H
=
Test unilateral la dreapta:
Test unilateral la stnga:
0100
:H:H
>=
0100
:H:H
6.1. Aspecte generale ale testrii statistice
b) Alegerea testului statistic- exist dou categorii de teste statistice: teste parametrice iteste neparametrice.
c) Alegerea pragului de semnificaie al testului i citireavalorii critice (teoretice)- riscul (pragul de semnificaie) reprezint probabilitatea dea respinge ipoteza nul, atunci cnd aceasta este adevrat.
d) Calculul valorii statisticii test, folosind datele observate lanivelul eantionului.
6.1. Aspecte generale ale testrii statisticee) Regiunea de respingere/acceptare a ipotezei nule
Regiunea de respingere intervalul dintr-o distribuie deprobabilitate n care se respinge ipoteza nul, acest intervaleste acoperit de probabilitateaRegiunea de acceptare (interval de ncredere) intervalul n
Regiunea de acceptare (interval de ncredere) intervalul ncare nu se respinge ipoteza nul i este acoperit deprobabilitatea 1-
f) Regula de decizie
Erori de testare
Decizia testului se ia cu o anumit eroare, care poate fi: eroare de tip I (eroare de prim spe, notat ) eroare de tip II (eroare de a doua spe, notat )
6.1. Aspecte generale ale testrii statistice
1 msoar nivelul de siguran al testului (siguranastatistic)
1 msoar puterea testului
1 msoar puterea testului
6.1.3 Teste parametrice i teste neparametrice
Teste parametrice: presupun ipoteza de normalitate a distribuiei populaiei; variabila analizat este msurat pe o scal interval sau
raport;raport; mrimea eantionului trebuie s fie suficient de mare (ex.
n>30).Teste neparametrice: puine ipoteze restrictive privind legea de distribuie a
populaiei; se folosesc pentru variabile calitative.
6.2. Testarea ipotezelor asupra unui eantion6.2.1. Testarea ipotezelor asupra mediei unei populaiia) Formularea ipotezelor
b) Alegerea testului statistic- dac se cunoate se folosete statistica Z, ),(N~Z 10
0100
:H:H
=
2- dac se cunoate se folosete statistica Z,
- dac nu se cunoate , se folosete statistica t,
),(N~Z 10
)n(t~t 12n/
Z 0
=
n/'
t 0
=
2
6.2.1. Testarea ipotezelor asupra mediei unei populaii
c). Alegerea pragului de semnificaie i citirea din tabel avalorii critice a statisticii test.
d). Calculul valorii statisticii test pe baza datelor eantionuluid). Calculul valorii statisticii test pe baza datelor eantionului
n/x
zcalculat
=
0n/'s
xt 0calculat
=
6.2.1. Testarea ipotezelor asupra mediei unei populaii
e). Regula de decizie- dac , se respinge ipoteza nul,pentru un risc
2/calculat tt >
tt - dac , nu se respinge ipoteza nul.
f). Compararea valorii calculate a statisticii testului cuvaloarea critic (teoretic)
Exemplu
2/calculat tt
Exemplu n urma prelucrrii datelor privind veniturile familiilor dintr-o
regiune nregistrate la nivelul unui eantion de volum n=625,s-au obinut urmtoarele rezultate:
, s2= 4. S se testeze dac exist diferenelei.mil12x =semnificative ntre veniturile medii ale familiilor la nivelulpopulaiei din care a fost extras eantionul i venitul mediu pear, , considernd un risc de 5%.lei.mil130 =
6.2.2 Testarea ipotezelor asupra proporiei
Demersul testrii:a) Formularea ipotezelor statistice
00 :H pipi = 00
01 :H pipi
6.2.2 Testarea ipotezelor asupra proporiei
b) Alegerea pragului de semnificaie
c) Testul statistic
pt 0
=
pi
d) Regula de decizie
n/)p1(pp
t 0calculat
=
pi
6.3. Testarea ipotezelor privind doueantioane (cazul eantioanelor independente) n cazul eantioanelor independente, statistica test folosit n
testarea ipotezelor statistice este statistica Z sau t. Ipoteze statistice
Aplicarea testului presupune testarea egalitii varianelorpopulaiilor din care au fost extrase eantioanele (testulLevene).
0:H 210 =
0:H 211
6.3. Testarea ipotezelor privind doueantioane atunci cnd , statistica test este:2221
22
21
21calculat
n
's
n
's
xxt
+
=
atunci cnd , statistica test este:
21 nn
22
21 =
21p
21calculat
n
1n
1's
xxt
+
=
6.3. Testarea ipotezelor privind doueantioane unde:
2nn)1n('s)1n('s
's21
2221
21
p+
+=
Exemplu Pentru dou eantioane extrase aleator simplu de volum
n1=n2=625 persoane s-a nregistrat vrsta i s-au obinuturmtoarele rezultate:
;ani32x,ani35x 21 ==ani4's,ani2's 21 ==
6.3. Testarea ipotezelor privind doueantioane S se testeze ipoteza potrivit creia ntre vrstele medii ale
celor dou populaii din care au fost extrase eantioaneleobservate exist diferene semnificative. Se consider un riscde 0,05.
6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA)a) Obiectiv- procedeu de analiz a variaiei n funcie de sursa acesteia;- permite compararea mediilor a 3 sau mai multe grupe sau
populaii cu scopul de a verifica dac exist diferenepopulaii cu scopul de a verifica dac exist diferenesemnificative ntre acestea.
b) Condiii de aplicare- Condiia de independen- Condiia de normalitate- Condiia de homoscedasticitate
6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente
Se bazeaz pe descompunerea variaiei totale pe componente:- variaia explicat sau intergrupe (variaia sub influena
factorilor eseniali);- variaia rezidual sau intragrupe (variaia sub influena- variaia rezidual sau intragrupe (variaia sub influena
factorilor ntmpltori).
- La nivelul unui eantion: TSS=ESS+RSS.
RET VVV +=
6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA) Variaia total
Variaia explicat
Variaia rezidual
=n
ii xxTSS
2)(
==
n
ij xxESS
1
2)(
=jn k 2 Variaia rezidual
c). Ipoteze statistice:
kH === K210 :
diferitesuntpopulatiidouaputincelamediileH :1
== =
jn
1i
k
1j2
jij )xx(RSS
6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA)d. Statistica test Fisher
knVkV
FR
E
=
/1/
unde: k numrul grupelor.
6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA)e. Se alege pragul de semnificaie i se citete valoarea
critic a testul F din tabelul repartiiei Fisher, pentru risculadmis, i grade de libertate,
.
knvkv == 21 ,1
v,v,F
21 v,v,F
6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA)f. Calculul statisticii F:
1kkn
RSSESS
kn/RSS1k/ESSFcalculat
=
=
6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA)g. Regula de decizie: se respinge ipoteza nul
pentru riscul admis SigsauFF 21 v,v,calculat 0H
nu se respinge ipoteza nul SigsauFF 21 v,v,calculat 0H
6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA)
ANOVA
venitSum of
149.400 2 74.700 19.597 .00064.800 17 3.812
214.200 19
Between GroupsWithin GroupsTotal
Sum ofSquares df Mean Square F Sig.