Date post: | 25-Apr-2017 |
Category: |
Documents |
Upload: | florina-maria-savu |
View: | 297 times |
Download: | 6 times |
C3. Testarea ipotezelor statistice
Etapele verificării ipotezelor statistice
– Identificarea ipotezelor ce trebuie testate– Alegerea testului statistic– Specificarea nivelului de semnificaţie– Stabilirea regulii de decizie– Culegerea datelor şi realizarea calculelor– Luarea deciziei de respingere sau nu a ipotezei statisticeCondiţia esenţială: variabila urmează o repartiţie normală
• Ipoteză statistică = presupunerea (enunțul) formulat cu privire la parametrul unei repartiţii sau la legea de repartiţie pe care o urmează o variabilă aleatoare.
• Ipoteză nulă (H0) = ipoteza care se consideră a priori adevărată.
• Ipoteză alternativă (HA) = o ipoteză care contrazice ipoteza nulă.
Formele ipotezei nule H0 si ipotezei alternative HA
(exemplificare pentru compararea parametrului „media colectivităţii generale“ μ cu valoarea ipotetica μ0)
– test bilateral:
H0: μ = μ0
HA: μ ≠ μ0 (μ < μ0 sau μ > μ0)
– test unilateral dreapta:H0: μ ≤ μ0
HA: μ > μ0
– test unilateral stânga:H0: μ ≥ μ0
HA: μ < μ0
• Testul statistic: se calculează statistica testului și se compară cu valoarea teoretică (valoare critică) => decizia de a respinge sau nu ipoteza nulă H0.
• Regiunea critică: interval de valori delimitat de valoarea critică. Dacă valoarea calculată a testului statistic se află în regiunea critică, ipoteza H0 se respinge.
• Eroare de tip I = eroarea pe care o facem eliminînd o ipoteză nulă, deşi este adevărată. Probabilitatea (riscul) comiterii unei erori de tip I este α; – α se numeşte nivel sau prag de semnificaţie; – α trebuie să fie f. mic (α = 0,005; 0,01 etc)– P-value=cel mai mic nivel de semnificaţie la care
poate fi respinsă ipoteza nulă.
• Nivelul de încredere al unui test statistic este (1-α) -> în expresie procentuală, (1-α)100 reprezintă probabilitatea ca rezultatele să fie adevărate.
• Eroare de tip II = eroarea pe cere o facem acceptînd o ipoteză nulă, deşi este falsă.
• Probabilitatea (riscul) comiterii unei erori de tip II este β.
• Puterea testului statistic este (1-β).
TIPURI DE ERORI ÎN TESTAREA IPOTEZELOR STATISTICE
α = P(respingere H0 ׀ H0 este adevărată)=P(eroare de tip I)
β = P(acceptare H0 ׀ H0 este falsă)= P(eroare tip II)
Decizia de Ipoteza adevărată este:a accepta: H0 HA
H0
Decizie corectă(probabilitate 1-α)
Eroare de tip II(risc β)
HA
Eroare de tip I(risc α)
Decizie corectă(probabilitate 1-β)
Efectuarea testului statistic
• Condiţia esenţială în verificarea ipotezelor statistice este că variabila urmează o repartiţie normală
• Se extrage un eşantion aleator din respectiva populaţie
• Pe baza eşantionului se calculează valoarea estimatorului parametrului populaţiei de interes şi apoi valoarea testului
• Forma generală a testului statistic:
1: ( ,..., )nx x x
valoarea estimată - valoarea ipoteticăeroarea standard a estimatorului
Decizie: – dacă valoarea numerică a testului statistic cade în
regiunea critică (Rc), respingem ipoteza nulă şi acceptăm ipoteza alternativă. Această decizie este incorectă doar în 100 α % din cazuri;
– dacă valoarea numerică a testului nu se află în regiunea critică (Rc), nu se respinge ipoteza nulă H0.
I. Teste pentru media populaţiei: dispersia σ2 este cunoscută, n ≥ 30
Testul “z”
•Se formulează ipoteza
•Se extrage un eşantion aleator din populaţie și se calculează media
•Se calculează valoarea statisticii z:
•Se stabileşte pragul de semnificaţie α (de regulă 0,05)
•Se compară valoarea calculată z cu o valoare tabelată zα (valoare critică) şi se ia decizia de acceptare/respingere
0
/xz
n
1: ( ,..., )nx x xx
TESTIpoteza
nulă H 0
Ipoteza alternativă
H A Decizia
bilateral
≠
unilateral dreapta
unilateral stânga
/ 2 0
0
z z resping H
altfel accept H
0
0
z z resping Haltfel accept H
0
0
z z resping Haltfel accept H
Regiunea critică
μ μ μa) b) c)
Regiunea critică pentru: a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga
/ 2z / 2z z z
Exemplu
• Se știe că prețul mediu al unui apartament cu 2 camere în București este de 65000 euro, cu o abatere standard de 2000 euro.Din cercetările unei agenții imobiliare pe un eșantion de 36 apartamente reiese că în cartierul Aviației prețul mediu este 68000 euro.Se poate afirma, folosind o probabilitate de 95%, ca prețul mediu al unui apartament cu 2 camere în cartierul Aviației este semnificativ mai mare decât media capitalei?
Soluţie-testul z• Variabila de interes: X – prețul mediu al unui apartament cu
2 camere– presupunem o distribuţie normală • Dispersia populaţiei este cunoscută, deci aplicăm testul z.
Ipotezele (test unilateral dreapta):H0: μ ≤ μ0
H1: μ > μ0
• Pragul de semnificaţie: • Valoarea critică: z(0,05)=1,6
0.05 (5%)
200068000
650000
x
• Valoarea testului:
• Verificarea: z=9 > z(0,05)= 1,6 => respingem H0
=> acceptam HA : putem afirma cu probabilitatea de 95% că prețul mediu al unui apartament cu 2 camere în cartierul Aviației este semnificativ mai mare decât media capitalei.
9362000
6500068000
/z
II. Teste privind media populaţiei generale (μ) pentru eşantioane de volum redus şi dispersia σ2 necunoscută
0
/xts n
•Se estimează dispersia populaţiei cu dispersia de eşantion:
•Pentru esantioane de volum redus (n<30) aplică testul “t. Se calculează valoarea statisticii:
•Valorile critice se obtin din tabelele repartiţiei t (Student), în funcţie de nivelul de semnificaţie α ales, cu n-1 grade de libertate
2
2 1
( )
1
n
ii
x xs
n
Regiunea critică-testul t
μ μ μa) b) c)
Regiunea critică pentru a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga
/ 2; 1nt / 2; 1nt ; 1nt ; 1nt
Exemplul 1 – testul t
Volumul unei cutii de bere este de 0.33 litri. Pentru a verifica acest lucru se selectează aleator un eşantion de 16 cutii. În urma prelucrării datelor, s-au obţinut următoarele rezultate:
Confirmă datele corectitudinea îmbutelierii? Folosiţi un nivel de încredere de 95%.
1
2
1
5.25
( ) 23.04
n
ii
n
ii
x
x x
• Variabila de interes: X – volumul unei cutii de bere – presupunem o distribuţie normală
• Dispersia populaţiei este necunoscută - poate fi estimată prin dispersia esantionului:
• Volumul mediu ipotetic: • Volumul mediu din eşantion:
• Pragul de semnificaţie:
0 0.33
1 0.328
n
ii
xx
n
0.05 (5%)
2
2 1
( )23.04 1.536
1 15
n
ii
x xs
n
• Ipotezele:
• Valoarea critică:
• Valoarea testului:
• Verificarea:
• Decizia : nu sunt suficiente motive pentru a respinge ipoteza nulă (cu probabilitatea 95% sau cu riscul de a greși de 5%) .
0 0
0
::A
HH
/ 2; 1 0.05/ 2;15 2.48 ( , 1)nt t TINV n
0 0.382 0.33 0.00038/ 1.24 / 16x
ts n
/ 2; 10.00038 2.48nt t
Ex. 2. Conducerea unei companii apelează la 5 experţi pentru a previziona profitul în anul curent. Valorile estimate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (mil lei, preţurile anului anterior). Ştiind că profitul companiei în anul anterior a fost de 1,9 mil. lei, media previziunilor experţilor este semnificativ mai mare decât profitul anului anterior (pentru α = 0,1)?
Rezolvare. Media previziunilor experţilor este mil. lei, cu dispersia:
şi abaterea medie pătratică:
Folosim testul t.
63,2x
55070
42032
1
2
2 ,,
n
xxs i
7402 , ss
Testarea ipotezei statistice:H0: μ ≤ 1,9
H1: μ > 1,9 (test unilateral dreapta).
Regiunea critică: t > tα;n-1 = t0,1;4 = 2,132
Cum t=2,206 < t0,1;4 = 2,132, respingem ipoteza nulă => acceptam că
media previzionată este semnificativ mai mare decât profitul anului trecut.
2062574091632 ,
/,,,
ns
xt
x