Post on 06-Jul-2018
transcript
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
1/21
TESTAREA IPOTEZELOR
STATISTICE Călinici Tudor
OBIECTIVE EDUCAŢIONALE
Definirea conceptului de test statistic
Prezentarea etapelor unui test statistic
Prezentarea şi exemplificarea testelor de tip Z
pentru comparația mediilor
Prezentarea și exemplificarea testelor de tip Tpentru comparația mediilor
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
2/21
IPOTEZE
Formularea de noi ipoteze (sau modele sau teorii)este una dintre cele mai importante aspecte alecercetării ştiinţifice. Aceste ipoteze încercă să descrie sau să explice anumite fenomene reale. Inmulte cazuri există ipoteze anterioare (descrierisau explicaţii) pe care oamenii de ştiinţă dorescsă le înlocuiască cu altele noi
Pentru a fi valabile, ipotezele trebuie să fietestate
POPULAŢIE - EŞANTION
Atunci cînd o investigaţie de tip statistic se efectuează pe
un eşantion, orice rezultat obţinut are o valoare relativă,
în sensul că datele respective nu numai că nu coincid cu
cele referitoare la populaţie, dar nici măcar nu se poate
afirma cu certitudine care este diferenţa dintre cele douăgenuri de date, de vreme ce starea populaţiei este, de
regulă, necunoscută.
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
3/21
IPOTEZA STATISTICĂ
Prin urmare, asupra populaţiilor studiate selectiv nu se
pot emite judecăţi cu valoare de certitudine, ci se pot
exprima nişte supoziţii care poartă denumirea de ipoteze
statistice.
Testarea ipotezelor statistice înseamnă
supunerea ipotezelor unor probe, numite teste statistice,
operaţie în urma căreia ipoteza se respinge sau se
acceptă. O asemenea decizie are întotdeauna la bază calculul intervalului de confidenţă ce corespunde unui
prag de semnificaţie ales
TEST STATISTIC - CONCEPT
Testarea unei ipoteze statistice se face princompararea a două ipoteze concurente: Ipoteza nulă – modelul pe care cercetătorul doreşte
să îl înlocuiască Ipoteza alternativă – noul model, menit să
înlocuiască ipoteza nulă
Exemplu de ipoteză statistică: Populaţia X estediferită de populaţia Y din punct de vedere al ...
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
4/21
SCOPUL TESTULUI STATISTIC
Scopul testului statistic este de a dovedi căipoteza nulă este falsă.
Rezultatul testului Nu putem afirma că acceptăm ipoteza nulă O putem sau nu nega
ETAPELE UNUI TEST STATISTIC
Definirea ipotezelor
Alegerea unui parametru Alegerea unui prag de semnificaţie Alegerea unei regiuni critice
Calcularea valorii observate a parametrului
Luarea deciziei
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
5/21
FORMULAREA PROBLEMELOR ÎN TERMENII IPOTEZELOR STATISTICE
Definirea ipotezei nule – testul se desfăşoară subprezumţia că ipoteza nulă ar fi adevărată
Definirea diferenţei alternative - numită şi ipoteză delucru – contrazice ipoteza nulă
ALEGEREA PARAMETRULUI STATISTIC AL TESTULUI
Parametrul statistic al testului exprimă într-oanumită formă diferenţa dintre elementelecomparate.
Conceptual, parametrul testului este o variabilăaleatoare de selecţie care urmează o anumitălege de probabilitate
Este specific fiecărui test statistic în parte
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
6/21
ALEGEREA PRAGULUI DE SEMNIFICAŢIE
Pragul (nivelul) de semnificaţie reprezintă mărimea riscului de eroare pe care cercetătorul este dispus să îl accepte, implicit să şi-l asume
De obicei se alege un nivel de semnificaţie între 1şi 5%
ALEGEREA REGIUNII CRITICE
Regiunea critică este un interval sau o reuniunede intervale care specific atât de testului statisticcât şi de nivelul de semnificaţie ales
(-, -Z]
[Z
, +
) (-, -Z
] [Z
, + )
Constanta Z se obţine din tabelele teoretice
(cunoscute)
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
7/21
C ALCULAREA PARAMETRULUI
Se calculează valoarea parametrului definit anteriorpe baza datelor de cercetare
LUAREA DECIZIEI CU AJUTORUL REGIUNII CRITICE
H0 este respinsă dacă valoarea parametrului aparţineregiunii critice. În acest caz ipoteza alternativă va fiacceptată, cu un risc de eroare
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
8/21
CONCLUZIE
Prin respingerea ipotezei nule cercetătorul afirmă că rezultatele observate nu sunt datorateîntâmplării = efect semnificativ
Când ipoteza nulă nu este respinsă cercetătorul afirmă că diferenţele observate sunt datorateîntâmplării şi rezultatele nu sunt semnificative
SEMNIFICAŢIA STATISTICĂ
P – Probability
Nivelul minim de semnificaţie - teoretic - pentrucare se poate respinge ipoteza nulă
Este specific aplicării testelor cu ajutorulsoftware-ului statistic
P nu reprezintă probabilitatea ca ipoteza nulă săfie adevărată!
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
9/21
INTERPRETAREA VALORII P
0,01≤ p ≤ 0,05 – rezultate semnificativ statistice 0,001≤ p < 0,01 – rezultate înalt semnificativ
statistice p0,05 – rezultate nesemnificativ statistice 0,05< p ≤ 0,1 – tendinţă către semnificaţie
statistică
CONCLUZIE TEST STATISTIC ÎN FUNCŢIE DE SEMNIFICAŢIA STATISTICĂ
Ipoteza nulă poate fi negată dacă rezultatul testuluiare cel puţin semnificaţie statistică
Dacă rezultatul testului nu are cel puţin semnificaţie statistică, ipoteza nulă nu poate fi negată
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
10/21
ERORI ÎN TESTELE STATISTICE
Adevăr
H0 adevăratăH0Falsă
Rezultat
H0 serespinge
Eroare tip I(α)
Corect
H0 nu serespinge
Corect Eroare tip II(β)
EROAREA DE TIP I
= H0 este respinsă deşi este adevărată Am concluzionat că există reale diferenţe deşi acestea
sunt datorate şansei Concluzionăm că un tratament este eficient pe baza
unei interpretări greşite
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
11/21
EROAREA DE TIP II
= H0 este nu este respinsă deşi este falsă Am concluzionat că există diferenţele observate
sunt datorate şansei atunci când acestea apardatorită diferenţelor dintre eşantioane
Am putea abandona un tratament pe care tocmaiîl testăm sau o direcţie de cercetare
“Puterea testului” = 1-probabilitatea apariţieiunei erori de tip II
TEST STATISTIC – MANOPERĂ TEORETICĂ
Ca realizare, un test statistic constă în calculareaunei valori specifice testului (notată cu z, t, F, chi2 etc)cu ajutorul datelor de cercetare, valoare ce se compară
apoi cu valorile „critice", aflate într-un tabel (valoricunoscute), şi se decide dacă ipoteza nulă se respingesau nu.
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
12/21
TEST STATISTIC – MANOPERĂ ÎN PRACTICĂ
Se utilizează un software statistic, se alege testulstatistic corespunzător şi se interpretează rezultatul
TESTE STATISTICE - CLASIFICĂRI
Parametrice – de semnificaţie Pentru indicatori ai caracteristicilor cantitative –
medie, variaţie, coeficient de corelaţie, abaterestandard, etc.
Neparametrice – de concordanţă Pentru caracteristici calitative – distribuţii de
frecvenţe, coeficienţi de asociere
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
13/21
TESTE PARAMETRICE
Variabile cantitative – comparaţii de medii
Conceptul de comparaţie este diferit în funcţie dedomeniul de aplicare
Test unilateral, test bilateral
MODEL TEORETIC
Avem dovezi să afirmăm că două populații suntdiferite din punct de vedere al unui parametru – cantitativ
Se poate formula ipoteza ca “din punct de vedereal respectivului parametru, populațiile suntdiferite” sau ” în prima populație parametrul
respectiv este mai mare decât în a doua”
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
14/21
IPOTEZELE STATISTICE
Ipoteza H0 – nu există diferenţă semnificativstatistică între cele două medii
Ipoteza alternativă test bilateral H1 – cele douămedii sunt semnificativ diferite
Ipoteza alternativă test unilateral H1 – unadintre medii este semnificativ mai mare decâtcealaltă
IPOTEZE STATISTICE – FORMULARE MATEMATICĂ
0: :00
B A B A
H sau H
0: :11
B A B A
H sau H
0: :11
B A B A
H sau H
0: :11
B A B A
H sau H
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
15/21
REGIUNE CRITICĂ
Pentru test bilateral – reuniune de intervale(-, -Z
] [Z
, + )
Pentru testul unilateral(-, -Z
] sau [Z
, + ) – în funcţie de direcţia de
comparaţie
C ATEGORII TESTE PARAMETRICE
Teste de tip Z
Teste de tip T
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
16/21
TESTE DE TIP Z
Condiţii de aplicare
Populaţie normal distribuită Variaţia în populaţie este cunoscută, sau cel puţin
poate fi estimată Eşantioane mari – mai mari de 30 de persoane
TIPURI DE TESTE Z
Comparaţia mediei unui eşantion cu media uneipopulaţii
Comparaţia mediilor a două populaţii
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
17/21
EXEMPLU 1
Se cunoaşte că media taliei normale a nou-născuţilor la termen este de 51 cm. Pe uneşantion reprezentativ de 49 nou-născuţi prematur se observă o medie a taliei de 45 cm cuo variaţie de eşantionare egală cu 9. Diferenţaîntre cele două medii este semnificativă? Adică, se poate afirma că prematurii se nasc cu o taliemai mică decât nou-născuţii la termen?
REZOLVARE (1)
Ipoteza nulă H 0 : In ceea ce priveşte talia lanaştere nu există o diferenţă semnificativă întretalia prematurilor şi cea a nou născuţilor latermen.
Ipoteza alternativă H 1: In ceea ce priveşte talia lanaştere EXISTĂ o diferenţă semnificativă între
talia prematurilor şi cea a nou născuţilor latermen.
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
18/21
REZOLVARE (2)
Parametrul testului este
U=
Alegem pragul de semnificaţie α = 0,05, regiuneacritică va fi (-, -1,96] [1,96, + )
n
m
REZOLVARE (3)
Pentru datele de cercetare parametrul U are valoarea
=51 − 45
9
49
=67
9 = 4,66
4,66>1,96, deci U aparţine regiunii critice, deci ipotezanulă H0 se poate respinge cu un risc de eroare de speţaI < 0,05
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
19/21
CONCLUZIE
Talia prematurilor este în medie semnificativ
diferită (mai mică) decât cea a nou născuţilor la
termen. Afirmând acest lucru există o
probabilitate mai mică de 5% de a face o eroare.
EXEMPLU 2
Se doreşte să se studieze dacă există diferenţă semnificativ statistică între nivelul seric almagneziului la persoanele emigrate dinRepublica Moldova în România. Se cunoaşte faptul că nivelul seric al magneziului urmează legea normală cu o variaţie de 1 mg/100ml lapersoanele din România, respectiv cu o variaţie de 2,3/100ml la persoanele din Moldova.
Nivelul mediu al magneziului seric, obţinut la uneşantion de 120 de persoane din România a fost 2mg/100 ml în timp ce la măsurătorile pe un grupde 80 de persoane emigrate din RepublicaMoldova a rezultat un nivel mediu de2,5mg/100ml
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
20/21
REZOLVARE (1)
Ipoteza nulă H 0 : In ceea ce priveşte nivelul serical magneziului la persoanele emigrate dinRepublica Moldova în România nu există diferenţă semnificativ statistică faţă depersoanele născute în România
Ipoteza alternativă H 1: In ceea ce priveşte nivelulseric al magneziului la persoanele emigrate dinRepublica Moldova în România EXISTĂ diferenţă semnificativ statistică faţă de
persoanele născute în România
REZOLVARE (2)
În acest caz parametrul este
= −
+
Alegem pragul de semnificaţie α = 0,05, regiunea critică vafi (-, -1,96] [1,96, + )
8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie
21/21
REZOLVARE (3)
Utilizând datele de cercetare obţinem
=2 − 2,5
1
120 +
2,3
80
= −2,59
-2,59