Testul t pentru eşantioane independente · Interpretarea rezultatului la testul tpentru...

Post on 02-Sep-2019

5 views 0 download

transcript

Testul t pentru eşantioane independente

M. Popa

Model de cercetare inter-subiecţi

• testarea diferenţei dintre două eşantioane de subiecţi– diferenţa asumării riscului între bărbaţi şi femei– diferenţa dintre timpul de reacţie al celor care au

consumat o anumită cantitate de alcool faţă de al celor care nu au consumat alcool, etc.

• în astfel de situaţii– variabila dependentă (scală I/R)

• asumare riscului, timpul de reacţie

– variabila independentă (scală categorială dihotomică)• genul (M/F), consumul de alcool (DA/NU)

Temă de cercetare

• Un psiholog doreşte să probeze eficienţa trainingului autogen asupra performanţei în tragerea la ţintă cu arcul

• În acest scop:– alcătuieşte două grupe de sportivi (echivalenţi sub

aspectul gradului de antrenament)– cu un grup efectuează trainig autogen înainte de

tragere cu celalalt nu– se execută o sedinţă de tragere şi se înregistrează

performanţele sportivilor din fiecare grup

Variabilele cercetării

• v. independentă– trainingul autogen– scală nominală dihotomică (DA/NU)

• v. dependentă– performanţa de tragere– scală I/R (număr de punte)

Populaţiile cercetării

• dacă ipoteza cercetării este adevărată:– eşantionul fără training autogen face parte din

populaţia trăgătorilor fără training autogen– eşantionul cu training autogen face parte

populaţia trăgătorilor cu training autogen

POPULAŢIA 1

nepracticanţi training autogen

POPULAŢIA 2

practicanţi training autogen

eşantion 1

eşantion 3

eşantion 2

eşantion 1

eşantion 2

eşantion 3

m11-m21

m12-m22

m13-m23

populaţia de diferenţe dintre medii

eşantion k eşantion jm1k-m2j

Populaţia diferenţelor dintre medii

µ1- µ2=0

populaţia fără TA populaţia cu TA

m11 m12m11-m12

m21 m22

m21-m22

m31 m32

m31-m32

populaţia de nul

urmează distribuţia t

şi are media = 0

Procedura statisticăun test z(t) pentru diferenţa dintre medii,

similar testului z(t) pentru un singur eşantion

m

mz

σµ−

=m=m1-m2 µ1- µ2=0

Nm

σσ =

Nm

2σσ =

2

2

2

1

2

121

NNmm

σσσ +=−

21

2121 )()(

mm

mmz

−−−=

σµµ

2

2

2

1

2

1

21

NN

mmz

σσ+

−=

σ va fi estimat prin s

Variante de calcul

testul t pentru dispersii diferite

2

2

2

1

2

1

21

N

s

N

s

mmt

+

−=

2

*)1(*)1(

21

2

22

2

112

−+−+−

=NN

sNsNs c

Dispersia cumulată pentru diferența dintre medii

� controversată

� rezultatul nu urmează fidel distribuţia t

� s1 şi s2 se cumulează pentru a estima σ

� numitorul exprimă gradele de libertate

Exemplu de calcul

• Problema cercetării– Diferenţa dintre mediile celor două eşantioane

este are legătură cu practicarea TA sau este o variaţie întâmplătoare a mediei de eşantionare?

• Eşantioanele cercetării– 6 sportivi nepracticanţi de TA– 6 sportivi practicanţi de TA

• Ipoteza cercetării– bilaterală

• Practicarea TA este în relaţie cu performanţa de tragere la ţintă

– unilaterală• Practicanţii de TA obţin o performanţă la bună

decât nepracticanţii de TA

• Criteriile deciziei statistice

– alfa=0.05 , bilateral– df=(N1+N2)-2=(6+6)-2=10– t critic = ±2.228

2.5% 2.5%

t=-2.228 t=+2.228

Decizia statistică bilaterală

zona de respingere H0

zona de respingere H0

X1

15

9

12

13

16

15

X2

10

8

11

5

7

9

practicanţi TA („1”) ne-practicanţi TA („2”)

(X1-m1)2

2.78

18.74

1.76

0.10

7.12

2,78

(X2-m2)2

2.78

0,10

7.12

11.08

1.76

0.44

ΣΣΣΣ

N

m

50

6

m2=8.33

80

6

m1=13.33

1

)( 2

2

−=∑

N

mXs

i

66.65

28.332

1 ==s 66.45

28.232

2 ==s

23.2833.28

Calculăm t pentru dispersii cumulateeroarea standard a diferenţei

+

−+−+−

=2121

22

212

1 11

2

))(1())(1(

NNNN

sNsNsDIF

34.16

1

6

1

266

66.4*)16(66.6*)16(=

+−+−+−

=DIFs

73.334.1

33.833.1321 =−

=−

=Difs

mmttestul t

21

21

22

212

1

2

))(1())(1(

NN

NN

sNsN

sDIF+

−+−+−

=

m1-m2 0 tcritic=2.28 t=3.73

Decizia statistică

tcalculat (3.73) > tcritic (2.228 )

� Decizia cu privire la ipoteza de nul ?

� Concluzia cercetării?

Mărimea efectului

Indicele d (Cohen):

)1()1(

)1()1(

21

22

212

1

21

−+−∗−+∗−

−=

NN

sNsN

mmd

1.238.2

5

)16()16(

66.4)16(67.6)16(

33.833.13==

−+−∗−+∗−

−=d

Relaţia dintre practicarea TA şi performanţa de tragere este “importantă”, “mare”, “ridicată”

>0.80

m1-m2 0

Mărimea efectului

d=2.1

Nivelul de semnificație

Mărimea efectuluiSuficient de mare Prea mică

Acceptabil (p<0.05)

Inferența nu ridică probleme

Cercetarea SUSȚINEun rezultat care

NU ESTE IMPORTANT

Inacceptabil(p>0.05)

Cercetarea NU SUSȚINEun rezultat care

ESTE IMPORTANT

Inferențanu ridică probleme

Limitele de încredere ale diferenţei dintre

mediile a două populaţii

� punctul de estimare:� diferenţa dintre cele două medii m1-m2=13.33-8.33=5 puncte� diferenţa mediilor în populaţie se situează în jurul a cinci

puncte� limitele de variaţie a diferenţei dintre mediile populaţiilor, pentru un nivel de încredere de 95% (poate fi şi 99% sau 99.1%), bilateral

� stabilim valorile critice pentru t între care se află 95% dintre valorile distribuţiei, pentru df=10

� în exemplul dat acestea sunt, aşa cum am văzut deja, ±2.2281

( ) ( )21

2121

mms

mmt

−−−=

µµ

( ) ( ) 212121 * mmcrit stmm −=−−− µµ

( ) 212121 * mmcrit stmm −±−=− µµ

( ) 34.1*2281.233.833.1321 ±−=− µµ

0+7.985 limita superioară

+2.015limita inferioară

95% şanse ca diferenţa dintre medii să se afle

între aceste limite

Interpretarea rezultatului la testul t pentru

eşantioane independente

• Valoarea testului (t=3.73) nu are o relevanţă în sine– relevantă sunt probabilitatea asociată acestei valori (p<0.05),

mărimea efectului şi limitele de încredere

• Modelul de cercetare nu permite formularea unei concluzii în termenii unei relaţii cauzale– în acest scop se impune un model de cercetare experimentală

• O diferenţă semnificativă nu este similară cu existenţa unei diferenţe cu valoare practică. – Diferenţa dintre cele două loturi de sportivi (5 puncte), deşi

semnificativă statistic, poate fi prea mică pentru a justifica programul TA

– Într-o asemenea situaţie, studiul nu este lipsit de valoare dar concluziile sunt utile doar în plan teoretic.

Publicarea rezultatului(standard APA)

• sintetic:– mediile şi abaterile standard ale fiecărui eşantion– volumul eşantioanelor sau gradele de libertate– valoarea testului t– nivelul lui p– mărimea efectului

– limitele de încredere

• narativ:– „Sportivii care practică trainingul autogen au fost comparaţi cu

cei care nu practică. Primii au realizat o performanţă mai bună (m=13.33, σ=2.58) faţă de ceilalţi (m=8.33, σ=2.16), t(10)=3.65, p<0.05. Mărimea efectului este mare (d=2.1) iar limitele de încredere (95%) pentru diferenţa mediilor sunt cuprinse între 2.01 şi 7.98”.

Condiţiile în care putem calcula testul t pentru

eşantioane independente

• Eşantioane aleatoare (ideal)• Eşantioane independente• Variabila dependentă să se distribuie normal în

ambele populaţii– garantează că şi distribuţia diferenţelor dintre medii se distribuie

normal– totuşi, TLC permite asumarea normalităţii distribuţiei mediei de

eşantionare (N>30)– dacă analiza distribuţiilor indică forme aberante, se va alege

soluţia unui test neparametric– testele t sunt robuste la încălcarea condiţiei de normalitate

• Dispersia celor două eşantioane să fie omogenă– testul t poate fi aplicat strict în cazurile în care dispersiile celor două

populaţii („practicanţi”, „nepracticanţi”) au aceeaşi dispersie (omogenitatea dispersiei)

– există trei situaţii în care această condiţie nu trebuie să ne preocupe:• când eşantioanele sunt suficient de mari (cel puţin 100 fiecare)• când cele două eşantioane au acelaşi volum (N1=N2)• când dispersiile celor două eşantioane nu diferă semnificativ

Când se utilizează testul t pentru eşantioane independente?

• variabilă dependentă, măsurată pe o scală de interval/raport

• variabilă independentă măsurată pe scala de tip nominal (dihotomic)

• utilizarea testului t pentru eşantioane independente este frecventă

Sfârşit..............

df\p 0.40 0.25 0.10 0.05 0.025 0.01 0.005 0.0005

1 0.324920 1.000000 3.077684 6.313752 12.70620 31.82052 63.65674 636.6192

2 0.288675 0.816497 1.885618 2.919986 4.30265 6.96456 9.92484 31.5991

3 0.276671 0.764892 1.637744 2.353363 3.18245 4.54070 5.84091 12.9240

4 0.270722 0.740697 1.533206 2.131847 2.77645 3.74695 4.60409 8.6103

5 0.267181 0.726687 1.475884 2.015048 2.57058 3.36493 4.03214 6.8688

6 0.264835 0.717558 1.439756 1.943180 2.44691 3.14267 3.70743 5.9588

7 0.263167 0.711142 1.414924 1.894579 2.36462 2.99795 3.49948 5.4079

8 0.261921 0.706387 1.396815 1.859548 2.30600 2.89646 3.35539 5.0413

9 0.260955 0.702722 1.383029 1.833113 2.26216 2.82144 3.24984 4.7809

10 0.260185 0.699812 1.372184 1.812461 2.22814 2.76377 3.16927 4.5869

11 0.259556 0.697445 1.363430 1.795885 2.20099 2.71808 3.10581 4.4370

12 0.259033 0.695483 1.356217 1.782288 2.17881 2.68100 3.05454 4.3178

13 0.258591 0.693829 1.350171 1.770933 2.16037 2.65031 3.01228 4.2208

14 0.258213 0.692417 1.345030 1.761310 2.14479 2.62449 2.97684 4.1405

Tabelul t pentru probalităţile din dreapta curbei