+ All Categories
Home > Documents > sp 12Teste statistice pentru date ordinale

sp 12Teste statistice pentru date ordinale

Date post: 09-Apr-2018
Category:
Upload: cella-dan
View: 224 times
Download: 0 times
Share this document with a friend
17
TESTE STATISTICE PENTRU DATE ORDINALE Lect.univ. dr. Gh. Perţea Testele statistice pentru date ordinale se utilizează în următoarele situaţii: a) Atunci când variabila dependentă este exprimată pe scală de tip ordinal. În acest caz valorile nu au proprietăţi de interval, dar exprimă poziţia fiecăreia în raport cu cealalt ă.  b) Atunci când variabila dependentă este măsurată pe scală de interval/raport, dar distribuţ ia ei nu respect ă condi ţ iile impuse de testele parametrice. În aceast ă situaţ ie se efectuează transformare de rang, adică înlocuieşte fiecare valoare a distribuţiei cu poziţia  pe ca re o are în cad rul distrib uţi ei, su b asp ect ul ord inii de măr ime. Nou a dis trib uţie rezultată poate fi supusă analizei statistice cu teste neparametrice ordinale. Având în vedere modelele de cercetare la care ne-am raportat până acum, vom regăsi, pentru fiecare dintre ele, teste statistice pentru date ordinale, după cum urmează: Testul Mann-Whitney (U) pentru două eşantioane independente 1 Să luăm în considerare următoarea problemă: un psiholog care lucrează într-o mare bancă doreşte să vadă dacă exist ă o diferenţă între premiile băneşti anuale primite de feme ile şi bărbaţ ii anga jaţi ai bănc ii. În tabelele de mai jos se află nivel urile primelor şi rangu rile acestora în raport cu întreaga distribuţie a primelor, indiferent de sex. Problema este una tipică pentru a fi rezolvat ă cu testul t al diferenţ ei dintre mediile a două eşa nti oa ne ind epe nde nte . Ave m o var iab il ă ind epe ndent ă de tip nom ina l- dihotomic şi una dependentă, de tip interval/raport. Din păcate, analiza preliminară a variabilei dependente („primă”) relevă abateri mari de la condiţiile de normalitate (un indice de boltire, kurtosys, de peste 7) precum şi o slabă reprezentativitate a mediei, ambele datorate, mai ales, prezenţei unei valori extreme (o primă de 200 mil. lei). După ce verificăm corectitudinea valorii respective, ajungem la concluzia că ea nu poate fi eliminată şi, ca urmare, nu este recomandabilă utilizarea unui test parametric. Într-o situaţie de acest gen este aplicabil testul „Mann-Whitney U” pentru date ordinale. Pe ultima coloană a fiecărui tabel găsim transformarea în ranguri a valorilor varia bilei dep endente. Atri bui rea ran gur ilo r în mod descrescă tor sau crescă tor est e nerele vantă . Dacă toate valorile sunt distincte, fiecare valoare primeşte un rang distinct. Atunci când există valori identice, valorile respective primesc un rang egal cu media arit meti că a rangurilor cuvenite. Se poate ale ge şi so luţ ia atr ibuirii tut uro r val ori lor identice primul rang cuvenit (r anguri ex aequo). 1 Desemna t uneori şi sub numele „Wilcoxon-Mann-Withney” , sau „testul U”
Transcript
Page 1: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 1/17

TESTE STATISTICE PENTRU DATE ORDINALE

Lect.univ. dr. Gh. Perţea

Testele statistice pentru date ordinale se utilizează în următoarele situaţii:

a) Atunci când variabila dependentă este exprimată pe scală de tip ordinal. Înacest caz valorile nu au proprietăţi de interval, dar exprimă poziţia fiecăreia în raport cucealaltă.

 b) Atunci când variabila dependentă este măsurată pe scală de interval/raport,dar distribuţia ei nu respectă condiţiile impuse de testele parametrice. În această situaţie seefectuează transformare de rang, adică înlocuieşte fiecare valoare a distribuţiei cu poziţia

 pe care o are în cadrul distribuţiei, sub aspectul ordinii de mărime. Noua distribuţierezultată poate fi supusă analizei statistice cu teste neparametrice ordinale.

Având în vedere modelele de cercetare la care ne-am raportat până acum, vomregăsi, pentru fiecare dintre ele, teste statistice pentru date ordinale, după cum urmează:

Testul Mann-Whitney (U) pentru

două eşantioane independente1

Să luăm în considerare următoarea problemă: un psiholog care lucrează într-omare bancă doreşte să vadă dacă există o diferenţă între premiile băneşti anuale primite defemeile şi bărbaţii angajaţi ai băncii. În tabelele de mai jos se află nivelurile primelor şi

rangurile acestora în raport cu întreaga distribuţie a primelor, indiferent de sex.Problema este una tipică pentru a fi rezolvată cu testul t al diferenţei dintre mediile a

două eşantioane independente. Avem o variabilă independentă de tip nominal-dihotomic şi una dependentă, de tip interval/raport. Din păcate, analiza preliminară avariabilei dependente („primă”) relevă abateri mari de la condiţiile de normalitate (unindice de boltire, kurtosys, de peste 7) precum şi o slabă reprezentativitate a mediei,ambele datorate, mai ales, prezenţei unei valori extreme (o primă de 200 mil. lei). Dupăce verificăm corectitudinea valorii respective, ajungem la concluzia că ea nu poate fieliminată şi, ca urmare, nu este recomandabilă utilizarea unui test parametric.

Într-o situaţie de acest gen este aplicabil testul „Mann-Whitney U” pentru dateordinale. Pe ultima coloană a fiecărui tabel găsim transformarea în ranguri a valorilor 

variabilei dependente. Atribuirea rangurilor în mod descrescător sau crescător estenerelevantă. Dacă toate valorile sunt distincte, fiecare valoare primeşte un rang distinct.Atunci când există valori identice, valorile respective primesc un rang egal cu mediaaritmetică a rangurilor cuvenite. Se poate alege şi soluţia atribuirii tuturor valorilor identice primul rang cuvenit (ranguri ex aequo).

1 Desemnat uneori şi sub numele „Wilcoxon-Mann-Withney”, sau „testul U”

Page 2: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 2/17

Masculin2 „Premiu”(mil. lei)

Rang„premiu”

1 9 261 34 221 35 21

1 43 18.51 56 141 61 121 62 111 64 101 67 91 67 91 70 71 75 61 80 51 87 41 88 31 110 21 200 1nA=17 ΣR  A=180.5

Feminin „Premiu”(mil. lei)

Rang„premiu”

2 3 272 17 252 26 24

2 32 232 36 202 43 18.52 44 172 47 162 51 152 59 13

nB=10 ΣR  B= 198.5

astfel: Procedura de calcul:Se calculează două valori U, corespunzătoare grupurilor A (masculin) şi B(feminin),

unde:nA şi nB reprezintă volumul celor două grupuri independente care

compun eşantionul

ΣR A şi ΣR B reprezintă suma rangurilor pentru fiecare din cele două grupuri

Vom observa că expresia din mijlocul formulei exprimă chiar suma rangurilor dela 1 la nA, respectiv, de la 1 la nB. Dacă, de exemplu, toate rangurile grupului A ar fi maimici decât ale grupului B (fără nici o suprapunere între valorile celor două grupuri),atunci acest termen al formulei ar fi egal cu ΣR A, iar UA ar fi egal cu nA*nB. În acest cazUB ar fi egal cu 0, deoarece

2 Valoarea “1” este un cod numeric convenţional asociat genului masculine, iar “2” uncod convenţional pentru genul feminine. Utilizarea lor aici are doar scopul de a sugera că“genul” este variabila independentă a cercetării şi primeşte două valori. Atunci când se vautiliza un program statistic pentru calcularea testului, variabila independentă va trebui săfie creată, cu valorile aferente, ca în acest exemplu.

respectiv,

Page 3: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 3/17

UA+UB=nA*nB. Dacă însă rangurile unui grup tind să se grupeze spre zona superioară(sau inferioară), atunci valoarea U a acelui grup va fi cu atât mai mare (sau mai mică)decât nA*nB. Pe această particularitate se bazează evaluarea semnificaţiei diferenţei dintrerangurile celor două grupuri.

Pentru exemplu nostru:

Valoarea testului Mann-Whitney este dată de valoarea U cea mai mică, în cazulnostru UB (26.5).

Decizia statistică se ia prin compararea valorii U celei mai mici cu valoarea

citită în tabelul valorilor critice pentru testul Mann-Whitney U, în funcţie de nivelul alfa,nA şi nB (Anexa 7 ).Practic, în cazul testului U decizia statistică se ia astfel:

• Se respinge ipoteza de nul dacă valoarea U calculată este mai mică sauegală cu valoarea critică tabelară.

• Se acceptă ipoteza de nul dacă valoarea U calculată este mai mare decâtvaloarea critică tabelară.

Logica acestei decizii pare să fie contrară raţionamentului aplicat în cazul altor teste statistice, unde, pentru a respinge ipoteza de nul, trebuie să avem o valoarecalculată mai mare decât cea critică. Să ne gândim însă că în cazul testului Mann-Whitney considerăm drept valoare calculată una dintre cele dintre două valori U, şi

anume pe aceea care este mai mică. Ipoteza de nul afirmă că cele două sume ar trebui săfie egale, dacă diferenţa dintre suma rangurilor celor două eşantioane comparate ar finesemnificativă. Cu cât una dintre valorile U calculate, este mai mică, cu atât cealaltăsumă este mai mare. În consecinţă, o valoare U calculată mai mică sau egală cu U critic,

 justifică respingerea ipotezei de nul.

În general, tabelele de decizie pentru testul Mann-Whitney nu acoperă decât parţial situaţiile posibile şi nu trec de valori ale lui nA şi nB mai mari de 20. Pentruexemplul nostru valoarea critică corespunzătoare pentru U0.05;17:10=48 (dacă preferămaproximarea, mai conservatoare, nA=18).

Deoarece UB<U0.05;17:10 ipoteza de nul se respinge şi se acceptă ipoteza cercetării. Caurmare, concluzia cercetării este aceea că nivelul primelor anuale este semnificativ diferit

 pentru bărbaţi faţă de femei3

.Afirmam mai sus că tabelele statistice pentru testul Mann-Whitney U nu sereferă la grupuri mai mari de 20. Aceasta deoarece, de la acest volum în sus, distribuţiavalorilor testului poate fi aproximată de curba normală z, iar testul poate fi calculat cuformula următoare:

3 Desigur, nu se poate invoca neapărat o discriminare de sex în acordarea primelor dacă poziţiile profesionale ocupate de subiecţii cercetării sunt diferite. Rezultatul poate sugera,însă, că bărbaţii ocupă poziţii profesionale mai înalte decât femeile.

res ectiv,

Page 4: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 4/17

Page 5: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 5/17

Testul Kruskal-Wallis pentru mai mult de

două eşantioane independente

Pentru evaluarea diferenţei la nivel de ranguri între mai mult de două eşantioaneindependente se utilizează testul Kruskal-Wallis. Acesta poate fi asimilat unei analize de

varianţă pentru date ordinale.Să presupunem că dorim să vedem dacă există diferenţe în abilitatea de arezolva o sarcină de reprezentare spaţială la trei categorii profesionale aeronautice,

 piloţi (grup 1), controlori de trafic aerian (grup 2) şi navigatori de bord (grup 3). Înacest scop a fost aplicat un test de reprezentare spaţială unui număr de şase piloţi, treicontrolori de trafic şi patru navigatori de bord. Rezultatul este unul numeric (scorul latest), dar, dat fiind numărul foarte mic al subiecţilor, aplicarea testului ANOVA estenepotrivită. Ca urmare, alegem soluţia conversiei rezultatelor în valori de rang (pentrutoate grupurile luate împreună) şi utilizăm un test pentru date ordinale. Datele pentruacest exemplu sunt prezentate în tabelul următor:

Grup

 profesion

Scor reprez.

rang spaţială1 23 21 16 61 15 71 10 111 9 121 21 32 18 52 14 82 11 103 25 1

3 19 43 13 93 7 13

Tabelul prezintă datele cercetării. Variabila „grup” este una de tip nominal,fiecare din cele trei grupuri fiind codificat cu o valoare convenţională (1=pilot,2=controlor de trafic, 3=navigator de bord). Variabila „scor reprez.spaţială”, este de tipnumeric şi reprezintă scorul la test. Variabila „rang” conţine poziţia a fiecărui subiect subaspectul reprezentării spaţiale, în raport cu toate valorile înregistrate.

Formula de calcul pentru testul Kruskal-Wallis (notat cu H) este următoarea:

unde:

Page 6: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 6/17

H este valoarea calculată a testului K-W N este volumul total al eşantionuluin este volumul grupurilor (N=n1+n2+n3+...+nk )K este numărul grupurilor independenteT este suma rangurilor care va fi calculată pentru fiecare grup

Page 7: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 7/17

Valorile distribuţiei de nul ale lui H urmează forma distribuţiei chi-pătrat care,ne amintim, are originea în valoarea 0. Cu cât sumele rangurilor pentru cele k grupurisunt mai diferite între ele, cu atât valoarea testului este mai mare şi, potenţial, maiaproape de o variaţie semnificativă. Diferenţele mici dintre rangurile grupurilor conducspre valori ale testului care tind spre 0 şi, implicit, nesemnificative. Valoarea critică atestului se citeşte din tabelul distribuţiei chi-pătrat pentru df=k-1. Există totuşi o excepţie,atunci când nici unul din grupurile comparate nu este mai mare de 6, situaţie în caredecizia se ia cu ajutorul unei tabele speciale. În cazul nostru există un grup cu mai multde cinci subiecţi. Ca urmare, scorul critic pentru alfa=0.05 şi 2 grade de libertate este5.99. Deoarece H calculat este mai mic decât H critic, suntem nevoiţi să acceptămipoteza de nul şi să concluzionăm că cele trei categorii de subiecţi nu sunt diferite subaspectul capacităţii de reprezentare spaţială.

EXERCIŢII

Având în vedere faptul că volumul foarte redus al eşantionului (N=6), analizaţi prin intermediul testului Kruskal-Wallis datele temei pe care aţi avut-o la testul ANOVA.

Un psiholog trebuie să recomande unui patiser culoarea glazurii pentru un noutip de prăjitură, având de ales între verde, roşu şi galben. În acest scop alege 18 subiecţi,cărora le cere să efectueze o sarcină plictisitoare având la îndemână platouri cu prăjituriglazurate. Subiecţii sunt împărţiţi în trei grupe, fiecare primind prăjituri de o singurăculoare. După un timp, numără câte prăjituri a mâncat fiecare subiect din cele trei grupurişi construieşte tabelul următor.

Verde Roşu Galben3 3 27 4 01 5 40 6 69 4 42 6 1

Care este valoarea testului şi ce decizie ia cercetătorul?

Înlocuind valorile cores unzătoare exem lului, ob inem:

Page 8: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 8/17

Testul Wilcoxon pentru două

eşantioane perechi

Dacă avem subiecţi evaluaţi de două ori, pe o scală de interval, iar variabilelenu întrunesc condiţiile pentru utilizarea testului t al diferenţelor pentru eşantioane

dependente, se poate apela la testul Wilcoxon. Acesta este un test care, deşi se aplică pescale de interval/raport, utilizează proceduri de tip neparametric, apelând la diferenţeledintre valorile perechi şi la ordonarea lor. Este, din acest punct de vedere, un test dedate ordinale.

ExempluUn psiholog evaluează frecvenţa conduitelor agresive după prezentarea unui film

care are incluşi stimuli subliminali cu semnificaţie agresivă. Frecvenţa conduitelor agresiveeste măsurată înainte şi după vizionarea filmului. Rezultatele sunt sintetizate în tabelulurmător.

Cod

Subiect

„Înainte” „După” „după”-„înainte” Modulul

diferenţei

Rangul

diferenţei

Semnul

Diferenţei1 9 8 -1 1 7.5 -2 14 17 3 3 5.5 +3 10 17 7 7 2.0 +4 11 12 1 1 7.5 +5 12 15 3 3 5.5 +6 9 13 4 4 3.5 +7 10 14 4 4 3.5 +8 14 2 -12 12 1.0 -

Coloanele tabelului prezintă etapele procedurii de calcul:• se calculează diferenţa dintre variabilele supuse testării•

dacă sunt diferenţe nule, se elimină• se iau în considerare diferenţele în valoare absolută• se construiesc rangurile pentru diferenţele în valoare absolută• se marchează semnul diferenţelor pentru fiecare pereche de valori

Din acest punct calcularea valorilor testului este simplă. Se calculează douăvalori T, astfel: T(-), prin însumarea rangurilor diferenţelor negative, şi T(+), prinînsumarea rangurilor diferenţelor pozitive. Valoarea cea mai mică dintre ele este rezultatultestului Wilcoxon, al cărui nivel de semnificaţie se află prin compararea cu valorile criticedintr-o tabelă specială (Anexa 8), în funcţie de nivelul alfa ales şi de volumul eşantionului(N). Testul se fundamentează pe ideea că atunci când ipoteza nulă este adevărată, ar trebuica suma rangurilor pentru diferenţele pozitive să fie egală cu suma rangurilor pentru

diferenţele negative. Pe măsură ce diferenţa dintre cele două sume este mai mare, neîndepărtăm de condiţia ipotezei de nul.Decizia statistică pentru acest test se ia în felul următor:

• atunci când valoarea calculată este mai mică sau egală decât valoareacritică tabelară, ipoteza de nul se respinge, iar ipoteza cercetării seconfirmă;

• atunci când valoarea calculată este mai mare decât valoarea criticătabelară, ipoteza de nul se acceptă, iar ipoteza cercetării nu se confirmă.

Logica acestei decizii este similară celei aplicate în cazul testului Mann-Whitney. Valoarea calculată a testului este valoarea T cea mai mică, fie cea pozitivă,fie cea negativă. Ipoteza de nul afirmă că cele două sume ar trebui să fie egale, dacă

diferenţa dintre prima şi a doua măsurare ar fi nesemnificativă. Cu cât una dintre valorileT calculate, fie cea cu plus, fie cea

Page 9: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 9/17

cu minus, este mai mică, cu atât cealaltă sumă este mai mare. În consecinţă, un Tcalculat mai mic sau egal cu T critic justifică respingerea ipotezei de nul.

Pentru exemplul nostru, T(+)=28.5 iar T(-)=8.5. Acesta din urmă devinerezultatul testului. Valoarea calculată (8.5) este mai mare decât valoarea critică (4)

 pentru N=8 şi alfa=0.5 bilateral. Ca urmare, suntem nevoiţi să acceptăm ipoteza de nul,considerând neconfirmată ipoteza cercetării. Concluzia cercetării, pentru exemplul dat,este aceea că datele studiului nu confirmă existenţa unei relaţii între prezenţa stimulilor subliminali şi frecvenţa conduitelor agresive, după vizionarea filmului.

Aproximarea normală a distribuţiei testului Mann-Whitney

Ca şi în cazul testului Mann-Whitney, pentru eşantioane mai mari de 20 distribuţiade nul a testului Wilcoxon poate fi aproximată prin distribuţia normală. Formula de calcul

 pentru acest caz este următoarea:

Exceptând situaţiile în care se operează pe eşantioane mici, ca în exemplul de maisus, calculele sunt destul de laborioase. Din fericire, toate programele avansate destatistică oferă proceduri pentru calcularea automată a acestor teste statistice.

Consideraţii finale

Atunci când rezultatul testului este semnificativ, enunţarea concluziei şiinterpretarea rezultatului vor ţine cont de modul de atribuire a rangurilor, cu alte cuvinte,dacă rangul 1 a fost atribuit valorii celei mai mari, sau celei mai mici.

O problemă apare atunci când există diferenţe egale cu zero între rangurile perechi(valori de rang egal). Unii statisticieni recomandă eliminarea cazurilor care dau diferenţeegale cu zero şi, implicit, reducerea volumului eşantionului cu aceste cazuri. Oabordare mai riguroasă este aceea de a păstra valorile zero, dar atribuind arbitrar semnul+ la jumătate dintre ele şi semnul – la cealaltă jumătate. În situaţia în care există unnumăr impar de diferenţe egale cu zero între rangurile celor două evaluări, se va eliminauna dintre ele (reducând N cu 1), după care se aplică regula enunţată anterior.

EXERCIŢII

Având în vedere numărul mic al subiecţilor cercetării din tema pentru acasă de la

testul t pentru eşantioane dependente, refaceţi calculele utilizând testul Wilcoxon: Ne propunem să scoatem în evidenţă efectul stresului temporal (criza de timp)

asupra performanţei de operare numerică. În acest scop, selectăm un eşantion de subiecţicărora le cerem să efectueze un test de calcule aritmetice în două condiţii experimentalediferite: prima, în condiţii de timp nelimitat, cu recomandarea de a lucra cât mai corect; adoua, în condiţii de timp limitat, cu condiţia de a lucra cât mai repede şi mai corect înacelaşi timp.

Rezultatele celor două reprize sunt cele din tabelul alăturat. Să se rezolveurmătoarele sarcini:

Page 10: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 10/17

Fără criză detimp

Cu criză detimp

67 6579 7383 70

80 8599 9395 8880 72100 69

Care sunt valoarea testului, decizia statistică şi concluzia cercetării în acest caz?

Testul Friedman pentru

măsurări repetate

Să presupunem că un psiholog doreşte să studieze relaţia dintre stilurile deconducere (laissez-faire, democratic şi autoritar) asupra nivelului de satisfacţie

 profesională. În acest scop el poate constitui un grup de cercetare pe care să îl supună, înmomente succesive, celor trei tipuri de conducere. Un alt model ar putea fi constituireaa trei eşantioane perechi, astfel constituite încât fiecărui subiect dintr-un eşantion să îicorespundă câte un subiect „echivalent” din fiecare dintre celelalte două eşantioane(criteriile de echivalenţă pot fi: sexul, vârsta, nivelul de inteligenţă, gardul de motivare,etc.).

Dar, oricare dintre variantele pe care l-ar alege cercetătorul, din punct de vederestatistic el ar obţine o structură de date identică: trei serii de evaluări ale satisfacţiei(variabila dependentă), pentru aceiaşi subiecţi (sau perechi de subiecţi) corespunzătoarecelor trei stiluri de conducere. Dacă variabila dependentă ar fi măsurată pe o scală deinterval/raport, testul parametric adecvat este unul pe care nu l-am tratat până acum,„ANOVA pentru măsurări repetate”. În lipsa lui, şi presupunând că variabila dependentănu întruneşte condiţiile unui test parametric, soluţia problemei este testul Friedman pentrudate ordinale. Pentru aplicarea lui este suficient ca valorile variabilei dependente să fieordonate după rang, ca în tabelul alăturat. Facem precizarea că, în acest caz, ordonareadupă rang se face la nivelul fiecărui set de evaluări perechi:

Democratic Laissez-faire Autocratic1 1 2 32 2 1 3

3 1 2 34 1 2 35 1 2 36 2 1 3

 N=6 T1=8 T2=10 T3=18

Testul Friedman (Fr ) pune în evidenţă în ce măsură rangurile evaluărilor repetatediferă cu adevărat (statistic semnificativ) unele de altele, după formula:

Page 11: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 11/17

unde:c este numărul măsurărilor repetate

 N este volumul seturilor de evaluări perechiTi este suma rangurilor corespunzătoare fiecărui moment de măsurare

La fel ca şi în cazul testului H (Kruskal-Wallis), distribuţia de nul a testului Friedmanurmează forma distribuţiei chi-pătrat pentru df=c-1. Introducem valorile cercetării înformulă:

Valoarea critică tabelară (chi-pătrat) pentru df=3-1=2, este 5.99. Valoareacalculată fiind mai mare, se respinge ipoteza de nul şi se consideră confirmată ipotezacercetării: nivelul satisfacţiei profesionale variază semnificativ în funcţie de stilul deconducere.

Testul Friedman poate fi aplicat şi în cazul a doar două măsurări, situaţie în caredevine similar testului semnului. La fel ca şi celelalte teste pentru date ordinale, el esteafectat de existenţa rangurilor atribuite ex-aequo, pentru valori identice. În astfel decazuri este recomandabilă aplicarea unei corecţii în formula de calcul, pe care nu o vom

 prezenta aici, în speranţa că utilizarea programelor specializate va face, oricum, corecţiilenecesare.

EXERCIŢII

Un neurofiziolog doreşte să verifice dacă există o relaţie între leziunea cerebralăstângă şi tipul de deficit de memorie de scurtă durată, în trei tipuri de sarcină diferite:cifre, litere, litere şi cifre amestecate.

Un număr de cinci subiecţi cu leziune cerebrală stângă au efectuat teste dememorie distincte, pe şiruri de cifre, litere şi combinaţii de cifre şi litere. Performanţaînregistrată marchează şirul cel mai lung memorat pentru fiecare test în parte.

Datele cercetării:(valorile semnifică lungimea şirului memorat)

Subiectul Cifre Litere Cifre/LitereA 6 5 6B 8 7 5C 7 7 4

D 8 5 8E 6 4 7F 7 6 5

Care este valoarea testului Friedman?Care este decizia statistică şi ce concluzie trage cercetătorul?

Page 12: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 12/17

Coeficientul de corelaţie pentru date ordinale (Spearman)

Testele Wilcoxon şi Friedman sunt utilizate pentru a pune în evidenţă diferenţeledintre două sau mai multe eşantioane perechi (situaţie care, de regulă, se referă lamăsurări repetate pe aceiaşi subiecţi). Atunci când avem două variabile ordinale şisuntem interesaţi în evaluarea gradului de asociere între ele, vom utiliza un test similar coeficientului de corelaţie pentru date de interval care este coeficientul de corelaţie arangurilor (Spearman).

Aşa cum ne amintim, coeficientul de corelaţie Pearson (r) ne dă măsuraintensităţii legăturii dintre două variabile exprimate pe scale de tip interval/raport.Mecanismul de calcul se bazează pe transformarea valorilor ambelor variabile în scoruriz, adică pe convertirea acestora în „distanţă standard” faţă de medie. Pentru datele de tipordinal, modalitatea de calcul a coeficientului de corelaţie se bazează pe poziţia relativăa unei valori faţă de celelalte. Coeficientul de corelaţie a rangurilor Spearman (r S) areacelaşi domeniu de variaţie (-1/+1) şi se interpretează în acelaşi mod ca şi coeficientul decorelaţie pentru date parametrice Pearson.

Exemplu:Problema cercetării. Într-un studiu cu privire la ameliorarea sistemului de

evaluare a personalului, doi instructori urmează un program special de armonizare aevaluării. La sfârşitul programului ei sunt puşi să ierarhizeze personalul unuicompartiment de muncă (N=10) din punctul de vedere al performanţei profesionale.

Ipoteza cercetării. (pentru test bilateral) Evaluările celor doi instructori vor ficoncordante.

Ipoteza de nul. Între evaluările celor doi instructori nu există nici o legăturăCriteriile deciziei statistice:

• alfa= 0.05• r S critic se citeşte într-un tabel special pentru coeficientul Spearman (Anexa 9).

Valoarea se citeşte la intersecţia dintre linia corespunzătoare lui N (în acest caznu se

folosesc gradele de libertate) cu coloana corespunzătoare tipului de test (unilateral, bilateral) şi a nivelului α. Înregistrăm r S critic =0.648

Datele cercetării:Angajaţi RANG

Instructor I

RANGInstructor II

Diferenţa (D)(R1-R2)

D2

A 3 2 1 1B 1 3 -2 4C 7 5 2 4

D 6 4 2 4E 10 10 0 0F 5 8 -3 9G 9 7 2 4H 8 9 -1 1I 4 6 -2 4J 2 1 1 1

2D2=32

Page 13: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 13/17

Decizia statistică: r S calculat (0.81)≥ r S critic (0.684). Ipoteza de nul se respinge.Concluzia cercetării: Evaluările celor doi instructori sunt semnificativ concordante.Programul de instruire a avut efectul scontat.

Interpretarea coeficientului de corelaţie Spearman

În principiu, acesta se interpretează la fel ca şi coeficientul Pearson.r S= 0 Cele două variabile nu variază concomitent, deloc

0 > r S > 1 Cele două variabile tind să crească sau să scadă concomitent, într-oanumită măsură

r S = 1.0 Corela ie ozitivă erfectă-1 > r S > 0 În timp ce o variabilă tinde să crească, cealaltă tinde să descreascăr S = -1.0 Corela ie negativă perfectă

Dacă probabilitatea aferentă valorii calculate a testului este mai mare decât0.05, coeficientul de corelaţie va fi considerat nesemnificativ (are şanse prea mari sărezulte din întâmplare). Aceasta nu înseamnă că nu există o corelaţie între cele două

variabile, ci doar că datele noastre nu au putut să o pună în evidenţă.Calcularea coeficientului de determinare (r S2) în cazul corelaţiei Spearman nu esteuzuală, deşi există autori care o acceptă.

Când se utilizează coeficientul de corelaţie Spearman:

• Atunci când ambele variabile sunt de tip ordinal• Atunci când una dintre variabile este de tip ordinal şi cealaltă este de tip

interval/raport. În acest caz, variabila interval/raport se transformă mai întâi învalori de ordine de rang

• Atunci când ambele variabile sunt de tip interval/raport dar una sau ambele, prezintă valori extreme. În acest caz, prin transformarea în ordine de rang a celor 

două distribuţii, valorile extreme sunt anihilate, ele urmând să participe la corelaţie prin simpla poziţie în distribuţie şi nu prin nivelul lor absolut.

Formula 5.7 nu este considerată adecvată pentru situaţiile în care variabilele supusecorelaţiei prezintă multe ranguri ex-aequo. De aceea, un test alternativ pentru asociereavariabilelor ordinale este coeficientul de corelaţie a rangurilor Kendall tau. La fel ca şicoeficientul Spearman, Kendal tau ia valori între -1 şi +1. Similarităţile se opresc însăaici, deoarece coeficientul Kendall se calculează pe o cale diferită şi se fundamentează peo estimare a parametrului populaţiei. Aceasta estimare se calculează ca probabilitateaconcordanţei minus probabilitatea discordanţei dintre

Formula de calcul entru coeficientul de corela ie a ran urilor S earman este:

În care, rin înlocuirea cu valorile cercetării, ob inem:

Page 14: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 14/17

rangurile perechi. Nu vom analiza în amănunt procedura de calcul, dar vom prezentamodul de obţinere a coeficientului Kendall cu ajutorul programului SPSS în secţiuneaurmătoare.

Ambii coeficienţi sunt larg utilizaţi în studiile statistice, făcând, în acelaşi timp,şi obiectul unor dispute între statisticieni. Adesea, coeficientul Kendall este consideratmai adecvat datorită faptului că distribuţia acestuia se apropie de forma normalăîncepând de la volume mai mici ale eşantioanelor. Chiar dacă, în calcule, pe aceleaşidate, cu cei doi coeficienţi se obţin valori uşor diferite, decizia statistică nu este, deobicei, diferită.

EXERCIŢII

Într-o şcoală de pilotaj a fost organizat un curs de optimizare a evaluării elevilor de către instructori, cu scopul de a se uniformiza criteriile de evaluare.

După terminarea cursului, doi instructori sunt puşi să efectueze, fiecare, un număr de ore de zbor cu aceiaşi 10 elevi, după care li se cere să facă o ierarhie a lor.

Datele cercetării:

(valorile din tabel exprimă poziţia de rang atribuită de instructori fiecărui elev)

Elev Instructor 1 Instructor 2A 3 3B 1 2C 7 6D 6 7E 10 10F 5 4G 9 8H 8 9

I 4 5J 2 1

Care este valoarea corelaţiei dintre evaluările celor doiinstructori? Care este decizia statistică şi concluzia cercetăriiîn acest caz?

Page 15: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 15/17

ANEXE

Anexa 7. Tabelul valorilor critice pentru testul Mann-Whitney U

nA/nB α 5 6 8 10 12 14 16 18 20

3 0.05 0 1 2 3 4 5 6 7 80.01 - - - 0 1 1 2 2 34 0.05 1 2 4 5 7 9 11 12 14

0.01 - 0 1 2 3 4 5 6 85 0.05 2 3 6 8 11 13 15 18 20

0.01 0 1 2 4 6 7 9 11 136 0.05 3 5 8 11 14 17 21 24 27

0.01 1 2 4 6 9 11 13 16 188 0.05 6 8 13 17 22 26 31 36 41

0.01 2 4 7 11 15 18 22 26 3010 0.05 8 11 17 23 29 36 42 48 55

0.01 4 6 11 16 21 26 31 37 42

12 0.05 11 14 22 29 37 45 53 61 690.01 6 9 15 21 27 34 41 47 54

14 0.05 13 17 26 36 45 55 64 74 830.01 7 11 18 26 34 42 50 58 67

16 0.05 15 21 31 42 53 64 75 86 980.01 9 13 22 31 41 50 60 70 79

18 0.05 18 24 36 48 61 74 86 99 1120.01 11 16 26 37 47 58 70 81 92

20 0.05 20 27 41 55 69 83 98 112 1270.01 13 18 30 42 54 67 79 92 105

(sursa: Clocotici V., Stan A., 2000, Statistică aplicată în psihologie, Polirom)

14

Page 16: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 16/17

Anexa 8. Valorile critice pentru testul Wilcoxon

 NNivel de semnifica ie pentru test unilateral

0.025 0,01 0.005Nivel de semnifica ie entru test bilateral

0.05 0.02 0.016 0 - -7 2 0 -8 4 2 09 6 3 210 8 5 311 11 7 512 14 10 713 17 13 1014 21 16 1315 25 20 1616 30 24 20

17 35 28 2318 40 33 2819 46 38 3220 52 43 3821 59 49 4322 66 56 4923 73 62 5524 81 69 6125 89 77 68(sursa : Clocotici V., Stan A., 2000, Statistică aplicată în psihologie, Polirom)

15

Page 17: sp 12Teste statistice pentru date ordinale

8/7/2019 sp 12Teste statistice pentru date ordinale

http://slidepdf.com/reader/full/sp-12teste-statistice-pentru-date-ordinale 17/17

Anexa 9. Valorile critice pentru testul de corelaţie a rangurilor (Spearman)

 N

test unilateral

alfa=0.05 alfa=0.025 alfa= 0,01 alfa=0.005

test bilateralalfa=0.10 alfa=0.05 alfa=0.02 alfa=0.01

5 0,900 - - -6 0,829 0,886 0,943 -7 0,714 0,786 0,893 -8 0,643 0,738 0,833 0,8819 0,600 0,683 0,783 0,83310 0,564 0,648 0,745 0,79411 0,523 0,623 0,736 0,81812 0,497 0,591 0,703 0,78013 0,475 0,566 0,673 0,745

14 0,457 0,545 0,646 0,71615 0,441 0,525 0,623 0,68916 0,425 0,507 0,601 0,66617 0,412 0,490 0,582 0,64518 0,399 0,476 0,564 0,62519 0,388 0,462 0,549 0,60820 0,377 0,450 0,534 0,59121 0,368 0,438 0,521 0,57622 0,359 0,428 0,508 0,56223 0,351 0,418 0,496 0,54924 0,343 0,409 0,485 0,537

25 0,336 0,400 0,475 0,52626 0,329 0,392 0,465 0,51527 0,323 0,385 0,456 0,50528 0,317 0,377 0,448 0,49629 0,311 0,370 0,440 0,48730 0,305 0,364 0,432 0,478

(sursa: http://www.netnam.vn/unescocourse/index.htm)

16


Recommended