Home >Documents >CURS 8 Statistica

CURS 8 Statistica

Date post:08-Dec-2015
Category:
View:288 times
Download:2 times
Share this document with a friend
Description:
-
Transcript:

CURS 8. STATISTICA

CAPITOLUL 16

DISTRIBUIA I FRECVENA OBSERVAIILORPn acum tratarea inferenelor statistice s-a fcut pe baza scorurilor unei variabile sau mai multor variabile. ns nu ntotdeauna cercetrile statistice fac apel la scoruri. Vom vedea n acest capitol c n locul scorurilor, frecvenele marcnd numrul de subieci care aparin categoriilor unei variabile pot fi utilizate cu succes n anumite condiii fixate de restriciile cercetrii. n acest caz, scopul fixat este acela de a face inferene pe marginea repartiiei de frecvene a populaiei.

Deseori cercetarea psihologic face apel la caracteristici calitative. Exemple de caracteristici calitative sunt numeroase n psihologie (hiperemotivitatea, depresia endogen, nevrotismul etc.). Evaluarea acestor caracteristici se face exclusiv prin prisma frecvenelor. Motivaia evalurii caracteristicilor calitative prin frecvene este dat de imposibilitatea msurrii lor directe.

Dei forma general a datei statistice este schimbat de la scoruri la frecvene logica de principiu a inferenei statistice nu se schimb. De data aceasta avem de a face cu testarea ipotezei nule legate de proporiile populaiei. n principiu dac frecvenele observate se abat semnificativ de la cele ateptate, ipoteza nul se respinge.

n timp ce statisticile z, t i F sunt utilizate pentru testarea ipotezelor referitoare la mediile populaiilor, testul statistic utilizat pentru evaluarea frecvenelor este testul 2. Mrimea lui 2 reflect cantitatea de discrepan existent ntre frecvenele observate i cele ateptate.

S presupunem c ntr-o competiie de selecie pentru un program spaial se prezint 5 candidai care sunt evaluai de 200 de specialiti. Rezultatele sunt cele prezentate mai jos.

Preferina examinatorilor

Frecvena observatS1S2S3S4S5

unde f0 sunt frecvenele observate iar Si sunt cei cinci subieci competitori.

ntrebarea care se pune este dac exist diferene semnificative ntre voturile acordate candidailor de asemenea manier nct s clarifice problema desemnrii ctigtorului. Menionm faptul c frecvenele observate sunt date de numrul votanilor favorabili fiecrui competitor.

Ipoteza nul poate fi formulat astfel: nu exist diferene ntre cei 5 candidai din perspectiva voturilor favorabile pe care acetia le primesc din partea examinatorilor, sau, fiecare candidat primete 20% voturi favorabile din totalul voturilor exprimate ( cu proporiile voturilor pentru competitorul ).

Ipoteza alternativ nu se poate exprima la fel de simplu. n esen se apreciaz c proporiile voturilor difer i deci nu toate vor fi egale cu 0,20. Exist mai multe forme ale ipotezei alternative. De exemplu dar ele sunt diferite de sau sau sau .a.m.d. Rezult c cuprinde toate posibilitile mai puin cea pentru care proporiile observate sunt egale.

Pe lng frecvenele observate, statistica 2 opereaz i cu frecvenele ateptate. Notate cu , ele se calculeaz prin multiplicarea proporiei de 0,20 cu volumul eantionului (n cazul nostru 200). De exemplu, pentru subiecii 1, 2, 3, 4, 5 acestea sunt:

cu .

Dac se accept ipoteza nul, atunci ne ateptm s gsim valori apropiate sau sensibil apropiate ntre frecvenele observate i cele ateptate. Ct de rezonabile ar trebui s fie diferenele pentru a accepta ipoteza nul? Definirea unei msuri a discrepanei dintre frecvenele observate i cele ateptate este necesar.

16.1 STATISTICA : O MSUR A DISCREPANEI DINTRE FRECVENELE OBSERVATE I CELE ATEPTATE

Introdus de K. Pearson, statistica 2 furnizeaz msura discrepanei dintre frecvenele observate i cele ateptate. Relaia de calcul a statisticii 2 este cea prezentat mai jos:

Aplicnd relaia de calcul datelor din exemplu, se obine:

Formula de calcul a statisticii scoate n eviden urmtoarele proprieti:

nu poate fi negativ;

cu ct discrepana dintre frecvenele observate i cele ateptate este mai mare cu att este mai mare;

este egal cu zero n cazul n care frecvenele observate sunt egale cu cele ateptate.

16.2 REPARTIIA DE SELECIE A LUI

Valoarea de 85 obinut pentru statistica exprim discrepana dintre frecvenele observate i cele ateptate. Ce valori pot fi anticipate rezonabil pentru aceast situaie ca rezultat al aciunii variaiei de selecie? Care este valoarea minim a lui pentru ca ipoteza nul s fie respins? Unde se poziioneaz valoarea obinut pentru n raport cu valoarea minim (critic) menionat? Pentru a da un rspuns acestor ntrebri este necesar analiza repartiiei de selecie a lui . S admitem c ipoteza nul este adevrat. Admitem de asemenea c repetm experimentul de mai multe ori n manier identic. Ne ateptm ca valorile lui s varieze de la eantion la eantion datorit aciunii factorilor ntmpltori implicai n selecia aleatoare. Distribuia valorilor obinute pentru dac este adevrat urmeaz distribuia teoretic pentru 4 grade de libertate (conform exemplului prezentat). Ca i n cazul distribuiei t, distribuia teoretic reprezint o familie de distribuii.

Fig. 16.1 Repartiia de selecie a lui pentru 4 grade de libertate i valoarea critic pentru problema de selecie a candidailor.

Fig. 16.2 Repartiia de selecie a lui pentru

16.3 PROCEDURA DE APLICARE A TESTULUI

Aplicarea testului necesit parcurgerea urmtoarelor etape:

Etapa 1

Formularea ipotezelor statistice i fixarea nivelului de semnificaie:

orice posibilitate n afara celei menionate mai sus.

Etapa 2

Stabilirea volumului eantionului i selectarea unui eantion de volum egal cu cel stabilit. n cazul exemplului prezentat, este vorba de selectarea a cinci candidai n vederea desemnrii ctigtorului pentru participarea la programul spaial.

Etapa 3

Calculul statisticii

Etapa 4

Identificarea valorii critice. Dac ipoteza nul este adevrat, valorile urmeaz repartiia de selecie a lui cu grade de libertate. Folosind datele exemplului de mai sus, . Pentru a gsi valoarea critic a lui trebuie identificat valoarea corespunztoare n anexa D, localizat la intersecia liniei care desemneaz cele 4 grade de libertate cu coloana corespunztoare pragului de semnificaie . Folosindu-ne de datele exemplului, aceast valoare este de 9,49.

Etapa 5

Construirea deciziei statistice i formularea concluziilor. Valoarea calculat pentru (=85) depete cu mult valoarea critic i deci, ipoteza nul se respinge. Concluzia care se poate trage este aceea c preferinele celor 200 de examinatori se abat semnificativ de la valorile ateptate n situaia n care cei 5 concureni ar fi fost la fel de bine pregtii. Prin urmare, eful comisiei de examinare va avea o misiune mult mai uoar n alegerea ctigtorului.

16.4 APLICAREA TESTULUI N CAZUL N CARE CERCETAREA PSIHOLOGIC INCLUDE DOU CARACTERISTICI.

EXEMPLU

Exist un raport de cauzalitate ntre atitudinea copiilor i atitudinea prinilor fa de fumat? Aceasta este o posibil ntrebare, susceptibil de a i se rspunde prin aplicarea testului n cazul n care se studiaz un posibil raport de asociere ntre cele dou atitudini. Pentru aceast problem presupunem c se dispune de datele prezentate n tabelul de mai jos.

Frecvene observate

Copii fumtoriCopii ne-fumtoriTotal

Prini fumtori3070100

Prini ne-fumtori20200220

Total50270320

Scopul studiului este de a vedea dac exist diferene ntre atitudinea prinilor i atitudinea copiilor fa de fumat.

Tabelul de mai sus aa cum este el construit este un tabel de contingen n care este prezentat o distribuie de frecvene bivariat cu liniile reprezentnd atitudinea prinilor (fumtori / ne-fumtori) iar coloanele reprezentnd atitudinea copiilor (fumtori / ne-fumtori). Constatm c dintr-un numr de 320 de subieci 100 sunt prini fumtori i 220 sunt prini ne-fumtori. De asemenea, din cei 320 de subieci, 50 sunt copii fumtori iar 270 sunt copii ne-fumtori.

Pasul urmtor al analizei urmrete calcularea proporiilor observate, cunoscnd frecvenele. Pentru acest exemplu, proporiile sunt cele prezentate n tabelul de mai jos.

Proporiile observate

Copii fumtoriCopii nefumtoriflinie

Prini fumtori

100

Prini nefumtori

220

320

Analiznd rezultatele, se constat c exist proporii diferite n ceea ce privete fumtorii i ne-fumtorii. Este de remarcat faptul c alegnd la ntmplare un printe fumtor, ansa de a avea un copil ne-fumtor este mai mic comparativ cu situaia n care ar fi selectat un printe ne-fumtor. La fel n situaia n care selectm la ntmplare un printe ne-fumtor, ansa de a avea un copil care fumeaz este mai mic dect n situaia n care am selecta un printe fumtor. Cu alte cuvinte atitudinea copiilor este contingent (dependent) de atitudinea prinilor, ceea ce pune n eviden un caz de asociere ntre cele dou caracteristici.

IPOTEZA NUL

Ipoteza nul n cazul studierii asocierii dintre dou caracteristici pornete de la supoziia c acestea sunt independente. Pentru a trata independena caracteristicilor A i B, urmrim tabelul de contingen de mai jos.

Tabel de contingen pentru analiza asocierii dintre caracteristicile A i B

Cantitile din parantez sunt frecvenele observate iar literele greceti mici ( i ) desemneaz non-caracteristicile.

Spunem despre dou caracteristici i c sunt independente dac:

(1)

(2)

(3)

(4)

Respectnd proprietile proporiilor putem scrie de exemplu, relaia (4) sub forma:

de unde (5)

Similar, relaiile (1), (2) i (3) pot fi scrise astfel:

(6)

(7)

(8)

Frecvenele din membrul stng care apar n (5), (6), (7) i (8) se numesc frecvene ateptate i semnific frecvenele pe care le-am putea nregistra dac cele dou caracteristici i ar fi independente. Folosind datele exemplului de mai sus, frecvenele observate i cele ateptate (notate n parantez) sunt prezentate n urmtorul tabel:

Frecvenele observate i ateptate

Copii fumtoriCopii nefumtoriTotal

Prini fumtori30

(15,62)70

(84,37)100

Prini nefumtori20

(34,37)200

(185,62)220

Total50270320

Cu aceste date putem determina statistica :

Numrul gradelor de libertate pentru un tabel de contingen cu N linii i M coloane este egal cu . n cazul tabelului de mai sus, . Dac se reine ipoteza nul atunci valorile urmeaz distribuia de selecie cu grade de libertate. Din anexa D, pentru un grad de libertate i un prag de semnificaie , . Cum ipoteza nul se respinge i deci se concluzioneaz c atitudinea copiilor fa de fumat este dependent de atitudinea prinilor fa de acelai subiect.

CAPITOLUL 17

TESTE NEPARAMETRICE

17.1 TESTE PARAMETRICE VERSUS TESTE NEPARAMETRICE

Testele statistice abordate anterior sunt cunoscute ca teste parametrice. Acestea implic ipoteze i / sau presupuneri referitoare la parametrii i distribuiile populaiilor. Din fericire aceste teste sunt destul de robuste. O abatere real de la presupunerile menionate nu poate invalida testul atta timp ct volumul eantionului este mare. Totui, o problem serioas apare atunci cnd presupunerile fcute pe marginea distribuiilor sunt profund afectate i mrimea eantioanelor este mic. Pentru a compensa aceste neajunsuri statistica face apel la testele ne-parametrice. Aceste teste au calitatea de a fi mai puin restrictive n sensul nuanat mai sus (distribuie normal + volum mare de date). Ele se dovedesc mai puin senzitive dect testele parametrice dac distribuiile de frecvene sunt relativ normale iar volumul de date este mare. Prezentm mai jos trei dintre cele mai utilizate teste ne-parametrice (testul Mann-Whitney, testul Kruskal-Wallis i testul semnului).

17.1.1 TRANSFORMAREA SCORURILOR N RANGURI

Anumite teste solicit transformarea scorurilor n ranguri. Utilizarea rangurilor nu necesit nici un fel de condiii referitoare la forma distribuiei populaiei, cu toate c cele mai multe (distribuii) pornesc de la ipoteza c variabila este continu. Altfel, ne plasm n domeniul variabilei discrete. n acest ultim caz apar situaii de scoruri identice ceea ce ridic problema stabilirii rangurilor. Cea mai simpl procedur de determinare a rangurilor const n atribuirea pentru fiecare scor identic a unui rang mediu, calculat ca medie a rangurilor care ar fi fost nregistrate dac acestea ar fi fost diferite.

Subiect123456789

Scor122333345

Rang1

89

___________________

Suma rangurilor astfel fixate trebuie s fie egal cu , n cazul nostru . ntr-adevr .

17.2 TESTUL MANN-WHITNEY

Testul Mann-Whitney este o alternativ la testul t pentru eantioane independente. Se aplic n situaiile n care eantioanele sunt mici, distribuiile datelor nu sunt normale iar datele pot fi prezentate sub form de clasament. Logica testului este simpl i fr complicaii.

S presupunem c se dispune de dou grupuri de cte 10 subieci fiecare, pentru care distribuiile scorurilor sunt cele indicate n tabelul de mai jos.

Grup11111111112222222222

Scor56789101112131416171819202122232425

Rang1234567891011121314151617181920

Aa cum se poate constata, scorurile grupului 1 sunt mai mici dect cele ale grupului 2 ceea ce explic i diferena dintre sumele rangurilor (). Refcnd componena grupurilor prin trecerea unor subieci din grupul 2 n grupul 1 i invers, distribuia scorurilor, evident se modific ca de altfel i diferena dintre sumele rangurilor (vezi tabelul de mai jos).

Grup11112212212112221122

Scor56781011141719241216139182821263032

Rang1234671012141681195131815171920

n ciuda acestor intercalri rmne mai mic dect . O alt re-aranjare, ca n tabelul de mai jos, ne conduce la o echilibrare perfect a celor dou sume ale rangurilor:

Grup12211221212121211122

Scor5678910111213141617181942426283032

Rang1234567891011121314151617181920

Aceste exemple ilustreaz semnificativ efectul ntmplrii n dinamica rangurilor.

Testul Mann-Whitney este utilizat pentru a evalua discrepana dintre sumele rangurilor a dou eantioane. Practic se urmrete s se vad dac discrepana este suficient de mare pentru a nu mai putea fi explicat prin efectul ntmplrii.

Paii urmrii pentru aplicarea testului Mann-Whitney sunt:

1. Stabilirea celor dou grupuri. Dac cele dou grupuri nu sunt egale n volum, atunci grupul cel mai mic va fi considerat grupul 1;

2. Combinarea tuturor scorurilor ntr-o distribuie de volum . n situaia identificrii unor scoruri identice, pentru stabilirea rangurilor se aplic procedura de mai sus;

3. Se calculeaz suma rangurilor tuturor scorurilor n grupul 1. n anexa E sunt date valorile critice pentru , corespunznd testului unilateral la pragurile de: 0.005 ; 0.1 ; 0.025 i 0.05;

4. Localizarea liniei din anexa E corespunztoare lui i luarea deciziei n funcie de urmtoarele situaii:

a) . Dac ipoteza alternativ este bidirecional, se gsete intervalul pentru corespunztor pragului de semnificaie egal cu . Ipoteza nul (n situaia n care nu exist diferene ntre cele dou populaii) este respins dac este egal sau mai mic dect limita inferioar n anex sau dac este egal sau mai mare dect limita superioar;

b) . n cazul acestei ipoteze alternative unidirecionale se gsete intervalul pentru corespunztor pragului de semnificaie egal cu . Ipoteza nul se respinge dac este egal sau mai mic dect limita inferioar indicat n anex;

c). . Se aplic acelai raionament de mai sus cu deosebirea c ipoteza nul se respinge dac limita superioar indicat.

Pentru testul Mann-Whitney statistica utilizat dac nu se urmresc situaiile a), b) i c) este:

Se accept ipoteza nul dac .

EXEMPLU

Presupunem c dou grupuri de subieci hiperemotivi sunt supuse la dou tipuri de tratamente de psihoterapie, rezultatele post-terapii fiind cele indicate prin scorurile de mai jos (scorurile mari indic hiperemotivitate ridicat, scorurile mici hiperemotivitate apropiat de nivelurile liminale ale emotivitii).

Subiect1234567891011

Grup 1577910192222303031

Grup 2810192326272728282930

Se solicit un punct de vedere argumentat statistic referitor la cele dou grupuri, urmrindu-se n realitate eficacitatea terapiilor.

Calculm rangurile pentru scorurile celor dou grupuri.

Subiect1234567891011

Grup 112,52,556,58,510,510,5202022

Grup 246,58,5121314,514,516,516,51820

n anexa E pentru n1=11, n2=11 i , valoarea critic corespunztoare este cuprins ntre 87 i 166. ntruct , se reine ipoteza nul iar concluzia care se trage este c cele dou terapii au fost relativ de aceeai eficacitate.

La acelai rezultat se poate ajunge calculnd statistica z.

Valoarea critic a statisticii z la un prag de semnificaie este . Cum se accept ipoteza nul.

17.3 TESTUL KRUSKAL-WALLIS

Testul Kruskal-Wallis este o alternativ la analiza de varian pentru cazul unifactorial. Logica de baz a testului Kruskal-Wallis este similar cu cea a testului Mann-Whitney.

Presupunnd c urmm procedura de combinare a scorurilor de la grupuri, scorurile fiind marcate cu ranguri de la la , n situaia n care eantioanele provin de la populaii similare ne ateptm ca sumele rangurilor pentru toate grupurile s fie relativ egale, eventualele diferene datorndu-se ntmplrii. Dac ns grupurile provin de la populaii diferite ne ateptm ca sumele rangurilor s difere semnificativ. Testul Kruskal-Wallis este destinat s msoare aceste discrepane. Statistica necesar aplicrii acestui test se determin din relaia:

cu - suma rangurilor grupului k;

- numrul de cazuri n grupul k;

- numr total de cazuri.

Distribuia de selecie teoretic a lui aproximeaz distribuia . Pentru a aplica testul Kruskal-Wallis este nevoie s dispunem de cel puin trei grupuri, fiecare avnd un volum . n testarea ipotezei nule se compar valoarea calculat a lui cu valorile critice pentru grade de libertate.

EXEMPLU

15 studeni de la 3 specializri diferite sunt solicitai s rezolve o problem de atenie distributiv. Rezultatele sunt prezentate n tabelul din pagina alturat.

Studeni n inginerieStudeni n arte plasticeStudeni n matematic

timpi de rezolvare (min.)timpi de rezolvare (min.)timpi de rezolvare (min.)

1,100,60,7

1,120,50,8

1,141,171,16

1,231,271,15

1,181,211,19

Se solicit un punct de vedere statistic referitor la gradul n care cele trei specializri cultiv studenilor capaciti de atenie distributiv.

Se construiete distribuia tuturor scorurilor obinute. Fiecrui scor i se atribuie un rang de la 1 la 15.

Timpii de soluionare a sarcinii de atenie distributiv (min.) i rangurile corespunztoare

Studeni n inginerieStudeni n arte plasticeStudeni n matematic

Scorrangscorrangscorrang

1,1050,620,73

1,1260,510,84

1,1471,17101,169

1,23141,27151,158

1,18111,21131,1912

Numrul gradelor de libertate = k-1=3-1=2, . Cum se accept ipoteza nul, ceea ce nseamn c la nivelul celor trei specializri studenii dispun de capaciti sensibil egale de atenie distributiv.

17.4 TESTUL SEMNULUI

Testul semnului este o alternativ la testul t pentru eantioane dependente. Este utilizat pentru a compara calitatea a dou distribuii n condiii de dependen a eantioanelor.

EXEMPLU

Un grup de subieci incapabili de ncredere n forele proprii sunt evaluai pe o scala de ncredere cu note de la 1 la 7. Dup evaluare, acetia beneficiaz de terapie de specialitate la sfritul creia sunt supui din nou evalurii. Rezultatele sunt cele prezentate n tabelul de mai jos.

Nivelul de ncredere al subiecilor ante i post terapie

SubiectAntePostDiferen

114+3

214+3

326+4

426+4

517+6

632-1

714+3

834+1

923+1

1023+1

Se cere s se aprecieze eficacitatea terapiei aplicate.

Pentru fiecare subiect se evalueaz diferena dintre strile post i ante-terapie. Se calculeaz numrul diferenelor pozitive i negative. Ipoteza nul se formuleaz astfel: Proporia diferenelor pozitive este egal cu proporia diferenelor negative (). n cazul exemplului prezentat, diferena pozitiv semnaleaz eficacitatea terapiei iar cea negativ ineficacitatea. Folosirea testului solicit evaluarea valorile ateptate pentru numrul diferenelor pozitive i negative. Acestea vor fi ateptateateptate, numrul de subieci chestionai fiind de 10. Valorile observate sunt i . Calculnd statistica , obinem:

Dar pentru un grad de libertate () i cum , se respinge ipoteza nul. ntruct rezult c eficacitatea terapiei aplicate este dovedit.

PAGE 18

_1190233993.unknown

_1191616303.unknown

_1196951451.unknown

_1201000314.unknown

_1201100575.unknown

_1201100589.unknown

_1201101187.unknown

_1201101588.unknown

_1201100582.unknown

_1201100184.unknown

_1201000728.unknown

_1196951534.unknown

_1198967041.unknown

_1199456380.unknown

_1198968871.unknown

_1198251960.unknown

_1196953126.unknown

_1196951495.unknown

_1191616585.unknown

_1192130299.unknown

_1192131899.unknown

_1192132902.unknown

_1192133024.unknown

_1192134216.unknown

_1192132231.unknown

_1192130541.unknown

_1192131828.unknown

_1192130530.unknown

_1192130254.unknown

_1192130281.unknown

_1191616884.unknown

_1191616456.unknown

_1191616495.unknown

_1191616331.unknown

_1191608347.unknown

_1191614927.unknown

_1191616274.unknown

_1191609599.unknown

_1190236331.unknown

_1190239372.unknown

_1190240192.unknown

_1190577504.unknown

_1190582357.unknown

_1190582565.unknown

_1190582674.unknown

_1190583858.unknown

_1190585441.unknown

_1190586166.unknown

_1190586515.unknown

_1190706733.unknown

_1190586229.unknown

_1190585793.unknown

_1190585910.unknown

_1190586165.unknown

_1190585668.unknown

_1190584686.unknown

_1190584741.unknown

_1190584343.unknown

_1190582866.unknown

_1190583857.unknown

_1190583856.unknown

_1190582710.unknown

_1190582597.unknown

_1190582492.unknown

_1190582430.unknown

_1190581698.unknown

_1190582077.unknown

_1190582205.unknown

_1190581887.unknown

_1190582075.unknown

_1190581809.unknown

_1190579417.unknown

_1190579499.unknown

_1190578878.unknown

_1190575552.unknown

_1190577039.unknown

_1190577270.unknown

_1190577345.unknown

_1190577503.unknown

_1190577110.unknown

_1190576389.unknown

_1190576737.unknown

_1190576387.unknown

_1190573813.unknown

_1190574881.unknown

_1190575550.unknown

_1190575551.unknown

_1190575329.unknown

_1190573814.unknown

_1190241196.unknown

_1190241571.unknown

_1190240348.unknown

_1190241159.unknown

_1190239484.unknown

_1190239585.unknown

_1190240088.unknown

_1190239499.unknown

_1190239390.unknown

_1190239410.unknown

_1190239432.unknown

_1190238491.unknown

_1190239341.unknown

_1190239358.unknown

_1190239326.unknown

_1190239283.unknown

_1190239310.unknown

_1190238592.unknown

_1190238381.unknown

_1190238407.unknown

_1190238303.unknown

_1190238335.unknown

_1190238258.unknown

_1190235034.unknown

_1190235954.unknown

_1190235998.unknown

_1190235230.unknown

_1190235676.unknown

_1190234146.unknown

_1190234175.unknown

_1190168134.unknown

_1190168323.unknown

_1190168595.unknown

_1190168715.unknown

_1190168448.unknown

_1190168210.unknown

_1190168253.unknown

_1190168162.unknown

_1190167390.unknown

_1190168031.unknown

_1190167813.unknown

_1190168025.unknown

_1190167388.unknown

_1190167389.unknown

_1190167387.unknown

_1190167386.unknown