+ All Categories
Home > Documents > Seminar 06- statistica psihologica

Seminar 06- statistica psihologica

Date post: 04-Apr-2018
Category:
Upload: constantin-mihai-costin
View: 241 times
Download: 0 times
Share this document with a friend

of 12

Transcript
  • 7/29/2019 Seminar 06- statistica psihologica

    1/12

    Erori statistice Puterea testului statistic Mrimea efectului

    Introducere

    Procedura urmat pentru a rspunde la ntrebarea cercetrii cu privire la nivelulinteligenei elevilor participani la olimpiade este definit ca testarea ipotezei statistice. Privindretrospectiv, am efectuat un proces derulat n ase etape succesive: (1) enunarea ipotezeicercetrii (H1); (2) enunarea ipotezei de nul (H0); (3) alegerea pragului de semnificaie (alfa);(4) colectarea i analiza descriptiv a datelor; (5) raportarea la un criteriu pentru evaluarearezultatului pe eantion (valoarea corespunztoare pragului alfa), (6) adoptarea deciziei statisticede reinere sau respingere pentru H0.

    Aplicnd aceast procedur am putut concluziona c probabilitatea de a avea omedie QI=106, pentru un eantion de elevi participani la olimpiade, este mai mic dect pragulalfa critic=0.05. Ca urmare, am respins ipoteza de nul i am considerat confirmat ipotezacercetrii, conform creia elevii olimpici au un nivel de inteligen peste media populaiei deelevi. Este ns acest rezultat expresia unui adevr cert? Putem afirma fr nici o ndoial c oriceeantion de elevi olimpici am selecta, nivelul lor de inteligen este peste media populaiei? Din

    pcate, nu. Rezultatul obinut i concluzia asumat reprezint o decizie de tip probabilistic. Maiprecis, am estimat probabilitatea ca ipoteza de cercetrii s fie fals.

    Pentru a nelege mai uor acest raionament putem apela la o analogie. S presupunem cavem un munte n care bnuim s se afl aur (populaia), i ca dorim s dovedim prezena lui pe

    baza unei cantiti de pmnt extrase dintr-un loc ales la ntmplare (eantion) din acest munte.Ipoteza de nul n acest caz afirm c aurul nu este prezent n acest munte mai mult dect n oricealt loc. Mai departe, determinm cantitatea de aur din eantionul recoltat i descoperim oanumit concentraie de metal preios. n final, trebuie s hotrm dac aceast concentraiedifer de concentraia natural, pe care ne putem atepta s o gsim oriunde. Dac nivelulconcentraiei de aur din eantion este mai mare dect cel al concentraiei pe care ne ateptm s

    gsim n cel mult 5% (pragul alfa) din eantioanele recoltate din orice loc de pe pmnt, ales lantmplare, atunci suntem ndreptii s concluzionm c aurul din eantionul cercetrii nu estentmpltor (respingem H0) i, implicit, c foarte probabil muntele nostru conine aur ntr-oconcentraie mai mare dect cea natural (acceptm H1).

    Am spus mai sus foarte probabil, fiindc este evident faptul c nu putem fi absolutsiguri de rezultatul nostru. n conformitate cu legea distribuiei normale, dac am recolta lantmplare eantioane de pmnt, ne putem atepta s avem situaii n care concentraia de aur sfie orict de mare, fr ca acest lucru sa nsemne neaprat c muntele (populaia cercetrii) esteun zcmnt aurifer (poate exista doar o zon limitat, cu concentraie mare, iar restul munteluis nu conin aur). Aceasta nseamn c asumarea deciziei cu privire la ipoteza de nul presupuneimplicit asumarea riscului unei anumite erori. Chiar dac respectm rigorile raionamentului i

    deciziei statistice, nu avem garania c decizia noastr reflect realitatea vieii. Cercetrilestatistice au un caracter probabilist i, ca atare, conin o anumit cantitate de eroare.

    Erori statistice

    n raport cu realitatea vieii, decizia cu privire la ipoteza de nul poate fi corect saugreit dar, din pcate, cercettorul care a efectuat studiul privind inteligena elevilor olimpici nuare cum s tie cu certitudine dac decizia pe care o ia este cu adevrat corect sau este greit. Oimagine sintetic, frecvent utilizat pentru a ilustra relaiile posibile ntre decizia statistic iadevrul vieii, este prezentat n mod clasic prin urmtorul tablou:

  • 7/29/2019 Seminar 06- statistica psihologica

    2/12

    Adevrul vieii(necunoscut)

    H0 este adevrat(olimpicii NU SUNT mai

    inteligeni)

    H0 este fals(olimpicii SUNT mai

    inteligeni)

    Deciziastatistic

    Acceptarea H0(olimpicii NU SUNTmai inteligeni)

    1.decizie corectp =1-alfa 4. eroare de tip IIp = beta

    Respingerea H1(olimpicii SUNT mai

    inteligeni)

    2. eroare de tipIP = alfa

    3. decizie corectp = 1-beta (power)

    Aa cum observm, decizia statistic este corect n dou din celulele tabelului de maisus: celula 1, acceptarea ipotezei de nul cnd ea este i n realitate adevrat, i celula 3,respingerea ipotezei de nul atunci cnd ea este i n realitate fals. n acest din urm caz ne

    plasm ntr-o situaie statistic ideal, n care decizia confirm ipoteza cercetrii, atunci cndaceasta este adevrat i n viaa real. Capacitatea unui test statistic de a susine o astfel de

    decizie, se numete puterea testului statistic (sau puterea cercetrii), pe care o vom analizape larg puin mai trziu. La rndul lor, erorile sunt ilustrate n celelalte dou celule: celula 2,cnd respingem, ipoteza de nul, dei ea este adevrat i celula 4, cnd acceptm ipoteza de nul,dei ea este fals. Pentru nceput, vom detalia situaiile de eroare.

    n continuare, vom analiza n detaliu situaiile de eroare statistic.

    Eroarea de tip I

    Cercettorul tie c, chiar i n cazul n care testul diferenei dintre media eantionului imedia populaiei este mai mare dect valoarea critic corespunztoare lui alfa, hazardul ar putea

    produce o diferen chiar mai mare dect cea constatat, fr nici o legtur cu prezena laolimpiad. Rezult de aici c, dac pe baza rezultatului la testul statistic respingem ipoteza de nul

    i acceptm c participarea la olimpiade se asociaz cu un nivel mai ridicat al inteligenei, ofacem asumndu-ne contient riscul unei erori. Dac diferena dintre cele dou medii rezult a fisemnificativ i respingem ipoteza de nul, dei conform adevrului vieii ea este adevrat, secomite o eroare de tip I. Probabilitatea acesteia este egal cu valoarea pragului alfa, al crui nivelmaxim acceptabil este fixat convenional la 0.05. Atunci cnd fixm valoarea lui alfa (0.05 saumai mic) drept criteriu de respingere a ipotezei de nul, definim, de fapt, cantitatea de eroare pecare suntem dispui s ne-o asumm n a respinge ipoteza de nul, chiar dac n realitate aceasta ar

    putea fi adevrat. Altfel spus, riscul de a decide c muntele conine un zcmnt aurifer, cndde fapt acest lucru nu este adevrat. Din acest motiv, eroarea de tip I se concretizeaz ntr-unrezultat fals pozitiv.

    Decizia statistic se bazeaz pe msura n care eantionul reprezint n mod rezonabilcaracteristicile populaiei. Chiar dac selecia eantionului s-a fcut n condiii ideale, exist o

    anumit probabilitate (cu att mai mare cu ct eantionul este mai mic) ca valorile sale s seabat de la parametrii populaiei (adevrul vieii). Ca urmare, putem s ne imaginm o situaien care, chiar i un eantion selecionat aleatoriu s prezinte valori neobinuit de ndeprtate de

    parametrii populaiei, fr nici o legtur cu condiia cercetrii. ntr-o astfel de situaie,supunndu-ne n mod corect regulilor convenionale ale deciziei statistice, respingem ipoteza denul, fcnd o eroare de tip I i asumndu-ne un rezultat fals pozitiv. Desigur, putem reduce

    probabilitatea erorii de tip I prin asumarea unei valori mai mici pentru alfa dar, aa cum vomvedea mai departe, acest lucru nu este lipsit de consecine.

    Dac privim n cvadrantul 1 din tabelul de mai sus, vom observa c probabilitatea de adecide corect, prin acceptarea ipotezei de nul atunci cnd ea este ntr-adevr adevrat este egalcu 1-alfa. Acest lucru nseamn c prin asumarea unei valori alfa=0.05, de exemplu, avem o

    probabilitate de 0.95 (1-0.5) de a accepta H0 cnd aceasta este n mod real adevrat. Din acestmotiv valoarea din cadranul 1 se numete nivel de ncredere. Ca s nelegem i mai bine, s ne

    imaginm c am efectua exact acelai studiu de 100 de ori, utiliznd eantioane diferite, dar

  • 7/29/2019 Seminar 06- statistica psihologica

    3/12

    similare sub aspectul vrstei copiilor, volumului grupurilor i procedurii etc. n cazul unei deciziistatistice care respect criteriile impuse, cu alfa=0.05 (implicit, 1-alfa=0.95), ne putem atepta can 5% dintre aceste cercetri (100x0.05) s respingem n mod greit ipoteza de nul (aceasta fiind,n realitate, adevrat). Acest lucru este echivalent cu a spune c avem un nivel de ncredere de95% (100x0.95) s acceptm corect ipoteza de nul, dar i c avem 95% anse s acceptm oipotez de nul care este n realitate adevrat. Cu alte cuvinte, valoarea lui alfa ne spune care este

    probabilitatea de a respinge n mod nejustificat o ipotez de nul, adevrat n viaa real, eroarepe care ns cercettorul este dispus s o tolereze.

    Eroarea de tip II

    Dar dac, dei muntele la care am fcut referire conine n mod real un zcmnt de aur, iareantionul nostru nu conine dovada acestui fapt i ne silete s admitem ipoteza de nul? n acestcaz comitem o eroare de tip II, care descrie un rezultat fals negativ.

    S presupunem c participarea la olimpiad este asociat n mod real cu un nivel deinteligen mai ridicat dar, ca urmare a hazardului eantionrii, diferena dintre mediaeantionului cercetrii i media populaiei nu atinge pragul semnificaiei statistice. Aceasta este

    situaia n care, dei elevii olimpici sunt mai inteligeni, cercetarea noastr are un rezultatnesemnificativ. S nu uitm c cercettorul nu cunoate care este adevrul vieii (dacolimpicii sunt mai inteligeni) i, drept urmare, chiar i atunci cnd admite o ipotez de nul iasum un risc de eroare. Aceasta este o eroare de tip II, codificat cu beta. Admiterea existeneierorii de tip II nu este lipsit de controverse. Fisher, unul dintre teoreticienii marcani ai statisticiimoderne, considera c atunci cnd nu decidem respingerea ipotezei de nul, nu decidemacceptarea ei, ci doar consemnm eecul de a o respinge, ceea ce nu este propriu-zis o decizie.Abia mai trziu, Neyman i Egon Pearson (fiul lui Karl Pearson, autorul coeficientului decorelaie care i poart numele) au dezvoltat teoria modern a deciziei statistice, n prezent largacceptat de comunitatea tiinific (B. Cohen, 2001).

    Stabilirea nivelului probabilitii erorii de tip II nu este uor de neles, mai ales c ea esten legtur cu puterea testului, probabilitatea deciziei corecte, fixat n cadranul 3 al tabelului.

    Aceste dou valori sunt complementare, puterea testului fiind egal cu 1-beta. n general, ovaloare acceptabil pentru eroarea de tip II este beta=0.20, deoarece, aa cum vom vedea maitrziu, valoarea recomandabil pentru puterea testului este 0.80.

    Atunci cnd iniiaz studiul privind relaia dintre inteligen i participarea la olimpiadelecolare, cercettorul este interesat mai ales s evite admiterea ipotezei de nul atunci cnd aceastaar fi, n realitate, fals. Altfel spus, cercettorul este interesat cu precdere n asumarea uneivalori ct mai mici pentru eroarea de tip II (evitarea acceptrii ipotezei de nul cnd ea este fals),deoarece ar nsemna c nu poate confirma ipoteza a cercetrii. Micorarea erorii de tip II arnsemna ns asumarea implicit a unei valori mai mari pentru riscul erorii de tip I. Se poatestabili o ierarhie ntre cele dou tipuri de eroare? Este una mai periculoas dect alta? n modobinuit, societatea i impune punctul de vedere, declarnd eroarea de tip I ca fiind maipericuloas, prin fixarea limitei maxime pentru eroarea de tip I (alfa=0.05). Dar de ce ar fiadmiterea greit a ipotezei de nul mai rea dect respingerea ei greit? Aici trebuie s fim nconsens cu Hack (2004) care afirm c, dei exist o tendin de considerare a erorii de tip I cafiind mai rea dect eroarea de tip II, n realitate ambele tipuri de erori pot fi la fel de rele,

    prin consecinele practice care decurg din rezultatele cercetrii.Nu avem nici un motiv s credem c vreunul dintre cele dou tipuri de eroare este mai

    ru sau mai bun dect cellalt. Dac avem n vedere un criteriu moral, nainte de toate artrebui s nu ne asumm un rezultat pozitiv al cercetrii, fr ca acest lucru s fie adevrat. Pe dealt parte, respingerea unui adevr tiinific numai pentru c cercetarea nu a fost n msur saduc dovada acestuia, este de asemenea de nedorit. Dac am concluziona c muntele conine unzcmnt de aur, iar acest lucru s-ar dovedi fals, eroare de tip I, ar rezulta pierderi mari deorganizare a unei exploatri ineficiente. La rndul ei, o eroare de tip II, care presupune admitereaipotezei de nul i negarea existenei unui zcmnt real, ar conduce la pierderi prin neexploatarea

    aurului existent. La fel, n plan psihologic, dac obiectul testului statistic ar fi efectul unei noi

  • 7/29/2019 Seminar 06- statistica psihologica

    4/12

    metode de tratament psihoterapeutic, este la fel de ru s fie acceptat utilizarea ei, dei nu esteeficient (eroare de tip I), ca i respingerea utilizrii, dac ar fi eficient (eroare de tip II), deoarece

    pacienii sunt lipsii de un serviciu util.

    Eroarea de tip III

    Erorile de tip I i II nu epuizeaz toate situaiile de eroare posibile ntr-o cercetare statistic.Howard Raiffa, ntr-o lucrare clasic de teoria deciziei, a introdus noiunea de eroare de tip III(Raiffa, 1968 ). Ulterior, acest tip de eroare a fost luat n discuie i de ali autori (Hack, 2004;Hsu, 1999), conturndu-se dou accepiuni de baz ale termenului:

    a. Respingerea corect a ipotezei de nul, urmat de atribuirea incorect a cauzei,definiie care corespunde cu definiia iniial propus de Raiffa. n acest sens eroarea de tip IInseamn o interpretare greit a rezultatului. Cercettorul concluzioneaz c ceva semnificativse ntmpl i, ntr-un fel, are dreptate, ceva se ntmpl, dar nu ceea ce red el. Exemplul clasiceste ilustrat de efectul de noutate. Dac introducem o noua metod de antrenament bazat pe

    joc pentru stimularea nvrii, copiii ar putea fi atrai de noutatea situaiei n raport cumodalitatea clasic de nvare a regulilor de circulaie. Ca urmare,un a rezultat semnificativdiferit fa de metoda utilizat pe un grup de control (care a nvat dup metoda clasic) s-ar

    datora nu neaprat efectului noii metode, ci caracterului de noutate i interes pe care l prezintaceasta. Este evident c cercettorul este nclinat s considere efectul ca fiind generat de metodainvestigat, dar acest lucru trebuie dovedit ca atare, nu este suficient s fie asumat. Efectul

    placebo poate fi inclus de asemenea n categoria erorilor de tip III, dar nu toate erorile de tip IIIsunt de tip placebo.

    Nu exist metode statistice pentru eliminarea erorii de tip III, n aceast accepie. Singuraprotecie vine dinspre calitatea modelului de cercetare. Pentru evaluarea efectului placebo, deexemplu, studiile medicale prevd protocoale de tip dublu orb, n care nici cei careadministreaz medicamentul i nici pacienii nu tiu dac dau/iau medicamentul supus cercetriisau un placebo.

    b. A doua definiie a erorii de tip III este similar cu prima, dar este diferit sub unaspect esenial. n acest caz rezultatul cercetrii conduce la confirmarea unui efect sau relaii

    ntre variabile, dar sensul (direcia) efectului este greit interpretat. Dac revenim la exemplulanterior, ne putem imagina c rezultatele cercetrii susin concluzia c efectul noii metode denvare este superior celei vechi dei, n realitate, situaia st exact invers, concluzia fiindgreit. n aceast accepie, probabilitatea erorii de tip III este codificat cu litera (gamma), iarunele programe statistice sunt capabile s o estimeze. Evident, eroarea de tip III se poatemanifesta numai n cercetri de tip experimental, singurele care permit concluzii de naturcauzal.

    Conceptul de eroare de tip III este fundamental diferit de celelalte dou tipuri de erori.Existena lui vine s ne aduc aminte c cercetarea tiinific vizeaz n ultim instan un adevral realitii, care nu este complet demonstrat de raionamentul decizional statistic, bazat peatitudinea fa de ipoteza cercetrii i admiterea sau respingerea ipotezei de nul. Principala luiutilitate este aceea c ne atrage atenia asupra vulnerabilitii cercetrilor statistice, subliniindrelativitatea acestora i faptul c simpla declarare drept semnificativ a rezultatului unei cercetrinu probeaz n mod suficient adevrul ipotezei i nici nu reflect n mod sigur realitatea.Existena erorii de tip III este unul din argumentele mpotriva asumrii simpliste a rezultatelorstatistice pe baza deciziei cu privire la ipoteza de nul. Mijlocul esenial de protecie mpotrivaerorii de tip III este stabilitatea rezultatelor de la o cercetare la alta, reaplicabilitatea lor, carenseamn obinerea acelorai rezultate la repetarea studiului n aceleai condiii.

  • 7/29/2019 Seminar 06- statistica psihologica

    5/12

    Puterea testului

    Revenind la analogia cu muntele aurifer, s presupunem c rezultatul cercetrii ne impuneadmiterea ipotezei de nul, implicit respingerea ipotezei c muntele conine aur. ntr-un astfel decaz avem dou posibiliti de interpretare a acestui rezultat:

    a. fie rezultatul cercetrii este corect, ipoteza de nul este de fapt adevrat (ipotezacercetrii este realmente fals), iar muntele nu conine aur (elevii olimpici nu suntmai inteligeni dect populaia elevilor n general);

    b. fie ipoteza de nul este fals, ceea ce ar nsemna c zcmntul de aur exist (olimpiciisunt mai inteligeni), dar explorarea noastr nu a avut suficient putere(sensibilitate) pentru a surprinde existena aurului (relaia dintre participarea laolimpiad i nivelul de inteligen). n acest caz, prin acceptarea ipotezei denul(respingerea ipotezei cercetrii) am comis o eroare de tip II.

    Puterea testului este definit prin capacitatea sau sensibilitatea unui test statistic de adetecta un efect real (sau o legtur real) ntre variabile. nelegem prin efect real faptul cmodificri ale valorilor unei variabile se regsesc n modificri ale valorilor celeilalte variabile(indiferent dac relaia este de tip cauzal sau de tip asociativ). Formulat n termeni statistici,

    puterea testului este probabilitatea de a respinge ipoteza de nul atunci cnd ea este cu adevratfals, i se exprim ca 1-beta (probabilitatea erorii de tip II). Aceast situaie corespunde celeimai bune decizii pe care i-o poate dori un cercettor: s dovedeasc c ipoteza a cercetrii esterealmente adevrat. Dac n viaa real ipoteza de nul este fals, dar datele cercetrii ne obligtotui s o acceptm, atunci putem spune c cercetarea noastr a avut o putere insuficient pentrua determina respingerea ei i, implicit, confirmarea ipotezei cercetrii.

    Aa cum am vzut, eroarea de tip II i puterea testului sunt complementare. Ca urmare,putem calcula eroarea de tip II ca beta=1-puterea testului. Cu alte cuvinte, cu ct puterea testuluieste mai mare, cu att probabilitatea erorii de tip II (acceptarea nejustificat a ipotezei de nul)este mai mic. Dac presupunem c puterea unui experiment psihologic este de 0.85, rezult c

    probabilitatea erorii de tip II este 1-0.85, adic 0.15. Complementar, dac puterea experimentului(cercetrii) ar fi de 0.15, atunci probabilitatea erorii de tip II s-ar ridic la 1-0.15, adic 0.85.

    Factori care contribuie la creterea puterii testelor statistice

    Puterea testului statistic sau, la fel de bine spus, a cercetrii, poate fi calculat matematic.Introducerea procedurilor de calcul pentru puterea testului este dincolo de obiectivele pe care nile propunem aici, mai ales c ele nu se regsesc n pachetele obinuite de analiz statistic. Vomreine ns, o serie de metode prin care poate fi asigurat creterea puterii testelor statistice, aacum sunt ele sintetizate n literatura statistic (B. Cohen, 2004, Spata, 2003):

    1.Aa cum tim, eroarea standard a mediei este cu att mai mare cu ct eantionul este maimic. Ca urmare, una din modalitile prin care putem crete puterea este cretereavolumului eantionului (N).2.

    O cale de cretere a puterii este maximizarea variabilitii primare, aceea care decurgeca urmare a efectului unei variabile asupra celeilalte. Aceasta deoarece efectulvariabilei independente se manifest mai puternic pe grupurile de subieci aflate laextremitile scalei de msurare a variabilei dependente dect pe valorile ntregii scale.Dac mprtierea datelor de cercetare este mic, atunci puterea testului de a surprinde unefect semnificativ se reduce.3.Reducerea erorilor de msurare are ca efect mrirea puterii cercetrii. n acest scoptrebuie avute n vedere: utilizarea unor proceduri de investigare adecvate; controlul ieliminarea surselor de eroare; tratarea identic a tuturor subiecilor cercetrii; selectareaaleatoare a eantioanelor sau, n cazul unei eantionri nealeatoare, eliminarea surselor deselecie prtinitoare (bias).4.Modelul de cercetare, prin el nsui, este cel care poate crete puterea unui studiu. Deexemplu, modelele de cercetare within-subjects (intra-subiect), care msoar aceiaisubieci n condiii diferite, au mai mult putere dect modelele between-subjects (inter-

  • 7/29/2019 Seminar 06- statistica psihologica

    6/12

    subiect), n care sunt comparate grupuri de subieci diferii n condiii diferite.5.Testul bilateral reduce probabilitatea erorii de tip I, dar crete probabilitatea erorii de tipII i, implicit, reduce puterea. Ca urmare, ori de cte ori este justificabil, se va opta pentrutest unilateral, chiar dac, n practic, testul bilateral este cel uzual.6.Testele parametrice prezint o putere statistic mai mare dect cele neparametrice,motiv pentru care, utilizarea acestora din urm se va face doar atunci cnd este absolut

    necesar (n conformitate cu condiiile de aplicare). Nu se va renuna cu uurin la un testparametric, dac datele cercetrii sunt msurate pe scal cantitativ.

    Nu trebuie s nelegem ns, c asigurarea unei puteri ct mai mari este principalulobiectiv pentru un cercettor. Prea mult putere este tot att de nedorit ca i prea puin. Dacavem n vedere intercondiionrile din procesul deciziei statistice, atunci trebuie s observm c

    prin creterea puterii reducem probabilitatea erorii de tip II, dar cretem probabilitatea erorii detip I. Cu alte cuvinte, dac un studiu are o putere mare, de exemplu prin utilizarea unui eantionfoarte mare, atunci crete probabilitatea de a respinge ipoteza de nul, chiar dac aceasta esteadevrat. Ne aflm aici n situaia care a generat critici vehemente cu privire la cercetrilestatistice, i care a fost exprimat n maniera cea mai direct de Thompson (1998a) ... testulstatistic devine o cutare tautologic pentru suficieni participani n msur s ating

    semnificaia statistic.Calitatea deciziei unei cercetri reprezint rezultatul unei negocieri ntre nivelulacceptat pentru erorile de tip I i II. Cu ct prima este mai mic, cu att a doua este mai mare, iinvers. S presupunem c studiul privind inteligena olimpicilor este efectuat n mod identic dedoi cercettori, dar unul dintre ei fixeaz nivelul lui alfa la 0.05, iar al doilea, la 0.01. Dac nurma prelucrrii datelor rezultatului obinut i corespunde un p=0.03, primul cercettor varespinge ipoteza de nul, confirmnd ipoteza cercetrii, n timp ce al doilea va fi nevoit s admitipoteza de nul i s resping ipoteza cercetrii. Prin fixarea unui nivel mai redus pentru alfa, aldoilea cercettor a redus probabilitatea erorii de tip I, dar a redus i puterea testului, mrind nschimb riscul erorii de tip II (respingerea unei ipoteze de cercetare adevrate).

    n concluzie, atunci cnd fixm criteriile de decizie statistic trebuie s fim contieni deurmtoarele aspecte:

    cu ct este mai mic pragul alfa, cu att puterea testului este mai mic i invers, cu ct alfaeste mai mare, cu att puterea testului este mai mare;cu ct alfa este mai mic, cu att scade probabilitatea erorii de tip I (respingerea ipotezeide nul cnd aceasta este adevrat);cu ct alfa este mai mic, cu att testul este mai riguros, probabilitatea de a confirmaipoteza cercetrii dac este fals, fiind mai mic;un prag alfa de 0.01 (comparat cu 0.05 sau 0.1) nseamn c cercettorul este precaut,dorind s i asume un risc de a grei de 1 dintr-o sut de cazuri atunci cnd respingeipoteza de nul, dac aceasta este adevrat;un prag alfa de 0.01 nseamn c exist 99% anse de a decide c nu exist diferene atuncicnd acestea ntr-adevr nu exist;mrind nivelul lui alfa (de la 0.01 la 0.05 sau 0.1), cretem riscul de a face o eroare de tip Ii reducem riscul de a face o eroare de tip II, ceea ce nseamn i o reducere a rigoriitestului;n egal msur, dac mrim pragul alfa, de la 0.01, la 0.05 sau 0.1, mrim puterea,deoarece cretem probabilitatea de respingere a ipotezei de nul (acceptnd ipotezacercetrii), atunci cnd aceasta din urm este adevrat (eroare de tip I);

    Din cele spuse s-ar putea deduce c, dac ne propunem cea mai mare valoare pentruputerea testului, atunci singura opiune pe care o avem este s fixm pragul alfa la nivelul maximpermis de convenia tiinific (0.05). n realitate, problema nu este att de simpl, deoareceobiectivul unei cercetri nu se poate limita doar la atingerea pragului de semnificaie. Aa cumam vzut, acesta poate fi atins prin mrirea volumului eantionului, iar simpla constatare a unuirezultat semnificativ nu ne spune nimic despre intensitatea relaiei dintre variabilele studiate,despre importana practic i despre utilitatea rezultatului obinut.

    Cunoaterea puterii unei cercetri este util n dou situaii:

  • 7/29/2019 Seminar 06- statistica psihologica

    7/12

    a.. n faza premergtoare a unei cercetri estimarea puterii este util pentru a evaluaansa de a obine un rezultat semnificativ statistic n contextul unei cercetri. Dac putereaestimat a testului este prea mic, devine lipsit de interes s angajm eforturi i costuri pentruconducerea acelei cercetri. Ct de mic poate fi puterea unei cercetri pentru a acceptaefectuarea ei? La aceasta ntrebare cei mai muli cercettori consider c 0.5 este prea puin

    pentru a investi timp i bani n efectuarea ei. O putere de 0.7, care corespunde unei probabiliti

    de 0.3 pentru eroarea de tip II, este considerat ca fiind minim, iar o putere de 0.8 esteconsiderat cel mai bun compromis ntre nivelul puterii i consecinele negative de care amvorbit anterior (B. Cohen, 2001).

    b. Dup efectuarea unei cercetri, pentru a ti care este probabilitatea ca rezultatulacesteia s indice un efect al variabilei independente asupra variabilei dependente atunci cndacest efect exist i n realitate.

    n practic calcularea puterii unei cercetri se face cu programe specializate. Unul dintrecele mai accesibile i mai cunoscut dintre acestea este GPower, care poate fi descrcat gratuit de laadresahttp://www.psycho.uni-duesseldorf.de/aap/projects/gpower/(Buchner, Erdfelder & Faul, 1997).

    Mrimea efectului

    S considerm c rezultatul explorrii muntelui presupus aurifer conduce la respingereaipotezei de nul, iar geologii concluzioneaz c eantionul conine aur ntr-o proporiesemnificativ. nseamn oare acest lucru c muntele conine mult aur? Desigur, nu. nseamndoar c acea cantitate de aur gsit n eantion are o probabilitate prea mic s fie acolo dinntmplare, motiv pentru care s-a decis c prezena ei semnaleaz o concentraie similar lanivelul ntregului munte (populaii). Ct de mare este cantitatea de aur nu putem ti doar pe

    baza testului de semnificaie statistic, deoarece acesta nu exprim dect o decizie probabilistici nu o evaluare cantitativ.

    Situaia este identic n cazul cercetrii cu privire la relaia dintre participarea laolimpiadele colare i nivelul de inteligen, unde am obinut pentru eantionul de olimpici omedie QI=106. Aplicnd criteriile deciziei statistice, am concluzionat c diferena de 6 unitifa de media populaiei (QI=100) este semnificativ i am respins ipoteza de nul. Dar ce putemspune despre aceast diferen, ct de mare este ea? n vorbirea curent, prin semnificativ senelege i important sau mare. n cazul deciziei statistice ns, semnificativ are un neleslimitat la expresia probabilitate prea mic pentru a rezulta din ntmplare. De aceea, din ce nce mai muli autori (Daniel, 1998; Denis, 2003; Fan, 2001; Kotrlik & Williams, 2003;Thompson, 1998b) consider c decizia statistic nu este suficient pentru a proba integralvaloarea unei ipoteze de cercetare. Respingerea ipotezei de nul pe baza criteriului alfa nu ofersuficientinformaie cu privire la relaia dintre variabilele cercetrii. Este evident c rezultatul testului(QI=106) conine i o component de mrime. Dac media eantionului ar fi fost 108, sau 120,diferena ar fi fost mai mare dect 106. i totui, respingerea ipotezei de nul i considerarearezultatului drept semnificativ nu exprim n nici un fel nivelul de mrime al diferenei. Maimult, ne amintim c puterea testului crete pe msur ce crete volumul eantionului. Ca urmare,un rezultat semnificativ poate fi obinut fie i numai prin creterea numrului de subieci, fr

    ca relaia dintre cele dou variabile s fie una intens.

    Problema semnalat este mai acut dect pare la prima vedere. Criticii deciziei bazate petestarea ipotezei de nul merg pn acolo nct cer eliminarea acestui model de decizie cu privire laipotezele cercetrilor tiinifice. La rndul ei, American Psychological Association a organizat ungrup de lucru avnd ca obiect elaborarea unor recomandri cu privire la raportarea rezultatelorstatistice (Wilkinson&APA Task Force on Statistical Inference, 1999). Concluziile acestui grupde lucru stipuleaz c raportarea i interpretarea mrimii efectului (...) este esenial pentru ocercetare bun. n opinia autorilor, raportarea i interpretarea mrimii efectului prezint treiavantaje importante:

    faciliteaz studiile de metaanaliz (studii care sintetizeaz rezultatele mai multorcercetri pe aceeai tem);

    faciliteaz formularea unor ipoteze cu un grad mai mare de specificitate de ctre

    http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/
  • 7/29/2019 Seminar 06- statistica psihologica

    8/12

    cercettorii care vor studia aceeai tem;faciliteaz integrarea rezultatului unei cercetri n literatura dedicat acelui subiect,

    Una dintre soluiile acestei probleme este calcularea unui indice de mrime a efectuluicare ofer o informaie suplimentar, extrem de util n interpretarea rezultatului testelorstatistice. Aceast informaie ne apropie mai mult de semnificaia practic a rezultatului

    cercetrii, ceea ce nseamn mai mult dect semnificaia statistic.

    Calcularea mrimii efectului pentru testul z (t) pentru un singur eantion

    Indicele de mrime a efectului este, n esen, o valoare numeric ce exprim fora saumrimea relaiei dintre variabilele cercetate, indiferent dac aceast este de tip cauzal sau nu.Principial, atunci cnd comparm dou medii, formula de calcul pentru mrimea efectului se

    bazeaz pe diferena dintre aceste medii, raportat la un indicator al variabilitii.

    n cazul testului z sau t pentru diferena dintre media unui eantion i media populaiei,indicele de mrime a efectului se calculeaz dup formula lui Cohen (1988):

    unde:m=media eantionului=media populaiei=abaterea standard a populaiei (atunci cnd nu o cunoatem, putem utiliza

    abaterea standard a eantionului)

    Ca urmare, mrimea efectului pentru rezultatul cercetrii cu privire la relaia dintreparticiparea la olimpiadele colare i nivelul inteligenei este:

    106-100d= =0.415

    Dat fiind faptul c d este calculat prin raportarea diferenei la abaterea standard, el esteconsiderat un indice standardizat al mrimii efectului. Acesta se exprim printr-un numrzecimal cuprins ntre 0 (efect nul) i 1 (efect maxim). Valori mai mari de 1 pot fi obinute uneori,dar numai n cazuri extreme. Valorile mici exprim un nivel redus al intensitii relaiei dintrevariabile (chiar dac este semnificativ), n timp ce valorile mari indic o relaie intens(puternic).

    Dar cum putem s interpretm valoarea lui d? O valoare ca cea obinut n cercetareanoastr este mare, sau mic? n cazul explorrii zcmntului aurifer, geologii pot estimasuficient de exact cantitatea de aur pe care o pot extrage din zcmnt, pornind de la concentraiade aur din eantionul explorat. n general, evalurile mrimii efectului n mediul ingineresc suntde ateptat s fie mult mai mari dect cele din cercetrile socio-umane. Spre deosebire detiinele naturii, n psihologie rspunsul la aceast ntrebare nu este uor de gsit. Ca urmarecercettorii sunt ndreptii s dezvolte propriile repere de apreciere a mrimii efectului ca fiindmici, medii sau mari. n psihologie, interpretarea valorii lui d se face dup un model

    propus de Cohen (op.cit.), care a devenit un standard preluat de toi cercettorii, i care fixeazdoar trei praguri de mrime:

    D(Cohen)

    0.20 efect mic0.50 efect mediu0.80 efect mare

  • 7/29/2019 Seminar 06- statistica psihologica

    9/12

    n conformitate cu recomandrile lui Cohen, d=0.8 este considerat un efect mare. Nu attde mare nct s rezulte ca evident prin observaie direct, dar suficient de mare pentru a exista o

    bun ans de a fi gsit ca statistic semnificativ prin utilizarea unui eantion format dintr-unnumr relativ mic de subieci. Prin contrast, d=0.2 este considerat un efect mic. Pentru valori maireduse dect att, iniierea unei cercetri nu se justific.

    Revenind la studiul din exemplul nostru, rezultatul obinut corespunde unui nivel moderat

    al mrimii efectului (d=0.4). Sau, altfel spus, diferena dintre media inteligenei elevilor olimpicii populaia de elevi are un indice moderat de mrime. Acest lucru ar putea fi interpretat nsensul c prezena la olimpiad este asociat n mod semnificativ cu inteligena, dar are i altecomponente importante care o determin.

    Calcularea mrimii efectului nu este oferit n toate situaiile de programele de prelucrarestatistic. Din fericire, formulele de calcul nu sunt laborioase, putnd fi aplicate cu uurin perezultatele oferite de aceste programe. O prezentare sintetic i practic a formulelor de calculale mrimii efectului pentru diverse teste statistice de semnificaie ne ofer Thalheimer&Cook(2002).

    Relaia dintre mrimea efectului i puterea testului

    Mrimea efectului poate fi ilustrat prin gradul de suprapunere dintre distribuiile supusecomparaiei (distribuia de nul i distribuia cercetrii). Cu ct suprafaa comun a celor doudistribuii este mai mic, mediile celor dou distribuii devin tot mai ndeprtate una de alta, iarmrimea efectului crete. Imaginea de mai jos ilustreaz exact acest lucru:

    Interpretare rezultatului unui test statistic

    n contextul celor spuse pn acum, pentru a putea interpreta mai complet rezultateleunei cercetri statistice, trebuie s inem cont att de nivelul de semnificaie, ct i de putereatestului i de mrimea efectului. Un algoritm de evaluare a rezultatului la testul statistic este

    prezentat n tabloul urmtor:Rezultatsemnificativ

    statistic?

    (se respinge H0?)

    Volumul

    ealonului*Concluzii

    DA MIC

    Rezultat important.

    Chiar dac puterea testului este mic, din cauzavolumului redus al eantionului, existena unuirezultat semnificativ arat o mrime a efectului

    important

  • 7/29/2019 Seminar 06- statistica psihologica

    10/12

    DA MARE

    Rezultatul poate fi important sau nu:

    - semnificaia poate rezulta din puterea ridicat atestului, ca urmare a volumului mare al eantionului

    SAU

    - poate fi expresia unei diferene importante dintrepopulaiile comparate

    NU MIC

    Rezultatul este neconcludent. Absena semnificaieistatistice se poate datora:

    - faptului c ipoteza este fals

    SAU

    - puterii reduse a testului, ca urmare a eantionuluiprea mic

    NU MARE

    Ipoteza cercetrii este probabil fals din cauz c,n ciuda puterii ridicate (eantion mare), rezultatul nua atins nivelul semnificaiei statistice .

    Mrimea efectului este foarte mic

    *Facem precizarea c n acest context eantion mic sau mare nu se refer la N=30 desubieci la care am fcut referire n cazul teoremei limitei centrale. Se poate considera ns uneantion mic ca fiind de ordinul zecilor, iar unul mare de ordinul sutelor.

    Rezumat

    Eroarea de tip I este probabilitatea de a respinge o ipotez de nul adevrat (se accept oipotez a cercetrii care este fals) rezultat fals pozitiv.Eroarea de tip II este probabilitatea de a se admite o ipotez de nul fals (se respinge

    H1 ipotez a cercetrii adevrat) rezultat fals negativ.O eroare de tip III apare atunci cnd rezultatul cercetrii, dei semnificativ, este greitatribuit efectului variabilei independente, sau este n opoziie cu sensul real.Erorile de tip I i II sunt n egal msur negative dar, de regul, acordm mai multatenie erorii de tip I, ncercnd s inem alfa la o valoare ct mai mic.Puterea testului este o mrime probabilist care indic ansa de a obine un rezultatsemnificativ statistic.Puterea variaz n funcie de nivelul pragului alfa (eroarea de tip I). Cu ct alfa este maimic, cu att puterea testului scade.Dac reducem alfa de la 0.05 la 0.01, reducem probabilitatea de a face o eroare de tip 1dar, n acelai timp, facem mai dificil respingerea ipotezei de nul i, n egal msur,cretem probabilitatea de a face o eroare de tip II.Puterea testului este complementar erorii de tip II (suma lor este 1).Mrimea efectului este o valoare care indic intensitatea relaiei dintre variabilaindependent i variabila independent.

  • 7/29/2019 Seminar 06- statistica psihologica

    11/12

    Mrimea efectului este n legtur cu puterea testului i cu volumul eantionului. Cu ctputerea este mai mare i eantionul este mai mic, cu att mrimea efectului este mairidicat.Calcularea mrimii efectului, alturi de semnificaia statistic, este o exigen actual ncercetarea tiinific psihologic.

    EXERCIII

    1.Calculai mrimea efectului pentru exerciiile din tema pentru acas a cursului 5 i apreciairezultatul prin prisma grilei lui Cohen (utiliznd abaterea standard a eantionului dreptestimare a abaterii standard a populaiei, acolo unde nu este dat).2.Care este eroarea de tip II () atunci cnd puterea este: 0.64; 0.93?3.Care este puterea testului dac eroarea de tip II () este: 0.15; 0.46?

    Anexa 2.Tabelul valorilor critice pentru distribuia t Student (bilateral)

    Df(N-1)

    a = 6,10 a = 0,05a =

    0,025a = 0,01 a = 0,005

    a =0,0005

    1 3,078 6,314 12,706 31,821 63,657 636,6202 1,886 2,920 4,303 6,965 9,925 31,5983 1,638 2,353 3,182 4,541 5,841 12,9244 1.&3 2,132 2,776 3,747 4,604 8,6105 1,476 2,015 2.571 3,365 4,032 6,869

    6 1,440 1,943 2,447 3,143 3,707 5,9597 1,415 1,895 2,365 2,998 3,499 5,4088 1,397 1,860 2,306 2,896 3,355 5,0419 1.383 1,833 2,262 2,821 3,250 4,78110 1,372 1,812 2,228 2,764 3,169 4,58711 1,363 1,796 . 2,201 2.718 3,106 4,43712 1,356 1,782 2,179 2,681 3,055 4,31813 1,350 1,771 2,160 2,650 3,102 4,221

    14 1,345 1,760 2,145 2,624 2,977 4,14015 1,341 1,753 2,131 2,602 2,947 4,07316 1,337 1,746 2,120 2,583 2,921 4.01517 1,333 1,740 2,110 2,567 2,898 3,96518 1,330 1,734 2,101 2,552 2,878 3.92219 1,328 1,729 2,093 2,539 2,861 3,88320 1,325 1,725 2,086 2,528 2,845 3,85021 1,323 1,721 2,080 2,528 2,831 3.819

    22 1,321 1.717 2,074 2,508 2,819 3,792

  • 7/29/2019 Seminar 06- statistica psihologica

    12/12

    23 1,319 1,714 2,069 2,500 2.807 3,76724 1,318 1,711 2.064 2,492 2.797 3,74525 1,316 1,708 2,060 2,485 2.787 3,72526 1,315 1,706 2,056 2,479 2.779 3,70727 1,314 1,703 2,052 2.473 2,771 3.69028 1,313 1,701 2.04 2.467 2,763 3,67429 1,311 1,699 2,045 2.462 2,756 3,65930 1,310 1.697 2,042 2.457 2,750 3,64640 1,303 1,684 2,021 2,423 2,704 3,55160 1,2% 1,671 2,000 2.390 2,660 3,460

    120 1,289 1,658 1,980 2,358 2,617 3,373

    1,282 1,645 1.960 2,326 2,576 3,291


Recommended