Statistica

Date post:02-Oct-2015
Category:
View:231 times
Download:0 times
Share this document with a friend
Transcript:

STATISTICA INFERENTIALA

STATISTICA INFERENTIALA

Statistica descriptiva se ocupa de analiza datelor sub aspectul caracteristicilor lor intrinseci (frecventa valorilor, indicatorii tendintei centrale, ai mprastierii sau formei distributiilor). Tinta finala a metodei stiintifice insa nu se limiteaza la descrierea datelor ci vizeaza evidentierea relatiilor dintre ele si, pe aceasta baza, predictia si ntelegerea fenomenelor psihice. Aceste proceduri fac parte din ceea ce se numeste statistica inferentiala

Scoruri standard (z)Cnd msurm o anumit caracteristic a unui individ (stabilitatea emotionala, anxietate, etc.) scopul implicit este acela de a efectua comparaii. Pentru aceasta ns, simpla expresie numeric a caracteristicii respective nu este suficient.

Modalitatea de a exprima semnificaia unei anumite valori dintr-o distribuie prin raportare la parametrii distribuiei (medie i abatere standard) este scorul normat z (numit i not z sau scor z). Aceasta msoar distana dintre o anumit valoare i media distribuiei, n abateri standard:

unde X reprezint oricare dintre valorile distribuiei

Scorul z se numete i scor standardizat. Aceasta inseamna c poate fi utilizat pentru a compara valori care provin din distribuii diferite, indiferent de unitatea de msur a fiecreia.

Exemplu: Dac un subiect obine un scor echivalent cu z=+0.5 la un test de memorie i un scor echivalent cu z=+0.4, la un test de inteligenta, se poate spune c are o performan mai bun la primul test dect la al doilea.

Proprietile scorurilor z

1. Media unei distribuii z este ntotdeauna egal cu 0. Aceasta rezult din proprietatea mediei de a se diminua corespunztor dac se extrage o constant din fiecare valoare a unei distribuii. Formula de calcul pentru z implic scderea unei constante din fiecare valoare a distribuiei. Aceasta nseamn c i media noii distribuii (z) se va reduce cu constanta respectiv. Dar aceast constant este nsi media distribuiei originale, ceea ce nseamn c distribuia z va avea media egal cu zero, ca rezultat al diminurii mediei cu ea nsi.

2. Abaterea standard a unei distribuii z este ntotdeauna 1. Acest fapt decurge prin efectul cumulat al proprietilor abaterii standard. Prima proprietate afirm c n cazul scderii unei constante (n cazul scorurilor z, media) din valorile unei distribuii, abaterea standard a acesteia nu se modific. A doua proprietate afirm c n cazul mpririi valorilor unei distribuii la o constant, noua abatere standard este rezultatul raportului dintre vechea abatere standard i constant. Dar constanta de care vorbim este, n cazul distribuiei z, chiar abaterea standard. Ca urmare, noua abatere standard este un raport dintre dou valori identice al crui rezultat, evident, este 1.

Alte tipuri de scoruri standardizate

Notele z prezint dou avantaje importante: permit compararea valorilor unei distribuii, i a valorilor provenind din distribuii diferite, ca urmare a faptului ca se exprim n abateri standard de la medie.

Notele z au, ns, i unele dezavantaje: se exprim prin numere mici, cu zecimale, (greu de manipulat intuitiv) i, n plus, pot lua valori negative. Aceste dezavantaje pot fi nlturate printr-un artificiu de calcul care s conduc la note standardizate convenabile (ce corespund anumitor nevoi specifice). Iata cteva tipuri de note standard calculate pe baza notelor z.

Deci:

Toate variantele sunt obinute prin transformarea operat pe distribuia de note z.

La nici una dintre variante nu mai avem valori negative

Zecimalele nu mai sunt semnificative

Notele standard mari indic o valori mari iar notele standard mici indic valori mici.

PROPRIETATILE CURBEI NORMALE

Asa cum am vazut rezultatelor msurrilor pot lua diverse forme, curba distribuiei putnd fi unimodal sau multimodal, aplatizat sau nalt, simetric sau asimetric. n statistic exist ns un tip special de distribuie, numit distribuie normal, care nu este rezultatul unui proces real de msurare ci reprezint un model teoretic. Conceptul de curb normal are cteva proprieti caracteristice:

are form de clopot- cea mai mare parte a valorilor se concentreaz n zona central

este perfect simetric pe ambele laturi ale sale

de fiecare parte a mediei se afl exact jumtate dintre valorile distribuiei

Curbe normale

Exemple de curbe normale, care respect condiiile de mai sus, chiar dac au medii i abateri standard diferite.

Curba normal standardizat (z)

Curba normal n care valorile sunt exprimate n scoruri z se numete curba normal standardizat. Ea are toate proprietile enunate mai sus, avnd ns i parametrii oricrei distribuii z: m=0 i s=1. Valoarea 0 pentru medie a fost aleas convenional pentru c astfel distribuia este simetric n jurul lui 0.

Curba normal standardizat are cteva caracteristici care sunt figurate n imaginea de mai sus i pe care este important s le reinem:

aproximativ 34% dintre scorurile distribuiei normale se afl ntre medie i o abatere standard deasupra mediei (z=+1)

intre 1z i +1z se afl aproximativ 68% dintre valorile distribuiei

aproximativ 96% dintre scoruri se afl ntre 2z i +2z

Curba normal are o importan aparte pentru analiza statistic. Aceasta, deoarece se accept faptul c variabilele statistice s-ar distribui mai ales sub aceasta form dac ar fi efectuate un numr mare (tinznd spre infinit) de msurri.

Curba normal si problema probabilitatii

Procentajul ariilor de sub curba normal poate fi citit i ca probabilitatea a distribuiei. Probabilitatea nseamn frecvena relativ a apariiei unui eveniment. Acesta se traduce prin ct de siguri putem fi c acel eveniment apare.

Rezult de aici c valorile din zona central a curbei sunt mai frecvente (mai multe), pentru ca apariia lor este mai probabil. n acelai timp, valorile mai puin probabile, apar mai rar, i se plaseaza in zonele extreme ale distribuiei (curbei).

Dac probabilitatea reprezint raportul dintre evenimentul favorabil i toate evenimentele posibile, atunci valoarea ei variaz ntre 0 i 1. Ea poate fi exprimat i n procente. De exemplu, probabilitatea de 0.05 corespunde unui procentaj de apariie de 5%

Utiliznd simbolul p (de la probabilitate), spunem c dac p0.05, one-tailed.

Atentie!

Orice valoare a lui p mai mare de 0.05 este considerat nesemnificativ, dac nu a fost fixat un alt prag, mai sever.

TESTUL T PENTRU EANTIOANE INDEPENDENTE

Unul dintre modelele de cercetare frecvente, ns, este acela care vizeaz punerea n eviden a diferenelor care exist ntre dou categorii de subieci. n situaii de acest gen psihologul compar mediile unei variabile msurat pe dou eantioane compuse din subieci care difer sub aspectul altor variabile (sexul, nivel de instruire, etc.). Variabila supus comparaiei este variabila dependent, deoarece presupunem c suport efectul variabilei sub care se disting cele dou eantioane i care, din acest motiv, este variabil independent. n situaii de acest gen, eantioanele supuse cercetrii se numesc independente, deoarece sunt constituite, fiecare, din subieci diferii.

Procedura statistic pentru testarea semnificaiei diferenei dintre mediile a dou eantioane

Problema pe care trebuie s o rezolvm este urmtoarea: Este diferena dintre cele dou eantioane suficient de mare pentru a o putea considera ca determinat de variabila independent, sau este doar una dintre diferenele probabile, generat de jocul hazardului la constituirea perechii de eantioane? Vom observa c sarcina noastr se reduce, de fapt, la ceea ce am realizat anterior n cazul testului z sau t pentru un singur eantion. Va trebui s vedem dac diferena dintre dou eantioane reale se distaneaz semnificativ de diferena la care ne putem atepta n cazul extragerii absolut aleatoare a unor perechi de eantioane, pentru care distribuia diferenelor este normal. Mai departe, dac probabilitatea de a obine din ntmplare un astfel de rezultat (diferen) este prea mic (maxim 5%) o putem neglija i accepta ipoteza c ntre cele dou variabile este o relaie semnificativ.

Dac avem valoarea diferenei dintre cele dou eantioane cercetate, ne mai sunt necesare doar media populaiei (de diferene ale mediilor) i abaterea standard a acesteia, pentru a calcula testul z (n cazul eantioanelor mari) sau cel t (n cazul eantioanelor mici). n final, nu ne rmne dect s citim valoarea tabelar pentru a vedea care este probabilitatea de a se obine un rezultat mai bun (o diferen mai mare ) pe o baz strict ntmpltoare.

Media populaiei de diferene. Diferena dintre mediile celor dou eantioane ale cercetrii face parte, aa cum am spus, dintr-o populaie compus din toate diferenele posibile de eantioane perechi. Media acestei populaii este 0 (zero). Atunci cnd extragem un eantion aleator dintr-o populaie, valoarea sa tinde sa se plaseze n zona centrala cea mai probabil). Dar aceeai tendin o va avea i media oricrui eantion extras din populaia pereche. Ca urmare, la calcularea diferenei dintre mediile a dou eantioane, cel mai probabile sunt diferenele mici, tinznd spre zero. Astfel, ele vor ocupa partea central a distribuiei, conturnd o medie tot mai aproape de zero cu ct numrul eantioanelor extrase va fi mai mare.

a. Testul t pentru dispersii diferite

Acesta se bazeaz pe considerarea separat a dispersiilor celor dou populaii (estimate prin dispersiile eantioanelor).

b. Testul t pentru dispersia cumulat

Dispersiile celor dou eantioane pot fi considerate mpreun pentru a forma o singur estimare a dispersiei populaiei ((2). Obinem astfel ceea ce se numete dispersia cumulat, pe care o vom nota cu.

EXEMPLU:

S presupunem c vrem s vedem dac recompensa (variabila independent) determin o cretere a duratei de concentrare a atentiei, constatata printr-un numr mai mare de minute in timpul orei in care copii ramin atenti la ex

Click here to load reader

Reader Image
Embed Size (px)
Recommended