+ All Categories
Home > Documents > Statistica I - Aurel Stan

Statistica I - Aurel Stan

Date post: 19-Nov-2015
Category:
Upload: cristina10shark
View: 173 times
Download: 43 times
Share this document with a friend
Description:
Statistica I - Aurel Stan
66
CUPRINS I. INTRODUCERE II. STATISTICĂ DESCRIPTIVĂ III. GRUPAREA ŞI SISTEMATIZAREA DATELOR IV. INDICATORII STATISTICI V. MODELELE TEORETICE DE RAPORTARE BIBLIOGRAFIE C CONF . .DR . . A AUREL S S T T A AN N STATISTIC Ă I
Transcript
  • CC UU PP RR II NN SS

    I. INTRODUCERE II. STATISTIC DESCRIPTIV III. GRUPAREA I SISTEMATIZAREA DATELOR IV. INDICATORII STATISTICI V. MODELELE TEORETICE DE RAPORTARE BIBLIOGRAFIE

    CCOONNFF..DDRR.. AAUURREELL SSTTAANN SS TT AA TT II SS TT II CC II

  • SCOPUL UNITII DE CURS Familiarizarea cursanilor cu problemele principale ale statisticii infereniale aplicate n psihologie; Informarea cursanilor asupra principalelor tipuri de aplicaii ale statisticii infereniale n domeniul

    psihologic de cercetare; Informarea cursanilor asupra specificului variabilelor psihologice supuse procesului de prelucrare

    statistic; Informarea cursanilor asupra limitelor interpretrii statistice n cercetarea psihologic OBIECTIVE OPERAIONALE n urma studierii acestei uniti de curs, studenii trebuie s-i formeze urmtoarele deprinderi intelectuale: S opereze cu principalele concepte statistice aplicate n domeniul psihologiei; S precizeze principalele scale de msur utilizate n domeniul cercetrii psihologice i s disting

    specificul acestora n cazul unor cercetri concrete; S precizeze situaiile de aplicare n psihologie a conceptelor statistice referitoare diferenierea i

    asocierea seriilor de valori ale unei variabile; S precizeze specificul principalilor indicatori statistici i s cunoasc etapele calculrii lor. S precizeze sensul i non-sensul indicatorilor statistici; S precizeze sensul diferitelor abateri de la distribuia normal; S poat utiliza corect datele coninute n tabelul anex. EVALUARE Se va realiza n cadrul unui examen scris la sfritul semestrului. Pentru examen se vor stabili dou tipuri de subiecte: un tip referitor la teoria statistic i un tip referitor la aplicarea n practic a cunotinelor dobndite. n cadrul activitilor tutoriale se vor exersa subiectele cu caracter practic i se va verifica realizarea exerciiilor de la sfritul capitolelor. Tipurile de subiecte pentru examen vor fi egal ponderate pentru nota final obinut la examen

  • STATISTIC I

    93

    INTRODUCERE

    ntr-o definiie succint, statistica este un ansamblu de metode care au drept obiect colectarea, organizarea, tratamentul i interpretarea datelor de observaie care se refer la grupuri de persoane sau de obiecte. Exist discuii, care nu vor fi comentate n manualul nostru, asupra autonomiei statisticii ca tiin, din cauza faptului c o bun parte din metodele statisticii aparine domeniului matematic, n consecin se susine c statistica nu ar fi dect matematic aplicat, afirmaie care nu poate fi contestat. ns, dezvoltarea statisticii a prilejuit dezvoltarea unor modaliti de abordare a studiului datelor i a unor exigene metodologice de cercetare specifice care-i o confer un statut aparte, inconfundabil n ansamblul tiinelor moderne.

    Disciplina statisticii are o vast arie aplicativ, n domenii dintre cele mai diverse. Este foarte greu de indicat un domeniu al activitilor teoretice i practice n care s nu-i gseasc utilitatea. Statistica aplicat n psihologie va expune cteva consideraii teoretice strict necesare, fr s se preocupe de fundamentarea matematic a procedeelor folosite, chestiune care preocup specialitii n statistic teoretic, i va insista asupra specificului aplicativ al unor proceduri statistice n cercetarea psihologic sau n practica profesional ce presupune prelucrarea i interpretarea datelor. Interveniile statistice din domeniul psihologic se refer mai ales la acele date care provin de la grupuri de persoane, dar acest aspect nu poate fi generalizat.

    Originile preocuprilor statistice pot fi defalcate n funcie de considerarea acestora drept practici istoricete atestate sau drept contribuii tiinifice sistematizate. n primul caz se poate vorbi de o existen milenar (5-milenii) a acestora, n al doilea caz de una secular (4 secole anterioare). Nevoia de a colecta date cantitative asupra populaiei i condiiilor sale materiale de existen se face simit din momentul n care apar comunitii umane organizate (semnul apariiei acestora este dat naterea instituiilor de reglare a desfurrii vieii n comunitate, apariia statelor constituind forma evoluat a unor astfel de instituii). n China, Egipt, Grecia i Roma antic apar recensminte cerute de funcionarii administrativi, practici continuate n evul mediu (releveurile realizate la ordinele lui Charlemagne, Domesday Book a lui Wilhelm Cuceritorul, spre 1090) i n nceputurile perioadele moderne ale istoriei, prin numeroase inventare sau releveuri realizate ca urmare a unor ordonane regale sub impulsul lui Sully, a lui Colbert i a lui Vauban.

    n secolul al XVII-lea se profileaz concepte relative la bazele i la mijloacele studiilor statistice, deci putem vorbi nceputurile statisticii teoretice. n aceast perioad i contureaz apariia a dou coli de gndire n acest domeniu. coala german, numit i coala descriptiv, de la care pare c deriv cuvntul statistic (cuvntul german die Statistik), este fondat de ctre Herman Conring (1606-1681), profesor la Universitatea din Helmstadt, ale crui contribuii vor fi continuate prin Gottfried Achenwall (1719-1772). Cea de-a doua coal, denumit aritmetica politic are ca fondatori pe John Graunt

  • AUREL STAN

    94

    (1620-1764), Gregory King (1648-1712), Edmond Halley 1656-1742) i pe sir William Petty (1623-1687), i pune n eviden, dincolo de descriere, anumite permanene statistice, de exemplu raportul numrului de nateri masculine i acela al celor feminine. Edmond Hailley prezint un tabel de mortalitate care este baza lucrrilor actuariale contemporane, apoi un reprezentant al colii germane, Johann Peter Sssmilch (1707-1767), public importante lucrri asupra procentului de masculinitate la natere i asupra evoluiei acestuia pn la vrsta de 20 de ani.

    De o deosebit importan n fundamentarea teoretic a statisticii este apariia, n 1812, a lucrrii lui Pierre Simon de Laplace (1749-1827), intitulat Teoria analitic a probabilitilor, care pune n eviden avantajele care pot fi trase din aceast teorie n studiul fenomenelor naturale. n care cauzele sunt prea complexe pentru a le putea cunoate exhaustiv i a le analiza individual.

    Ca expresie a dezvoltrii statisticii, apar o serie de statistici autonome consacrate anumitor domenii de specialitate precum statistica aplicat n mecanic, agronomie i economie, a cror dezvoltare nu are rost n lucrarea noastr simplificat. Cele mai multe din aplicaiile statisticii se afl, fr ndoial, n domeniul economic i administrativ.

    Nu ncercm s facem o istorie amnunit a statisticii, lucrare care ar trebui s fie deosebit de laborioas, ci s punctm momente importante ale evoluiei acesteia, legate de aplicarea acestei discipline n domeniul tiinelor sociale. nceputul n aceast privin este fcut de savantul belgian Adolphe Quetelet, care a avut preocupri tiinifice de o larg diversitate n domeniul aplicaiilor statisticii1.

    Adolphe Qutelet (1796-1874) extinde cmpul de aplicare a metodei statistice n domeniile antropometric, psihologic i social. La iniiativa sa se reunete la Bruxelles, n 1853, primul congres internaional de statistic, precursor al Institutului internaional de statistic, fondat la Londra n anul 1885, instituie tiinific care a rmas deosebit de prestigioas pn n zilele noastre. Adolphe Qutelet a introdus noiunea de om mediu, controversat de-a lungul timpului, concept preluat de o serie statisticieni i sociologi. Ca urmare a lucrrilor tiinifice aparinnd lui Qutelet, acelora ale lui Francis Galton (1822-1911) i Karl Pearson (1857-1936), se fondeaz biostatistica sau biometria.

    n domeniul tiinelor umane, studiile lui Charles Spearman asupra comportamentului indivizilor, dezvoltate n psihologia aplicat, uman i animal, au condus la metode de analiz factorial, o prelungire logic a studiului corelaiilor. Francis Galton, Charles Spearman i Karl Pearson pot fi considerai ntemeietorii prestigioasei coli psihometrice engleze, care a influenat semnificativ modul de prelucrare a datelor n cercetrile psihologice.

    1 Pentru cei care doresc s cunoasc mai amnunit aspecte ale istoriei statisticii romneti i internaionale le recomandm lucrarea lui Mihai arc Tratat de statistic aplicat, Editura Didactic i Pedagogic R.A., Bucureti, 1998 i pe cea coordonat de Vladimir Trebici Mic enciclopedie de statistic, Editura tiinific i enciclopedic, Bucureti, 1985.

  • STATISTIC I

    95

    Psihologia devine tiin de sine stttoare abia n a doua jumtate a secolului al XIX-lea, odat cu accentuarea laturii experimentale n cercetare, n ale crei nceputuri au fost marcate acumulri de date care erau deficitare sub aspectul interpretrii lor. Procedeele statistice utilizate de psiholog vin, totodat, n ntmpinarea nevoii de diversificare a metodelor de cercetare, fapt ce conduce la interpretarea mai adecvat a rezultatelor investigaiilor tiinifice.

    Printre lucrrile de importan din ultimele decenii, enumerm pe cele ale lui Fisher, dEgon,

    Sharpe, Pearson Jerzy Neyman asupra teoriei testelor i acelea referitoare la estimaii, nscute din cercetrile empirice asupra aplicrii metodei sondajelor . Apariia unor puternice mijloace de calcul a permis, pe de alt parte, de a pune n aplicare noi metode de statistic descriptiv (care nu recurg la modele, nici la ipoteze), aplicabile la marile tabele de date multidimensionale. Aflate n germene la Charles Spearman i E. Pearson, aceste metode se regrupeaz sub numele de analiz a datelor, fiind dezvoltate prin H. Hotelling n anii 1930 i n Frana prin J.P. Benzecri n anii 1960.

    Actualmente, preocuprile de analiz statistic a datelor din domeniul tiinelor sociale, n general vorbind, sunt deosebit de intense, realizndu-se progrese teoretice i practice. Sub acest ultim aspect sunt de remarcat apariia unor programe computerizate destinate uurrii muncii de calcul (cel mai cunoscut i cel mai utilizat fiind SPSS-ul). Folosirea unor astfel de programe presupune, pentru exploatarea corect a rezultatelor, cunoaterea fundamentelor teoretice ale statisticii.

  • AUREL STAN

    96

    I. STATISTIC DESCRIPTIV O diviziune fundamental o disciplinei statisticii este n statistic descriptiv i statistic

    inferenial, diviziune care ine cont de ordinea istoric a apariiei celor dou ramuri. Statistica descriptiv s-a constituit n secolele XVII-XIX i se ocup cu descrierea fenomenelor statistice investigate prin culegerea i clasificarea datelor obinute dintr-o cercetare empiric, realizarea de rezumate i sinteze cu ajutorul unui limbaj numeric. Este un ansamblu de tehnici permind descrierea grupurilor de date i luarea deciziilor n absena unei informaii complete. Scopul unui astfel de demers este de a aduce datele ntr-o form clar i utilizabil. Informaiile de baz produse prin statisticile descriptive sunt media valorile maximale i minimale, diferite msurri ale variaiei i datele cuprinznd forma sau configuraia distribuiei variabilelor. Msurrile reprezint comportamente, competene, obinuine, aptitudini, capacitii sau alte tipuri de conduite care caracterizeaz performanele i definesc variabilele dependente. n statistic sunt utilizate mai multe metode sunt utilizate pentru (re)prezentarea organizat a datelor: histogramele, curbele, poligoanele de frecven, diagramele circulare. Examenul vizual al datelor prin intermediul graficelor constituie o manier economic, simpl i eficace de a observa distribuia eantionului prin raport la distribuia normal. Calculele realizate n statistica descriptiv duc la constituirea de valori relative, valori medii, dispersii, abateri. Statistica descriptiv trebuie considerat ca o etap a demersului statistic ce permite o exprimare cantitativ clar i coerent a mulimilor de date.

    I.1.NOIUNI FUNDAMENTALE nelegerea aseriunilor statistice este posibil din momentul n care ne nsuim o serie de noiuni

    fundamentale. ncepem prin a preciza care sunt noiunile fundamentale n statistic i cu eventuale precizri referitoare la unele sensuri specifice care opereaz n domeniul statisticii n legtur cu aceste noiuni.

    Una din aceste noiuni este cea de variabil. Este o noiune de care nu ne putem dispensa n explicaia tiinific, totalitatea studiilor experimentale apelnd frecvent la ea pentru a expune raiunea acestui demers tiinific, modul de derulare i concluziile trase. Este frecvent folosit mpreun cu noiunile de variaie i variabilitate. n Grand dictionnaire de la psychologie variabila este definit ca o entitate abstract care servete ca suport pentru o multitudine de valori2. Proprietatea variabilei de a lua anumite valori se numete variabilitate, iar oscilaiile valorice ale variabilei poart numele de variaie. Variaiile pot fi previzibile i imprevizibile. Variaiile sunt considerate previzibile n situaia n care orice

    2 Grand dictionnaire de la psychologie, Larousse, 1992, p. 816

  • STATISTIC I

    97

    valoare succesiv dintr-o serie poate fi determinat cu precizie sau mcar aproximat. Variaiile sunt imprevizibile cnd valorile succesive ale unei serii nu pot fi prevzute.

    Arthur Reber, autorul unui reputat dicionar de psihologie atrage atenia asupra faptului c, dei variabila este o entitate care sufer schimbri, ea este de fapt o abstracie, o form, o cantitate3. Astfel, dac realizm cercetri n domeniul senzaiilor auditive i suntem interesai de intensitatea tonului, variabila operativ este intensitatea; ntr-un studiu n care avem ca variabil dificultatea unui test, dificultatea este variabila real. Tonul i testele utilizate sunt doar moduri care permit intensitii i dificultii s se manifeste. Precizri necesare sunt fcute n matematic i logic unde noiunea de variabil este surprins mai explicit prin tratarea variabilei ca simbol care reprezint clase de lucruri sau domenii de valori care satisfac anumite condiii i nu orice lucru sau valoare particular. O valoare particular a variabilei este denumit modalitate sau variant de variaie. A desemna o variabil nseamn a-i atribui un nume i a-i indica modalitile pe care le poate lua n cadrul unui sistem bine precizat. O analiz tiinific se poate realiza doar cu condiia ca obiectul pe care ea se exercit s aib o structur relativ stabil. Dac modalitile variabilei pot fi ierarhizate dup un anumit criteriu, acestea poart numele de nivele Variabila este opus constantei, care nu are dect o singur valoare, fix i nesupus oscilaiei. Definiia unei variabile i a modalitilor sale nu este independent de descrierea dispozitivului experimental n care a intervine. n funcie de ipoteza sa, cercettorul selecioneaz strile pertinente ale variabilei pe care el o studiaz. O variabil are cel puin dou modaliti.

    Exist dou condiii pe care trebuie s le ndeplineasc o variabil: 1. s fie alctuit dintr-un ansamblu de valori exclusive, n consecin fiecare din elementele

    unei variabile nu poate lua dect o singur valoare. 2. ansamblul de valori sau de modaliti ale unei variabile trebuie s fie exhaustiv toate

    elementele trebuie s poat fi caracterizate de ansamblul de valori. Exist un sistem de clasificare a variabilelor care funcioneaz prin considerarea unei serii de

    criterii. Vom enumera doar denumirile rezultnd din apelarea la cele mai frecvente criterii. Astfel, dac lum n consideraie gradul de dependen se distinge ntre variabile independente i

    variabile dependente. Distincia ntre variabile dependente i independente este cel mai frecvent folosit. Variabilele independente (notate curent cu VI) sunt variabile manipulate sau fixate de ctre experimentator. Mai clar, variabila independent este o caracteristic - a subiectului, a ambianei sale fizice sau sociale, a sarcinii, a stimulului sau stimulilor prezentai - care este manipulat de ctre cercettor n scopul de a controla sau de a analiza efectul sau efectele sale asupra comportamentului studiat4. Variabil independent este orice variabil ale crei valori sunt, n principiu, independente de schimbrile care au loc cu alte variabile. ntr-un experiment, variabila independent poate fi orice variabil care este manipulat specific, astfel nct s se observe efecte asupra variabilei dependente. Variabila independent mai este numit i variabil experimental sau controlat. Variabilele dependente (notate curent cu VD) sunt variabile observate de experimentator i care fac obiectul unei msurri. Variabila dependent este orice variabil ale crei valori sunt, n principiu, rezultatul

    3 Reber, Arthur S., "Dictionary of Psychology", Penguin Books, London, 1985, pag.811 4 J.-P. Rossi & Al., La mthode exprimentale en psychologie, Dunod, Paris, 1997, pag.22

  • AUREL STAN

    98

    schimbrilor care au loc ntr-una sau mai multe variabile independente. n matematic, noiunea de dependen este exprimat printr-o formul de tipul )(xfy = . Prin aceast form de prezentare a dependenei se exprim faptul c valorile lui y sunt dependente (sau n funcie de) valorile lui x. n cercetarea psihologic situaia devine: comportamentul subiectului luat n considerare (y) este dependent de manipularea unui factor (x). n cercetarea psihologic, variabila dependent este, n general, un rspuns furnizat de ctre subiect sau o caracteristic a acestui rspuns.

    O alt accepiune este aceea c variabila dependent este o variabil care este estimat dintr-o alt variabil ale crei valori sunt date. Efectul variabilelor independente este observat pe variabilele dependente. Exemplu: dac ne propunem s cercetm efectul diferitelor forme de psihoterapie asupra sensibilitii, variabila independent este forma de psihoterapie (terapie psihanalitic, terapie comportamental, terapie experienial, terapie adlerian, terapie sistemic) i variabila dependent este efectul asupra sensibilitii pe un anumit plan. Relaia dintre variabila numit independent i variabila numit dependent este una presupus cauzal. Relaia cauzal trebuie s fie demonstrat, nu doar afirmat. Pentru demonstrare se cer urmate regulile unei metodologii competent elaborate. n caz contrar, putem fi robii aparenelor constituite n aa-numitele artefacte.

    Calitile unei bune variabile dependente sunt pertinena (variabila dependent trebuie s fie un indicator pertinent al comportamentului) i sensibilitatea (variabila dependent trebuie s exprime variaii comportamentale foarte fine).

    Ce este o variabil intermediar?

    O noiune care se ntlnete n lucrrile de psihologie experimental este cea de variabil intermediar. Introducerea i utilizarea sistematic a acestei noiuni este atribuit lui Edward Chase. Tolman, cunoscutul psiholog american specializat n nvarea la animal. El nu prsete total domeniul behaviorismului, dar modific viziunea acestui curent prin folosirea noiunii de

    intenionalitate. n concepia sa, comportamentul este un fenomen molar care permite unei fiine de a atinge un obiect scop prin alegerea unor mijloace. Acest fapt implic o referin necesare la variabile intermediare de tip motivaional i cognitiv definite obiectiv. Noiunea de variabil intermediar cunoate o frecvent utilizare n domeniul nvrii, mai ales n studiile cunoscutului teoretician bahaviorist Clark Leonard Hull.

    n anul 1928, E.C. Tolman enumer dou tipuri de variabile intermediare care se intercaleaz ntre variabilele dependente i cele independente pentru a determina comportamentele. Variabilele intermediare cuprinse n primul tip, considerate mai elementare, sunt ereditatea vrsta i educaia i sunt direct legate de variabilele independente. Cele din al doilea tip sunt nevoile, dorinele, atitudinile i ipotezele, fiind considerate mai complexe, n calitate de combinaii ntre anumite variabile independente i variabile intermediare elementare. Actualmente, variabilele intermediare din prima categorie sunt tratate ca variabile independente.

    Introducerea acestor variabile i are raiunea n dificultile teoretice ale curentului behaviorist strict, n care domina schema S-R (stimul-reacie). n aceast schem, ereditatea, vrsta i educaia nu

  • STATISTIC I

    99

    descriu nici stimulul, nici rspunsul. A doua categorie de variabile intermediare este constituit din nevoi, dorine, atitudini, ipoteze care nu pot fi controlate de ctre experimentator.

    J.P. Rossi consider c exist o a treia categorie de variabile intermediare care trimite la

    mecanismele intermediare5. Astfel, activitatea de organizare care permite de a reine mai bine o list de cuvinte a fost adesea clasat n rubrica variabilelor intermediare, deoarece activitatea de structurare este un tratament care se situeaz ntre S i R. Paul Fraisse a insistat n studiile sale asupra faptului c rspunsul este funcie a interaciunii ntre situaie i personalitatea subiectului.

    Jean-Franois Le Ny consider n Grand dictionnaire de la psychologie c noiunea de variabil intermediar poate fi definit ca o variabil ipotetic presupus a fi funcie a unei variabile de ambian i ca determinnd direct o variabil de comportament6.

    Astfel, noiunea lui C.L. Hull i a teoreticienilor behavioriti, n general, de for a motivaiei (Drive) era considerat, pe de o parte, ca fiind o funcie direct a duratei de privare (de hran, butur etc.) i, pe de alt parte, ca determinnd n mod direct vigoarea comportamentului.

    Totui, noiunea de variabil intermediar este puin utilizat astzi lucru datorat modului n

    care sunt privite aspectele care in de persoan. Aceste aspecte sunt, de fapt, mecanisme interne. De exemplu, s-a artat c organizarea informaiei permite o mai bun reinere a unei liste de cuvinte. Activitatea de organizare este o variabil intermediar. Ea presupune o tratare a informaiei i constituie un intermediar ntre S i R. Din momentul introducerii modelelor de tratare a informaiei, noiunea de variabil intermediar i-a pierdut raiunea de a exista. Astfel, putem vorbi de variabile independente, variabile dependente, stri ale subiectului i procese se tratare a informaiei. Acestea din urm sunt mai mult ipotetice dect intermediare.

    Dac lum n consideraie natura i fineea variaiei, atunci vorbim de variabile discrete i variabile continue. Cele discrete sau discontinue sunt variabilele ale crei valori posibile sunt n numr limitat i sunt exprimate prin valori izolate, nedifereniate. De obicei, pentru a le exprima se folosesc numere ntregi. De exemplu, variabila numrul de persoane care locuiesc ntr-un apartament este o variabil discret. Aceast variabil poate lua valorile 1, 2, 3, 4 .a.m.d., dar nu valoarea 2,5 sau 3,7. O variabil este continu n cazul cnd are teoretic un numr nelimitat de variante. Ca atare, ntre dou variante de variaie succesive se poate interpune o a treia. Dac msurarea se realizeaz n centimetri, ntre valoarea 2 cm i 3 cm se poate interpune valoarea 2,5 cm.

    5 idem pag.45 6 Grand dictionnaire de la psychologie, Larousse, 1992, p. 816

  • AUREL STAN

    100

    Continuitate versus discontinuitate

    Arthur S. Reber precizeaz c ideea de continuitate se refer la absena unor ntreruperi, pauze sau etape (n cazul existenei unor etape acestea sunt foarte mici i astfel, nedetectabile)7. Discontinuitatea este opusul continuitii. Autorul englez spune c discontinuitatea este prezent atunci cnd nu sunt reprezentate toate valorile posibile8. El

    explic prezena ghilimelelor prin faptul c situaia este mai delicat n legtur cu reprezentarea valorilor. Astfel, este posibil ca variaia s se manifeste ca o serie de valori discrete (discontinue) care, de fapt, prezint o variaie subiacent continu. Reber ia ca exemplu nlimea variaia valorilor luate de nlime este discontinu fiind msurat n uniti discrete (de obicei cm), dar subiacent, este prezent o variaie continu ntruct putem avea toate nlimile posibile. Diferena se observ mai bine atunci cnd opunem variaia aparent discontinu cu una ntr-adevr discontinu cum este numrul de erori de nvare n cadrul unui experiment. Este adevrat c n msurtorile pe care le efectum, depindem foarte mult de precizia instrumentului de msur utilizat. Astfel, timpul de reacie este o variabil continu, dar poate prea discret dac folosim un cronometru clasic care msoar doar secundele. Instrumentele moderne pot evidenia un numr foarte mare de posibilitii ntre 25 de secunde i 26 de secunde, dac pot evidenia zecimile, sutimile, miimilor, milionimile de secund. Dac nu avem instrumente perfecionate de msur, distincia dintre variabilele continue i cele discrete poate deveni arbitrar. Cele mai multe din variabilele utilizate n psihologie (n special scorurile testelor i chestionarelor psihologice) sunt discrete.

    O distincie frecvent utilizat se face ntre variabilele dihotome sau dihotomice i variabilele

    polihotome sau polihotomice. Variabilele dihotomice sunt variabile care au dou 2 modaliti: adevrat - fals; corect-incorect; da nu, prezen-absen, acord dezacord; masculin-feminin etc., i care primesc, de obicei , valorile numerice 1 - 0.

    Real i artificial n dihotomie Dany Laveault i Jacques Grgoire9 fac diferena ntre variabile real dihotomice i artificial dihotomice. O variabil real dihotomic presupune mprirea natural n 2 categorii (de exemplu, variabila sex are natural dou modaliti: masculin (care se poate nota cu 1) i feminin (care se poate nota cu 0), iar variabilele artificial dihotomice corespund transformrii

    convenionale a valorilor variabilelor polihotomice (continue sau discontinue). De exemplu, n urma aplicrii unui test subiecii dintr-un grup, acetia pot obine iniial note ntre 1 i 40, dar, ulterior, acetia pot fi mprii n 2 subgrupe: cei care au scoruri mai mici dect mediana sunt ncadrai n subgrupul A

    7 Reber, Arthur S., "Dictionary of Psychology", Penguin Books, London, 1985, pag.811 8 idem 9 Dany Laveault & Jacques Grgoire, Introduction aux theories des testes en sciences humaines, De Boeck Universite, 1997, pp. 234235

  • STATISTIC I

    101

    cu rezultate slabe (scoruri uniformizate prin notarea cu 0), iar cei cu scoruri peste median intr n subgrupul B cu rezultate bune (uniformizate prin notarea cu 1). Aceast mprire poate fi fcut i n funcie de existena unei valori criteriu, care mparte grupul iniial n reuii (notai cu 1) i nereuii (notai cu 0). Criteriul de dihotomizare poate avea i un caracter convenional.

    O distincie cu care se opereaz frecvent este cea ntre variabile cantitative i variabile

    cantitative. n primul caz exprimarea variantelor sau modalitilor variabilelor se face prin intermediul numerelor (timp, greutate, lungime), n al doilea caz prin intermediul atributelor (apartenen etnic, religioas, sex). Variabila cantitativ timp de reacie va putea avea ca variante sau modaliti 23; 25; 19; 30 sutimi de secund, pe cnd variabila calitativ apartenen religioas va avea ca modaliti: ortodox, catolic, protestant, mahomedan, budist etc.

    Variabile calitative Variabile cantitative Sex (masculin, feminin) Culoarea ochilor (albatri, cprui, verzi,etc.

    Performan fizic sau psihic msurat (Q.I.= 101,sau Q.I.= 83)

    Vrsta ( 17,19 23 etc.) Tabelul I. Exemplificri pentru variabile calitative i variabile cantitative

    O clasificare prezent n studiile experimentale este n funcie de posibilitatea cercettorului de a

    manipula apariia modalitilor variabilei pe care el o studiaz. Vorbim n acest caz de variabile provocate i de variabile invocatei. Modalitile primei variabile ale acestui criteriu de clasificare pot fi create de ctre experimentator, n sensul c st n puterea acestuia de a le manevra. De exemplu, variabila intensitate sonor poate avea n cadrul unui experiment trei modaliti sau stri: slab, medie, puternic. n funcie de interesul tiinific, experimentatorul poate varia cele trei stri, poate s provoace aceste stri. Dar dac interesul tiinific se manifest n privina coeficientului intelectual, nu mai st n puterea experimentatorului de a manevra fora intelectual a cuiva. n acest caz, variabila coeficient intelectual este invocat, cercettorul putnd doar cuta i mobiliza pentru un studiu persoane care au diferii coeficieni intelectuali (ex. 75, 90, 100,105).

    O noiune indispensabil pentru exprimarea statistic este cea de unitate statistic, avnd sensul de element al unei mulimi statistice. Un termen similari este cel de individ statistic. Unitile statistice pot fi indivizi umani sau obiecte care sunt purttori ai unei anumite caracteristici ce prezint interes pentru o anumit cercetare. Mulimea statistic poate fi o populaie statistic, adic totalitatea indivizilor care satisfac exigenele unei anumite definiii riguros formulate, sau un eantion, un subansamblu de indivizi ai populaiei care are caracteristica de a fi reprezentativ, adic din analiza acestuia este permis de a se trage aproximativ aceleai concluzii ca i din analiza ntregii populaii. Eantionul este un univers redus al populaiei. Raportul dintre populaie i eantion statistic este mai bine exprimat prin raportul dintre mulime i submulime. Selecionarea indivizilor dintr-o populaie pentru constituirea unui eantion poate fi aleatorie sau conform unui algoritm de selecie. n procedura aleatorie de selecie, orice individ trebuie s aib anse egale de a fi ales. ntr-o oper aprut postum, intitulat Ars

  • AUREL STAN

    102

    conjectandi, matematicianul elveian Jacques Bernoulli, unul din clasicii teoriei probabilitilor, a artat c o tragere la sori corect fcut permite de a obine un eantion care s aib caracteristici similare acelora ale populaiei. Deci, nu orice grup de indivizi formeaz un eantion, ci doar acel grup constituit prin respectarea unor reguli riguroase. Cnd ntr-un studiu ntlnim termenul de lot sau de grup, trebuie existe suspiciunea c acesta a fost compus prin apelarea la o procedur de extragere care nu respect strict metodologia de constituire a eantioanelor. Biais-ul, termen ce s-a impus n ultima perioad n limbajul tiinific cu semnificaia de eroare sistematic, mrete riscul de a proceda la generalizri eronate. Populaiile pot fi finite, cnd mrimea sa este riguros delimitat cantitativ, i infinite cnd mrimea lor nu poate fi determinat cu precizie sau este n continu cretere cu o rat imprevizibil. Populaia poate fi definit extensiv, atunci cnd elementele sale pot fi listate (de exemplu, lista nominal a pensionarilor dintr-un cartier din Iai). Definirea intensiv a populaiei presupune indicarea principiului care st la baza constituirii sale (exemplu, toi elevii liceului Mihai Eminescu din Iai din primul semestru al anului 2003).

    Variabilele nu descriu indivizii statistici n ansamblul lor, ci prin intermediul unor caracteristici. O

    caracteristic este o proprietate a unei uniti statistice care prezint interes pentru o anumit cercetare. Individul statistic este purttor al unei caracteristici. Aceast caracteristic este descriptibil printr-un ansamblu de reliefri ale caracteristicii. Aceste reliefri sunt variantele de variaie sau modalitile. Caracteristica pe care noi ne propunem s o descriem statistic poate fi manifest, n cazul n care poate fi descris sau msurat n mod direct (greutatea corporal, culoarea ochilor, sexul, nivelul veniturilor) sau latent (voalat), n cazul n care poate fi msurat doar indirect. De exemplu, dac ne propunem s examinm introversiunea, aceasta nu se poate face n mod direct, ci prin intermediul unei ntregi serii de semne ale introversiunii detectabile prin ntrebrile unui chestionar sau prin analiz clinic. O caracteristic este operaional definit atunci cnd se poate decide care sunt reliefrile caracteristicii respective. Practic, din punct de vedere psihologic, operaionalizarea este traducerea unui concept teoretic n comportamente observabile. Calitatea tiinific a unor cercetri depinde foarte mult de calitatea operaionalizrii conceptuale care se realizeaz n cursul realizrii lor.

    Este necesar s facem i cteva precizri asupra variabilitii, n scopul de a evidenia aspecte care sunt frecvent ntlnite n studii tiinifice. Variabilitatea este intraindividual atunci cnd se raporteaz la diferenele existente ntre momentele sau situaiile diferite n care se afl acelai individ. De exemplu, atunci cnd se cerceteaz timpul de reacie la aceeai persoan n momente temporale diferite, se pot obine valori diferite. Diferena dintre cea mai mic i cea mai mare variant de variaie poart numele de amplitudine de variaie sau de plaj de variaie. Variabilitatea interindividual face referire la diferenele existente ntre indivizi (desigur, referindu-se la aceeai caracteristic). Variabilitatea intragrup caracterizeaz oscilaiile valorice n cadrul unui grup bine precizat i variabilitatea intergrup caracterizeaz aceste oscilaii la nivelul indicatorilor aparinnd la grupuri diferite. Indicatorii statistici nu sunt doar simple valori ale variabilei, ci valori reprezentative care caracterizeaz ansamblul valorilor unui grup.

  • STATISTIC I

    103

    Variabile i factori.

    Termenii tiinifici de variabil i factor sunt des folosii ca sinonimi ceea ce poate crea o serie de confuzii. n esen, orice factor poate fi o variabil, dar nu orice variabil poate fi un factor. Nu exist o coresponden perfect ntre variabil i factor. n unele lucrri tiinifice, termenul factor este folosit abuziv. n general, prin factor se nelege orice are o influen cauzal, un anumit efect asupra unui

    fenomen. n acest sens factorul este considerat o condiie antecedent sau o cauz. Prin extensie, factorul poate fi considerat o variabil independent. Acest sens e propriu procedurilor statistice bazate pe analiza de varian. Distincia ntre factori sistematici i aleatori este fundamental. Factorul este sistematic, n cazul n care alegerea modalitilor poate fi sistematic, i aleatoriu, n cazul n care modalitile sale sunt stabilite prin tragere la sori. O convenie frecvent respectat este aceea de a denumi factorul printr-o liter majuscul i o cifr care indic numrul modalitilor. De exemplu, n cadrul notaiei S3 desemnm prin S factorul studii i prin 3 numrul de modaliti. Desemnarea nivelelor se face prin utilizarea literelor minuscule: s1= studii superioare, s2=studii medii i s3=studii generale. Prin convenie factorii aleatorii sunt subliniai. Factorii crora experimentatorul vrea s le studieze efectele sunt numii principali, iar cei pe care experimentatorul trebuie s-i controleze pentru c el tie c acetia au un efect asupra fenomenului studiat sunt numii secundari.

    Factorul poate fi unul din rezultatele unei analize factoriale, termen care nu reprezint un concept unitar, ci mai curnd este utilizat ca termen umbrel pentru un numr de proceduri statistico-matematice care-i propun s localizeze un numr mai mic de dimensiuni clusteri sau factori ntr-un set mai mare de variabile independente sau itemi. Primul element distinctiv al unei analize factoriale este reducerea datelor. Analiza factorial este o reacie contra beiei de cuvinte n cercetarea psihologic care tinde s considere c oamenii i aciunile umane au attea caliti cam cte adjective i atribute exist ntr-o limb. A exprima mult prin puin, principiul parcimonieii, este esenial n analiza factorial, indiferent de formele pe care le mbrac aceast analiz. Ca atare, factorul este o variabil subiacent care st la baza variaiei altor variabile, este o esen ireductibil i irepetabil care servete de suport lumii fenomenologice cu o mare varietate de manifestri.

  • AUREL STAN

    104

    II. GRUPAREA I SISTEMATIZAREA DATELOR

    II.1.MSURAREA N PSIHOLOGIE O prim ntrebare care se pune atunci cnd abordm problema prelucrrii datelor obinute ntr-o

    cercetare psihologic este: haina numeric se potrivete la fel de bine exprimrii rezultatelor ca n domeniul fizicii, chimiei, biologiei, sau are un anumit specific care trebuie lmurit? n esen, trebuie s stabilim dac faptul psihic este la fel de bine fundamentat cantitativ ca n domeniile amintite. Dezbaterile pe aceast tem dureaz de secole, opunnd la nceputurile lor concepia lui Immanuel Kant i celei aparinnd lui Johann Herbart. Prima concepie susine c psihologia nu va ajunge niciodat tiin experimental, deoarece faptul psihic nu posed dect o singur variabil, timpul. A doua concepie susine c psihologia va putea deveni experimental i cantitativist, ntruct posed pe lng variabila timp i variabilele intensitate i calitate. Dezbaterile pe aceast tem nu au ncetat, fiind sintetizate foarte bine ntr-o lucrare de erudiie a lui Vasile Pavelcu: Ambele atitudini sunt fireti cci, dac am aplica metrismul matematic la prerile nsei, ivite n rndul oamenilor de tiin, cu privire la psihologia matematic, am constata abateri statistice naturale, att n sens pozitiv, ct i n cel negativ, fa de medie. Extremele sunt egal de primejdioase pentru dezvoltarea unei tiine. O ncredere exagerat, nejustificat suficient ntr-o metod, duce fatal spre dezamgirea i prsirea total a acesteia. Un scepticism anticipat, i la fel de nejustificat, bareaz drumul ncercrilor i verificrilor, fr de care nu putem face dovada tiinific10.

    Rspunsul la ntrebarea anterioar presupune o scurt incursiune n domeniul teoriei msurrii.

    Nevoia de msurare a venit odat cu apariia i dezvoltarea cercetrii experimentale n psihologie. Pentru a fi considerat tiinific, cercetarea psihologic trebuie s se supun rigorilor care domina tiinele cu un statut bine precizat, cum sunt fizica, fiziologia i chimia, n care experimentul era frecvent practicat. Promotorii experimentului psihologic considerau c prin

    intermediul acestuia psihologia se deprteaz de viziunea speculativ i adera la exigenele spiritului pozitiv, atotputernic la sfritul secolului XIX i nceputul secolului XX, perioad n care avntul cercetrii experimental-psihologice a fost foarte pronunat. Personalitile dominante n aceast perioad au fost E.H. Weber, G.T. Fechner, W. Wundt, H. Ebbinghaus, H. Helmholtz, S. Hull, J.McK. Cattell. Domeniul n care aceti savani au lucrat a fost unul relativ ngust, cel al structurilor psihice elementare (senzaii, percepii). ncercrile de a extinde tehnicile experimental-statistice la fenomene psihice complexe a dus la apariia unor eecuri i nereuite n cercetare. Perfecionarea tehnicilor de investigaie s-a fcut paralel cu progresul concepiilor psihologice i a aparatului statistico-matematic. Necesar cercetrilor complexe n care interrelaionarea era complex. Cercettori precum Ch.

    10 Vezi Pavelcu, Vasile Problema msurii n psihologie, Extras din Cercetri pedagogice, vol. I, 1943. Tipografia Alexandru A. Terek, Iai, pag.3.

  • STATISTIC I

    105

    Spearman, H.P. Kelley, H. Hotteling, L.L. Thurstone, C. Burt, L. Guttman, S.S. Stevens au perfecionat i rafinat concepia de cercetare n psihologie i au elaborat tehnici cantitative complexe, aa cum este analiza factorial. ntr-o lucrare clasic de psihometrie, care se menine n actualitate, Nicolae Mrgineanu red complexitatea situaiei cercetrii din domeniul psihologic: Una dintre caracteristicile de baz ale tiinei contimporane, n opoziie cu tiina antebelic i mai ales cu aceea a secolului trecut, e de a nu te mulumi numai cu studiul relaiilor dintre diferite, ci de ncerca i studiul structurii i configuraiei acestor relaii. Relaia nu e torul; ea e ntotdeauna o parte i un aspect dintr-un sistem. Ori acest sistem nu pare a fi indiferent pentru relaie; pentru ca sensul relaiei s fie prins n ntregime, relaia trebuie raportat i la el. Sistemul pare chiar s aib ultimul cuvnt, proprietile de baz ale relaiilor nefiind dect funciuni ale sale.11

    A msura nseamn a aloca numere lucrurilor i fenomenelor conform unor reguli. Fr o

    concepie clar asupra realitii msurabile nu se poate vorbi de precizie i de apreciere cantitativ a fenomenelor. Pentru depirea unei concepii rigide s-a ajuns la o concepie nou privind puterea msurrii, elaborndu-se gradiente ale forei de msurare. A luat astfel natere concepia scalelor de msur. Elaborarea teorie scalelor de msur nu reprezint doar un compromis, o convenien, ci o adaptare la realitii msurabile specifice i complexe.

    Problema scalelor de msur. n sens general, o scal este o procedur sau un plan ce permite aranjarea obiectelor sau evenimentelor n serii progresive. n sens concret, o scal este un instrument sau un dispozitiv ce permite ordonarea numeric a obiectelor sau fenomenelor prin determinarea unei valori proprii. n examinarea psihologic, scala desemneaz un instrument de examinare sau testare psihologic care posed itemi i sarcini structurai n legtur cu o anumit dimensiune. n acest ultim sens, avem scala metric a inteligenei Binet-Simon, scala de performan Grace-Arthur. Scala de dezvoltare A.L. Gessel. Exist scale de atitudini, de preferine, de inteligen.

    Valorile pe care le obin variabilele n cursul unor procese de msurare nu au aceeai putere informaional, adic nu comunic la fel de profund n privina anumitor caracteristici pe care le studiaz. Neglijarea acestui aspect poate duce la apariia unor confuzii n interpretarea rezultatelor unor cercetri. Este foarte important de a preciza pe ce scal de msur pot fi apreciate valorile unei variabile i dac operaiile sau tratamentele statistice sunt pertinente, adic dac sunt adaptate, ajustate proprietilor specifice ale unei anumite scale.

    Practic, scala de msur este un instrument de msur care prezint anumite gradaii dup care se ghideaz cel care dorete s fac aprecieri n procesul de msurare dintr-un anumit domeniu. n sens strict scala de msur presupune c modalitile sau valorile sunt cel puin ordonate, deci exclude observaiile care sunt doar calitativ diferite. n sens larg, scala de msur se raporteaz i la observaii care pot fi doar calitativ diferite.

    Crearea i fundamentarea teoretic a scalelor de msur sunt legate de numele cercettorului englez S.S. Stevens care, n anul 1946, a stabilit 4 niveluri sau tipuri de scale de msur, inegale n privina puterii: msuri nominale, ordinale, de interval, i de raport. Ali autori care s-au ocupat de aceast problem au artat c se pot concepe nenumrate tipuri de scale, dar cea mai mare parte

    11 vezi Nicolae Mrgineanu, Elemente de Psihometrie, Ed. Institutului de Psihologie al Universitii din Cluj, 1938

  • AUREL STAN

    106

    dintre ele nu au o real semnificaie practic prin diversele grupe de transformri numerice pe care le-ar presupune12.

    Scala nominal (denumiri similare scala categorial sau scala formal) reprezint tipul de scal care indic cel mai slab grad al msurii. Modalitile scalei nominale sunt definite n aa fel nct fiecare observaie nu poate fi plasat doar ntr-o singur modalitate. Ea asigur doar simpla difereniere calitativ a observaiilor fcute de un cercettor. Chiar atunci cnd utilizeaz numere n exprimare realitii supus msurii, aceast scal nu indic alte proprieti dect acelea de a fi simple etichete pentru distingerea diferitelor modaliti ale unei variabile. Ea poate asigura identitatea a dou elemente. La nivelul scalei nominale modalitile X,Y i Z pot fi reprezentate prin 1,2 i 3, sau la fel de bine prin 14, 23, 8. Important este ca aceste simboluri s fie diferite. n acest caz 1 nu este mai mic dect 2 i nici acesta, la rndul lui, nu este mai mic dect 3. Ele sunt doar simboluri diferite. Observaiile pot fi exprimate i prin simboluri alfanumerice: a1, a2 i a3 sau chiar prin simboluri pictografice. Astfel de scale sunt frecvent utilizate n psihologie i, n general, n tiinele sociale, atunci cnd se uzeaz de clasificri: tipologiile psihologice, nomenclatoarele profesiilor, nosologiile psihiatrice (sisteme de clasificare a bolilor). De exemplu, variabila categorie socio-profesional poate avea modalitile: elev, student, funcionar, cadru mediu, cadru superior, patron, manager, omer, pensionar. Prin codificare, atribuim un simbol distinct fiecrei modaliti a variabilei. Redm ntr-un tabel diferite variante de codificare: varianta 1-alfabetic, varianta 2-numeric, varianta 3-alfanumeric.

    Modalitatea variabilei Varianta 1 Varianta 2 Varianta 3 Elevi A 1 a1 Studeni B 2 a2 Funcionari C 3 a3 Cadre medii D 4 a4 Cadre superioare E 5 a5 Manageri F 6 a6 Patroni G 7 a7 omeri H 8 a8 Pensionari I 9 a9

    Tabelul nr.2 Codificri posibile pentru modalitile variabilei categorie socio-profesional n cadrul unei scale nominale

    Recodificarea modalitilor n funcie de variante este corect dac asigur fiecrei modaliti o

    notare distinct de a celorlalte, aa cum rezult din tabelul urmtor.

    Modalitatea variabilei Varianta 1 Varianta 2 Varianta 3 Elevi C 9 a7 Studeni I 8 a3 Funcionari A 5 a5 Cadre medii D 3 a9 Cadre superioare F 7 a8 Manageri B 1 a2 Patroni E 4 a6 omeri G 6 a4 Pensionari H 2 a1

    Tabelul nr. 3 Cuprinde recodificarea corect a modalitilor variabilei Categorie socio-profesional din tabelul 1 12 vezi Dick, P., Tournobis, Jocelyne, Flieler, A., Kop, Jeana-Luc, La Psychomtrie, Presses Universitaires de France, Paris, 1994

  • STATISTIC I

    107

    Scala ordinal introduce ordinea ntre elementele unei serii de observaii. Transformrile efectuate trebuie, de aceast dat, s lase ordinea invariant, neschimbat. ntr-o astfel de situaie a

  • AUREL STAN

    108

    n cadrul unei scale sunt condiionate de puterea informaional a scalei respective. Cu ct naintm spre vrful ierarhiei scalare, cu att numrul de operaii permise este mai mare i transformrile sunt mai complexe. Pe parcursul lucrrii noastre vom face specificaii necesare n aceast privin, de cte ori este cazul13.

    II.2 CONSIDERAII ASUPRA GRUPRII DATELOR Operaiile de grupare sunt strict necesare n activitatea de cercetare tiinific efectuat cu

    ajutorul unor metode de investigaie specifice psihologiei. Primul lucru asupra cruia ne ndreptm atenia atunci cnd suntem n faa unor date neordonate rezultate dintr-o cercetare este s ne ntrebm asupra puterii informaionale a unor astfel de date. Aparin scalei nominale, ordinale, de interval sau de raport? Fiecare din aceste scale pun probleme specifice de prelucrare, sistematizare i de reprezentare grafic. n ceea mai mare parte a cazurilor, psihologul se gsete n faa unor valori care sunt de nivelul scalei de interval, este adevrat, cu respectarea anumitor convenii care confer datelor acest statut. n funcie de modul de sistematizare a datelor ele ne vorbesc mai mult sau mai puin consistent.

    Gruparea. n cazul n care modalitile de care dispunem au valoare scalar nominal sau ordinal grupare presupune stabilirea frecvenelor specifice fiecrei modaliti. Frecvenele absolute rezult din nsumarea tipurilor distincte ale modalitilor sau nivelelor. Frecvenele relative traduc cuantumul procentual al fiecrei frecvene absolut, adic valoarea procentului din total reprezentat de o anumit modalitate a variabilei. De exemplu, dac ntr-o cercetare ne propunem s grupm variabila nominal tip de studii superioare, cu modalitile studii umaniste, studii economice, studii tehnice, putem avea urmtoarea situaie (situaie imaginat):

    Nr. crt. Tip de studii Frecvena (f) Frecvena relativ(f%) 1 Studii umaniste 75 56,8% 2 Studii economice 43 32,6% 3 Studii tehnice 14 10,6% Total N = 132 100%

    Tabelul nr.4 Cuprinde modul de nregistrare a frecvenei a modalitilor sau categoriilor unor scale nominale

    Frecvena relativ se obine prin nmulirea cu o sut a raportului dintre frecvena relativ i

    efectivul total. Astfel frecvena relativ 32,5% se obine astfel: 32,5% = 100*13243 . Frecvenele relative

    dau o informaie mai precis, mai ales n cazul n care nu se cunoate efectivul total (N =132). Astfel, frecvena absolut egal cu 43 specific modalitii studii medii nu ne comunic prea mult dac nu tim cunoatem valoarea 132, pe cnd valoarea 32,6 ne comunic faptul c modalitatea studii medii cuprinde aproximativ o treime din numrul total al subiecilor.

    132 pentru informaii suplimentare vezi: Valentin Clocotici, Aurel Stan, Statistic aplicat n psihologie, Editura Polirom, Iai, 2000.

  • STATISTIC I

    109

    Pentru variabilele ale cror modaliti se prezint sub form numeric, drumul ordonrii este ceva mai lung. n acest caz, o mas de cifre neordonat ne transmite foarte puin sens. Exemplificrile pe care le vom face pe parcursul lucrrii noastre sunt, n cea mai mare parte, specifice cercetrii psihologice. S presupunem c avem n fa urmtoarele valori rezultate din corectarea unui test psihologic, mai clar spus avem n fa notele brute obinute de 91 de subieci la testul AD-P (atenie distributiv Praga), avnd studii medii, vrsta ntre 35-40 ani, provenind din mediul urban:

    22 37 56 76 33 48 40 47 58 78 82 50 54 53 47 54 55 62 69 29 43 59 70 55 53 48 36 66 72 53 46 35 43 58 52 50 57 72 29 35 53 43 39 35 48 55 33 38 43 47 43 49 56 38 32 49 55 60 67 56 64 50 26 69 78 55 53 38 47 55 66 73 50 63 62 46 28 64 63 40 42 61 67 63 46 42 68 59 55 57 55

    Menionm c ansamblul valorilor unei variabile poart numele de distribuie. Exist distribuii

    teoretice, denumire care indic faptul c valorile sunt repartizate conform rigorilor unui anumit model matematic de distribuie, i distribuii empirice, rezultate din cercetri concrete. n cazul nostru de exemplificare, vom opera pe o distribuie empiric. n momentul n care ordonm datele cresctor, ansamblul valorilor ncepe s capete un sens pentru cei care i propunem s le cerceteze. Prezentm, n continuare, ordonarea acestor date. Putem observa cu uurin care este cea mai mic i care este cea mai mare valoare a variabile pe care o notm cu X (care reprezint performana unor subieci la testul AD-P), deci extremele performanelor.

    22 26 28 29 29 32 33 33 35 35 35 36 37 38 38 38 39 40 40 42 42 43 43 43 43 46 46 46 47 47 47 47 48 48 48 48 49 49 50 50 50 50 52 53 53 53 53 53 54 54 55 55 55 55 55 55 55 55 56 56 56 57 57 58 58 59 59 60 61 62 62 63 63 63 64 64 66 66 67 67 68 69 69 70 72 72 73 76 78 78 82

    Avem n total 91 de rezultate ale subiecilor. n acest caz, valoarea 1 este numit volumul distribuie. Se noteaz cu N. Dup aceast ultim ordonare putem s efectum o grupare a datelor, operaiune care se poate avea dou opiuni: 1. Gruparea pe variante de variaie; 2. Gruparea pe intervale de variaie.

    Este un tip de ordonare care poate are cea mai larg rspndire, indiferent de domeniu. Unele domenii i impun o serie de modele proprii de prezentare a datelor, funcie de particularitile tipului de cercetare (date rezultate n urma unei observaii, date rezultate dintr-un experiment, date rezultate dintr-o anchet).

  • AUREL STAN

    110

    II.2.1. Gruparea pe variante de variaie.

    n cazul n care optm pentru primul fel de grupare, stabilim ct de frecvente sunt valorile diferite pe care le-au obinut subiecii, adoptnd o ordonare ascendent sau descendent a valorilor distincte. Rezultatele unei variabile care nu au suferit nc tratamente de transformare valoric poart numele de valori brute sau note brute. Dac aceast operaiune este efectuat empiric, se ordoneaz cresctor sau descresctor aceste valori, apoi se parcurge ntreaga serie de valori neordonate i se trage cte o linie ori de cte ori ntlnim o valoare identic. n exemplul nostru ordonarea este ascendent. Pentru o bun citire a rezultatelor gruprii empirice se realizeaz grupri de cte 5 valori identice, prin a 5-a linie se bareaz 4 liniue anterioare. Tipul de marcare IIII cuprinde 5 valori identice ale variabilei.

    Nota brut Marcare Fr Nota brut Marcare Fr. Nota brut Marcare Fr. 22 I 1 47 IIII 4 63 III 3 26 I 1 48 IIII 4 64 II 2 28 I 1 49 II 2 66 II 2 29 II 2 50 IIII 3 67 II 2 32 I 1 52 I 1 68 I 1 33 II 2 53 IIII 5 69 II 2 35 III 3 54 II 2 70 I 1 36 I 1 55 IIII III 8 72 II 2 37 I 1 56 III 3 73 I 1 38 III 3 57 II 2 76 I 1 39 I 1 58 II 2 78 II 2 40 II 2 59 II 2 82 I 1 42 II 2 60 I 1 43 IIII 4 61 I 1 46 III 3 62 II 2

    Tabelul nr.5 Conine ordonarea pe variante de variaie i marcrile corespunztoare ale frecvenei valorilor Asemenea contorizri ale datelor se realizeaz n momentul n care tindem s realizm o analiz

    foarte amnunit, deci cnd ntr-o cercetare opereaz un spirit analitic pronunat. n momentul n care urmrim observarea tendinei centrale a datelor, atunci efectum o grupare pe intervale de variaie. Problema care se pune n acest caz este aceea a numrului optim de intervale n care pot fi grupate datele avute la dispoziie.

    II.2.2. Gruparea pe intervale de variaie Aceasta poate lua forma intervalelor egale sau inegale. n majoritatea cazurilor n cercetrile

    psihologice gruparea se face pe intervale egale. Gruparea pe intervale de variaie presupune urmtoarele etape:

    alegerea sau determinarea mrimii intervalului de variaie. Mrimea intervalului de variaie depinde de amplitudinea i de numrul de grupe sau de clase dorit. Amplitudinea unei distribuii este distana dintre cea mai mare i cea mai mic valoare. Vom nota cu A amplitudinea distribuiei, notaie acceptat n mare parte de autorii de specialitate. Formula de calcul este urmtoarea: A = Xmax-Xmin+1, n care: Xmax reprezint cea mai mare valoare i Xmin cea mai mic valoare. n cazul nostru concret X max = 82, X min = 22. Procednd la calculare vom avea A = 82 22 + 1 = 61. Cifra 61 ne spune c ntre cea mai mare i cea mai mic valoare se gsesc teoretic 61 de valori ale variabilei distincte una de alta. Distribuiile empirice (rezultate n urma unor cercetri concrete) nu au, de obicei, toate variantele posibile. n exemplu nostru lipsesc valorile variabilei egale cu 23, 24, 27 etc. Practic, avem un numr de 43 variante distincte ale variabilei. Notm cu i mrimea unui

  • STATISTIC I

    111

    interval, mrime care se calculeaz dup urmtoarea formul: i = kA , n care A este amplitudinea

    distribuiei, iar k este numrul de intervale n care dorim s mprim distribuia. De exemplu, dac dorim s facem o mprire a distribuiei valorilor n 9 intervale vom avea urmtorul rezultat:

    i = 961 = 6.77. Dac valorile concrete ale variabilei nu conin zecimale vom proceda la ntregirea

    valorii i, care se face totdeauna prin adugire. Deci, n urma ntregirii, i = 7. Dac ntregirea s-ar face prin scdere, ar rmne valori n afara intervalelor, valori nealocate unor intervale. Dar, dac vom considera mrimea unui interval egal cu 7, vom mri artificial mrimea amplitudinii cu 2, deoarece 9 7 = 63. Pentru a mpri ponderat diferena la cele dou capete ale distribuiei vom ncepe primul interval de la 21 i ultimul interval va avea valoarea superioar egal cu 83, deci va fi mai mare cu 1.

    Crearea tabelului cu intervale. Intervalele care rezult sunt urmtoarele: 1 2 3 4 5 Nr.crt. Interval Centru interval Marcare Frecvena 1. 21 27 24 II 2 2. 28 34 31 IIII I 6 3. 35 - 41 38 IIII IIII I 11 4 42 - 48 45 IIII IIII IIII II 17 5. 49 - 55 52 IIII IIII IIII IIII II 22 6. 56 - 62 59 IIII IIII III 13 7. 63 - 69 66 IIII IIII II 12 8. 70 - 76 73 IIII 5 9. 77 - 83 79 III 3 Total N = 91

    Tabelul 6. Conine gruparea pe variante de variaie i marcarea frecvenelor valorile pentru fiecare interval

    Pe lng rubricile cuprinznd numrul curent i mrimea intervalului au fost trecute, pentru o mai bun nelegere a tabelului, rubrici cuprinznd marcarea variabilelor componente ale unui interval i frecvena acestora pe un interval. La o prim privire, intervalele creeaz impresia c au valoarea 6, i nu 7, cum am anunat anterior. Dar aceste intervale includ limita inferioar i limita superioar. Intervalul 2127 conine urmtoarele valori teoretice: 21,22,23,24,25,26,27. Deci, are 7 componente numerice distincte. n unele cazuri se face precizarea dac limitele intervalelor sunt sau nu incluse n interval sau se face precizarea care sunt limitele reale ale intervalelor, n cazul existenei unor valori zecimale. Astfel, intervalul 21 27 poate avea limita inferioar 20,5 i limita superioar 27,5 dac am fi avut zecimale.. Ca atare, dac am fi ntlnit valorile 20,7 sau 27,3 le-am fi marcat la intervalul anunat anterior. Centrul intervalului se obine prin mprirea la 2 a adiiei valorii limitei inferioare a intervalului i a celei superioare. Astfel la intervalul nr.1, centrul intervalului, egal cu 24, s-a obinut n felul urmtor: 24

    = 248

    22721

    =+ . Stabilirea centrului intervalului poate fi util pentru uurarea unor calcule, situaie n

    care centrul intervalului este considerat o valoare reprezentativ a intervalului. O problem care se pune la gruparea pe intervale de variaie este aceea a numrului optim de

    intervale n care se divizeaz distribuia. Exist n aceast privin o serie de formule de calcul i de tabele fixnd numrul de intervale. n primul rnd amintim formula lui H.D. Sturges; care fixeaz

  • AUREL STAN

    112

    mrimea intervalului i = N

    XX

    lg22.31

    minmax

    +

    n care Xmax este cea mai mare valoare a distribuie,

    Xmin - cea mai mica valoare i N - numrul total de rspunsuri ale subiecilor. Dup ce am stabilit mrimea intervalului se poate determina foarte uor numrul de intervale Pentru valori nu prea mari ale lui N (sub 100) se folosete formula Hahn-Shapiro: k=Int(N/5), n care k exprim numrul de intervale, INT exprim partea ntreag a expresiei numerice din parantez (ntregire prin scdere, de exemplu, INT (3,7)=3). Ilie Puiu Vasilescu exemplific, n una din lucrrile sale consacrate statisticii aplicate, o serie de tabele care indic numrul de intervale n funcie de numrul de subieci14. Redm, n continuare, unul din aceste tabele, i anume tabelul lui Bendat i Piersol:

    N 200 400 600 800 1000 1500 2000 K 16 20 24 27 30 35 39

    Tabelul 6. Tabelul Bendat Piersol referitor la numrul optim de intervale n care se pot diviza distribuiile

    n acest tabel prin n s-a notat numrul r de rspunsuri ale subiecilor la o anumit solicitare i prin k numrul de intervale necesare. Astfel, la 200 de subieci sunt necesare 16 intervale, ntre 201 i 400 sunt necesare 20 de intervale, ntre 401 i 600 avem nevoie de 24 de intervale, .a.m.d. n practic gruprii datelor pe un numr relativ mic de rspunsuri (n jur de 100) se realizeaz 7; 9; 11; 13 intervale. Numrul de intervale este impar, fapt ce pune mai bine n eviden tendina central.

    n urmtoarea etap se realizeaz un tabel cu frecvenele i alte rubrici necesare efecturii calculelor statistice. Tabele se elaboreaz conform unor reguli. Aceste reguli15 sunt:

    1. s faciliteze percepia rapid i exact a informaiilor prezentate; 2. s cuprind numai informaii strict necesare caracterizrii fenomenului studiat; 3. s aib un titlu scurt, clar, care s sintetizeze coninutul informativ al datelor; 4. s fie numerotate pentru a putea fi identificate uor n textul de analiz, 5. s fie nsoite de note explicative care s explice noiunile cu mai multe sensuri; 6. notele explicative trebuie s explice sursa datelor; 7. liniile i coloanele tabelului trebuiesc numerotate pentru a putea fi identificate uor in text; 8. n tabele nu se admit rubrici incomplete.

    Exemplificm rubricile cu frecvene pe datele anunate de noi anterior:

    Nr.crt. Interval f f% fc fc fc fc% 1 21 27 2 0,02 (2%) 2 0,02 (2%) 91 1,00 (100%) 2 28 34 6 0,07 (7%) 8 0,09 (9%) 89 0,98 (98%) 3 35 41 11 0,12 (12%) 19 0,21 (21%) 83 0,90 ( 90%) 4 42 48 17 0,19 (19%) 36 0,40 (40%) 72 0,78 ( 78%) 5 49 55 22 0,24 (24%) 58 0,64 64%) 55 0,59 ( 59%) 6 56 62 13 0,14 (14%) 71 0,78 (78%) 33 0,36 ( 36%) 7 63 69 12 0,13 (13%) 83 0,91 (91%) 20 0,22 ( 22%) 8 70 76 5 0,05 (5%) 88 0,97 (97%) 8 0,09 ( 9%) 9 77 83 3 0,03 (3%) 91 1,00 (100%) 3 0,03 ( 3%) Total N=91 1,00 (100%) Tabelulul nr.7 Cuprinde intervalele de variaie i tipurile de frecvene

    14 Vezi Vasilescu, Ilie Puiu, Statistic informatizat pentru tiinele despre om, Editura militar, Bucureti, 1991, pag. 27 15 Vezi Porojan, Dumitru Statistica i teoria sondajului Casa de editur i pres ansa SRL, Bucureti, 1993, pag. 39

  • STATISTIC I

    113

    Legend: f = frecven simpl sau frecven absolut; f% = frecven simpl relativ; fc = frecven cumulat ascendent; fc% = frecven relativ cumulat ascendent; fc = frecven absolut cumulat descendent; fc% = frecven relativ cumulat descendent;

    Frecvena simpl notat cu f, indic numrul de rezultate ale subiecilor care se gsesc n intervalul respectiv. De exemplu, n intervalul 3, cu limitele 35 41 (limita inferioar 35, limita superioar 41) se gsesc 11 rezultate ale subiecilor. Deci, 11 subieci au obinut la proba AD-P rezultate (sau scoruri) cuprinse ntre 35 i 41. Dac adiionm toate cele 9 frecvene simple va rezulta valoarea 91, reprezentnd ansamblul rezultatelor subiecilor care au participat la examinare (notat cu N mare. N reprezint volumul distribuiei). Frecvena simpl relativ, notat cu f%, indic cota parte de subieci (este exprimat sub form de proporie) din totalul de 91, existent n intervalul respectiv. n dreptul intervalului 3 (35 41) se vor afla 0,12 din totalul rezultatelor subiecilor, sau, exprimat sub form procentual, 12% din acest total(valoare trecut n parantez). Frecvena cumulat ascendent indic numrul rezultatelor subiecilor care se gsesc pn n dreptul intervalului respectiv (inclusiv acest interval). De exemplu, n dreptul intervalului 3 de la rubrica fc se gsete valoarea 19, semnificnd faptul c pn n dreptul intervalului 3, inclusiv acesta, se gsesc 19 rezultate ale subiecilor, sau mai clar, primele 19 rezultate ale subiecilor ordonate cresctor. Valoarea 19 se obine prin adiia primelor 3 frecvene simple (19 = 2+6+11). Valoarea corespunztoare a intervalului 4, din rubrica fc este 36. Ea se obine din adiia valorilor primelor 4 frecvene simple (36 = 2+6+11+17). Primele valori din rubricile f i fc coincid (ambele au valoarea 2). Frecvena relativ cumulat ascendent reprezint cota parte din totalul rezultatelor subiecilor existent pn la un anumit interval. Ea ne informeaz despre proporia rspunsurilor subiecilor ( n parantez este trecut forma de exprimare procentual) pn la un anumit interval. De exemplu, n dreptul intervalului 4 la rubrica fc% se gsete valoarea 0,40, care provine din adiia frecvenelor simple relative de la intervalele 1- 4 (0,02 + 0,07 + 0,12 + 0,19). Aceast valoare ne spune c pn la intervalul 4, inclusiv acesta, se gsesc 0,40 din totalul rspunsurilor subiecilor, sau, exprimat sub form procentual, 40% din totalul acestora. Frecvena cumulat descendent exprim numrul rspunsurilor subiecilor care se gsete dincolo de un anumit interval Astfel, valoarea 72 a intervalului 4 din rubrica fc exprim faptul c dincolo de intervalul 4 (inclusiv acesta) se gsesc 72 de rspunsuri ale subiecilor. Valoarea 72 se obine scznd din numrul total al subiecilor (N = 91) adiia frecvenelor simple a primelor 3 intervale. Astfel 72=91(2+6+11). Dac ar trebui s calculm frecvena cumulat descendent a intervalului 5 vom scdea din totalul rspunsurilor adiia primele 4 valori, iar pentru intervalul 6 adiia primelor 5 valori (55 = 91(2+6+11+17) i 33=91(2+6+11+17+22)). Frecvena relativ cumulat descendent, notat cu fc% exprim o situaie identic, exprimat sub form de proporie, n parantez sub form procentual).

    Tabelul cuprinznd frecvenele unei distribuii pe intervale de variaie are o utilitate deosebit pentru calculul diferiilor indicatori statistici.

  • AUREL STAN

    114

    II.3. REPREZENTRILE GRAFICE ALE REZULTATELOR. Formele de reprezentare grafic ale distribuiilor valorilor unei variabile (distribuii univariate, n

    care exist o singur variabil care ia diferite valori) sunt foarte diversificate, Ele au menirea de a vizualiza tendinele existente n interiorul unei distribuii. Prin aceast form grafic unele tendine existente ntr-o distribuie sunt scoase foarte uor n eviden. Noi vom prezenta cele mai frecvent utilizate forme de exprimare grafic. Folosim pentru exemplificare distribuia de valori prezentat n tabelul anterior.

    II.3.1. Reprezentarea grafic prin coloane Prezint n cadrul unui sistem de axe rectangulare intervalele de distribuie pe abscis i

    frecvena acestora pe ordonat. Intervalele de distribuie sunt prezentate prin marcaje echidistante pe axa absciselor, din care nal coloane proporionale cu frecvena acestor intervale.

    Figura 1. Reprezentarea grafic prin coloane sau prin bare

    O form a reprezentrii grafice prin coloane este histograma, n care coloanele sunt lipite unele de altele.

    2

    6

    11

    17

    22

    13 12

    53

    0

    5

    10

    15

    20

    25

    "21-27" "28-34" "35-41" "42-48" "49-55" "56-62" "63-69" "70-76" "77-83"

    Intervale de variatie

    Frec

    vent

    a int

    erva

    lelor

  • STATISTIC I

    115

    2

    6

    11

    17

    22

    13 12

    53

    0

    5

    10

    15

    20

    25

    "21-27" "28-34" "35-41 "42-48" "49-55" "56-62" "63-69" 70-76" "77-83"

    Intervale de variatie

    Frec

    vent

    a int

    erva

    lelor

    26

    1117

    22

    13 12

    5 30

    5

    10

    15

    20

    25

    "21-27" "28-34" "35-41" "42-48" "49-55" "56-62" "63-69" "70-76" "77-83"

    Intervale de variatie

    Frec

    vent

    a int

    erva

    lelor

    Figura 2. Reprezentarea grafic sub forma histogramei O alt form frecvent utilizat de reprezentare grafic a rezultatelor este poligonul frecvenelor.

    Acesta se obine prin unirea printr-un segment de dreapt a mijlocului liniilor superioare care marcheaz coloanele histogramelor. Se pot obine i prin unirea prin segmente de dreapt a punctelor care ar reprezenta frecvena fiecrui interval, pornind din centrul acestuia

    Figura 3. Reprezentarea grafic prin poligonul frecvenelor.

    Dac marcm pe abscis fiecare interval prin liniue echidistante i unim printr-o linie continu punctele reprezentnd frecvena intervalelor obinem curba distribuiei.

  • AUREL STAN

    116

    Figura 4. Reprezentare grafic sub forma curbei frecvenelor

    Reprezentrile grafice ale variabilelor calitative cunosc o serie de particulariti, determinate de specificul scalei de msurare. Astfel, pentru a nu crea iluzia unei forme de distribuiei (deoarece modalitile unei variabile nominale i pot schimba locul fr a denatura reprezentarea fenomenului studiat) se adopt ca forme de reprezentare grafic diagrama n tronsoane i diagrama circular. Pentru exemplificare, folosim datele tabelului anterior referitor la tipul de studii.

    Diagrama prin tronsoane

    75

    43

    14

    a-studii umaniste;b-studii economice;c-studii tehnice

    cba

    Diagrama circular

    a

    studii umaniste56%

    studii economice

    33%

    studii tehnice11%

    Figura 5. Cuprinde modaliti de reprezentare grafic specifice scalelor nominale(n primul tip de reprezentare grafic sunt trecute frecvenele absolute, n al doilea tip frecvenele relative).

    2

    6

    11

    17

    22

    1312

    53

    0

    5

    10

    15

    20

    25

    "21-27" "28-34" "35-41 "42-48" "49-55" "56-62" "63-69" 70-76" "77-83"

    Intervalele de variatie

    Frec

    vent

    a in

    terv

    aleo

    r

  • STATISTIC I

    117

    II.4. PROTOCOALE DE PREZENTARE A DATELOR. Noiunea de protocol de prezentare a datelor este foarte frecvent utilizat n domeniul cercetrilor

    calitative i cantitative din cadrul disciplinelor socio-umane. Este un tablou al rezultatelor de baz care nregistreaz rezultatul fiecrui subiect n fiecare din condiiile experimentale.

    Pentru a nu folosi termeni tiinifici nc necunoscui studenilor anului I, menionm c experimentul este o metod de investigaie care presupune varierea elementelor constitutive ale unei situaii n scopul de a provoca un fenomen i de a msura evoluia sa. Elaborarea unui experiment este fcut n scopul de a analiza modificrile rspunsului n funcie de

    caracteristicile stimulului, ale situaiei, ale sarcinilor sau ale subiecilor. Am amintit anterior c variabilele independente n cadrul unui experiment poart numele de factori. Anumii autori (H. Rouanet) disting variabila independent de factor, n sensul c factorul este o anumit operaionalizare a variabilei. Operaionalizarea conceptual a fost explicat anterior.. Un plan factorial este un plan de cercetare n care fiecare modalitate a factorului este combinat cu fiecare modalitate a altor factori. Numrul condiiilor experimentale ntr-un anumit plan factorial este egal cu produsul numrului de modaliti a fiecrui factor. Dac dorim s studiem particularitile atitudinale n funcie de mediul de provenien i sex, vom avea un plan experimental 2x2: variabila mediu de provenien (notat cu P2) are modalitile rural (notat p1) i urban(notat p2) i variabila sex(notat S2) are modalitile masculin(notat s1) i feminin (notat s2). 4 condiii experimentale ofer surse de date care vor fi supuse analizei: condiia 1(p1s1), condiia 2(p1s2), condiia 3(p2s1), condiia 4(p2s2).

    Protocol de tip Sn protocol de structur subiect-rezultat total. n cadrul acestui tip de protocol,

    fiecrui subiect si dintr-un ansamblu format din n subieci i corespunde o valoare a variabilei Xi.16 Exemplu:

    Si Xi Si Xi S1 X1 1 17 S2 X2 2 19 S3 X3 3 27 S4 X4 4 33 - - - - Sn Xn

    87 27 Tabelul 8. Protocol de tip Sn n partea din dreapta se d un exemplu concret Protocol de structur S . Protocol de structur subiect-grup de apartenen. Astfel de

    protocoale se construiesc n cazul n care rezultatele numerice aparin la subieci care fac parte din grupuri diferite sau care au fost plasai n situaii diferite i constituie grupuri independente de msurtori. Exemplificm:

    16 Explicaii suplimentare n lucrarea Valentin Clocotici, Aurel Stan, Statistic aplicat n psihologie, Polirom, Iai, 2000, pag.94-103

  • AUREL STAN

    118

    S G Xi S G Xi S1 G1 X1 1 Grup 1 12 S2 G1 X2 2 Grup 1 19 S3 G2 X3 3 Grup 2 23 - - - - - - Si Gi Xi 35 Grup 3 35 - - - - - - - - - - - - Sn Gq Xn

    143 Grup 7 29 Tabelul 9. Protocol de baz de tipul subiect grup de apartenen

    Protocol de tipul S*T protocol de structur subiect-condiii de investigaie. Se realizeaz n situaia n care subiecii(S) sunt supui la mai multe condiii de solicitare psihic. Vom exemplifica pentru dou condiii: sunt prezentate rezultatele aceluiai subiect n condiia T1 i condiia T2

    T S

    T1 T2 T S

    T1 T2

    S1 X11 X12 1 23 29 S2 X21 X22 2 34 31 S3 X31 X32 3 28 39 . . .. Sg Xp1 Xp2

    123 21 26 Tabelul 10. Protocol de baz de tipul subiect condiii de investigaie. n ultimele trei coloane din dreapta se exemplific cu o examinare concret.

    Suportul protocolului este cadrul n care rezultatele individuale nu au fost reportate. Subprotocolul este o parte a protocolului de baz; rezultatele obinute printr-o parte din subieci i/sau ntr-o parte a condiiilor experimentale

    Mai putem vorbi de protocoale derivate. Acest tip de protocol este obinut dup ce s-a realizat anumite operaiuni (transformri ale variabilelor dependente, diferite calcule, condensri i rafinri ale modalitilor) asupra protocolului de baz. De exemplu, calculul mediei rezultatelor obinute de subieci ntr-o condiie experimental. Calculele pot s rezide n transformarea variabilei dependente (prin transformare logaritmic, de exemplu), n rezumarea rezultatele prin intermediul diferitelor tipuri de indicatori (tendin central, dispersie), n nsumarea datele individuale i n calcularea frecvenelor sau a procentajelor. n general, cercettorul va prezenta datele ntr-un tablou al rezultatelor care constituie un protocol derivat.

    Exemplificare. Protocoale derivate17 Doi cercettori francezi, J.P. Rossi i C. Loridan, au efectuat n anul 1987 un studiu asupra

    modelelor fonologice de identificare a stimulilor scrii. n timpul efecturii studiului au calculat durata pauzelor oculare asupra stimulului: (cuvinte sau ne-cuvinte) care aveau 2-3 silabe sau 4-5 silabe n

    17 dup J.P. Rossi & Al., La mthode exprimentale en psychologie, Dunod, Paris, 1997, pag.61

  • STATISTIC I

    119

    situaii de detecie a literelor(subiectul trebuie s spun dac o anumit liter era prezent printre stimuli) i de decizie lexical (subiectul trebuia s spun dac stimulul era un cuvnt).

    n urma prelucrrii rezultatelor, autorii au ntocmit urmtorul tabel: Detecie litere (t1) Decizie lexical (t2) Numr

    silabe Cuvinte(m1) Necuvinte(m2) Cuvinte(m1) Necuvinte(m2) m 457 473 414 497 n1 s 133 126 111 137 m 460 482 468 579 n2 s 126 105 145 176

    n acest tabel sunt nregistrate duratele pauzelor oculare. Explicarea acestei cercetri opereaz

    cu urmtorii termenii: factor principal sistematic, notat T2, cu modalitile t1 (detecia literelor) i t2 (decizia lexical).

    Prin aceast se permite o prim diviziune n dou coloane a rezultatelor; tipul de stimul, notat cu M2, cu modalitile m1 (cuvinte) i m2 (necuvinte). Cu M2 se permite

    subdivizarea coloanelor t1 i t2 (sarcinile); numrul de silabe, notat N2, cu modalitile n1 (2 sau 3 silabe) i n2 (4 sau 6 silabe). N2 este

    indicat pe linii. Variabila dependent este durata pauzelor oculare.

    n tabel sunt nregistrate mediile interindividuale (m), ca indicator de tendin central, i abaterile standard (s), ca indicator de mprtiere. Lectura tabelului presupune punerea n coresponden a liniilor i coloanelor. Valoarea 457 semnific durata medie a pauzelor oculare n sarcina de detecie a literelor cnd stimulii sunt cuvinte de 2-3 silabe. Valoarea 497 semnific durata medie a pauzelor oculare cnd stimulii sunt necuvinte de 2-3 silabe. Protocolul prezint un indicator de tendin central i un indicator de mprtiere care fac bilanul datelor experimentale. Un protocol de baz cuprinde durata pauzelor oculare obinute de fiecare subiect pentru fiecare din stimulii prezentai, deoarece n fiecare condiie experimental sunt utilizai mai muli stimuli diferii.

    II.5. TRANSFORMAREA VALORILOR BRUTE N CUANTILE Care este raiunea acestei transformri? n marea majoritate a examinrilor psihologice se cere o

    raportare valoric a rezultatelor obinute. Rezultatul brut al unui test sau chestionar psihologic nu ne poate da dect o indicaie vag n privina aprecierii unui rezultat. Pentru a veni n ntmpinarea dezideratului de raportare valoric a rezultatelor s-au creat dou sisteme de norme. Unele dintre acestea sunt cuantilele, iar celelalte sunt variabilele normate care vor fi tratate n seciunea din lucrare afectat indicatorilor de mprtiere.

    Cuantilul este un element al unei serii ordonate de valori ale unei variabile care separa dou cuantumuri procentuale din volumul total al valorilor variabilei. Practic, este o born numeric separnd dou cuantumuri procentuale ale ansamblului valorilor Valorile variabilei separate prin intermediul unui cuantil sunt ordonate cresctor sau descresctor, operaie anterioar stabilirii cuantilului. Separaia unui ansamblu de valori ale variabilelor n cuantile constituie una din formele de etalonare a testelor, adic de creare a unor scale de apreciere a valorii performanelor obinute la diferite sisteme de solicitare psihic. Etaloanele permit de a situa un subiect care a obinut un scor

  • AUREL STAN

    120

    determinat ntr-o anumit clas valoric a subiecilor pentru care testul a fost etalonat. Se va vorbi de intercuantile (de interdecile, de exemplu) pentru a desemna n+1 zone de distribuie delimitate prin cuantile (prin n desemnnd numrul cuantilelor). Uneori se utilizeaz termenul de interquantil n loc de quantil. Distincia clar se face prin precizarea faptului c interqantilul este un interval numeric, pe cnd quantilul este reprezentat de o singur valoarea numeric. Lucrrile se specialitate ale lui Maurice Reuchlin consacrate statisticii aplicate n psihologie fac clar aceast separaie de sensuri pentru cele dou noiuni18.

    Cuantilele i intercuantilele numerotate cu 1 corespund, n general n Frana, celor mai bune rezultate, iar n SUA rezultatelor celor mai slabe. Este o chestiune de convenie a notrii. Dac ntr-o distribuie se vor reprezenta intercuantilele prin clase determinnd intervale pe axa absciselor, se va asigura la aceast distribuie grafic o form rectangular, efectivele teoretice ale tuturor interquantilelor fiind egale prin definiie.

    La nceputul procedurii de cuantilaj (form particular a etalonajului) se alege o metric, adic un numr de niveluri pe care scala permite de a le discrimina. Dac o scal cuprinde n niveluri i dac efectivul total al unui

    eantion este N, efectivul fiecrui nivel va fi teoretic nN . Scala n cuantile va corespunde, deci, unui model

    rectangular. Cele mai utilizate tipuri n cuantile sunt prezentate n tabelul care urmeaz:

    Tabelul nr. 11 Conine denumirile formelor de etalonare prin intermediul cuantilelor, gradiente de la 3 la 10

    Pentru a construi un decilaj (sistem de clasificare cuprinznd 9 cuantile i 10 intercuan-

    tile) se procedeaz n aa fel nct clasele scalei rezultate s conin fiecare un acelai numr de scoruri din eantionul de referin. Este vorba de o convenie care va face distribuia rectangular (n care fiecare diviziune are un numr egal de subieci). Dac scala este constituit din 10 clase egale n efectiv, acest efectiv va trebui s aib 10% din numrul total al subiecilor. Limitele valorice ale interquantilului I vor conine primele 10 % din notele brute, celor mai slabe din distribuie, ale interquantilului II conin 10% din rezultatele care urmeaz, i aa mai departe, pn la interquantilul X. Quantilul I va separa primii 10% din subieci de urmtorii 90%, quantilul II primii 20% din subieci de urmtorii 80 %, i aa mai departe, pn la quantilul IX care va separa primii 90% de urmtorii 10% .

    Oferim un exemplu imaginat: un psiholog examineaz un numr de 360 de subieci cu un anumit test n vederea etalonrii acestuia. Procedura de etalonare se pune n practic n faza construirii unor instrumente de investigaie psihologic sau n cazul reevalurii acestora. Notele testului variaz, in exemplu nostru, ntre 0 i 35. Exemplu dat este unul imaginat i nu va conine primele 5 valori (1,2,3,4,5) i ultimele 3 (33,34 i 35). De obicei, n examinare se obin foarte rar scorurile cele mai mici i scorurile cele mai mari ale testului sau chestionarului. Dac datele ar fi fost reale, ar fi trebuit s se fac o serie de precizri cu privire la constituirea eantionului de etalonaj, adic la proveniena subiecilor examinai, la vrst, nivel de studii, sex etc. De asemenea, ar fi trebuit s se fac precizri cu

    18 Vezi Maurice Reuchlin, Prcis de statistique, PUF, Paris, 1976, pag. 67-78

    Nr.crt.. Nr interquantile Nr quantile Denumire tehnic 1 3 2 Trecil 2 4 3 Quartil 3 5 4 Quintil 4 6 5 Sextil 5 7 6 Septil 6 8 7 Octiil 7 9 8 Nonil 8 10 9 Decil 9 100 99 Centil.

  • STATISTIC I

    121

    privire la tehnicile folosite pentru selectarea subiecilor n eantion. naintea operaiunii de etalonare, datele se organizeaz cresctor n variante de variaie.

    Tabelul ntocmit n vederea stabilirii scalei de etaloane n 10 interquantile (sau n 10 clase) va arta n felul urmtor.

    X n nc nct Interdecil Decil Numerotare % interdecil Separaie decil 6 7 8 9 10 11

    3 7 4 6 8 11

    3 10 14 20 28 39

    36

    0 11

    11

    I

    10,88%

    10,88%/89,12%

    12 13

    14 17

    53 70

    72

    12 13

    13

    II

    8,61%

    19,49%/80,51%

    14 15

    16 19

    86 105

    108

    14 15

    15

    III

    9,72%

    29,21%/70,79%

    16 17

    24 22

    129 151

    144

    16 17

    17

    IV

    12,77%

    41,98%/58,02%

    18 26 177 180 18 18 V 7,22% 49,20%/50,80% 19 20

    21 24

    198 222

    216

    19 20

    20

    VI

    12,50%

    61,70%/38,30%

    21 22

    18 19

    240 259

    252

    21 22

    22

    VII

    10,27%

    71,97%/28,03%

    23 24

    17 14

    276 290

    288

    23 24

    24

    VIII

    8,61%

    79,58%/20,42%

    25 26

    16 14

    306 320

    324

    25 26

    26

    IX

    8,33%

    87,91%/12,09%

    27 28 29 30 31 32

    11 9 7 6 5 2

    331 340 347 353 358 360

    331 340 347 353 358 360

    27-32

    X

    12,09%

    Tabel nr. 12. Coloanele tabelului conin etape ale procedurii de etalonare prin metoda quantilelor a rezultatelor obinute la un test psihologic de subieci unui eantion Notaiile folosite n tabel :

    X: nota brut n: frecvena absolut a unei variante de variaie nc:frecvena cumulat absolut nct: frecvena cumulat absolut necesar teoretic pentru calcularea interquantilelor i quantilelor.

    Jocul frecvenelor cumulate absolute face s nu putem tia distribuia exact acolo unde trebuie.

    n acest caz ne limitm n calcul la cele mai apropiate valori de cele teoretice. Astfel, la primul decil ar fi trebuit s ne oprim la valoarea 36. Valoarea 39 folosit de noi ca valoare delimitativ pentru primul decil este cea mai apropiat valoare de 36. Procednd n acest fel am realizat un compromis metodologic.

    n cazul cnd dorim s stabilim o scal n centile sau percentile, avem la ndemn o procedur puin diferit. Pentru a pune n aplicare aceast procedur trebuie s avem distribuii ale cror amplitudini sunt de ordinul sutelor. Raiunea construirii scalelor care fac apel la centile este de a asigura

  • AUREL STAN

    122

    o discriminare foarte fin a subiecilor, dar n cazul n care amplitudinea distribuiei este sub 100 asigurm o fals finee a diferenierii. Redm, n continuare, un tabel ale crui coloane indic paii de urmat n procedura de calcul:

    Lum exemplu a 127 de subieci care au fost examinai cu un anumit test (exemplul este fictiv). Nr.crt. X f f% C fc% Percentila 1. 11 2 1,57 2 1,57 0,79 2. 12 5 3,94 7 5,51 3,54 3. 13 7 5,51 14 11,02 8,27 4. 14 11 8,68 25 19,69 15,36 5. 15 19 14,96 44 34,65 27,17 6. 16 26 20,47 70 55,12 44,89 7. 17 18 14,17 88 69,29 62,21 8. 18 15 11,81 103 81,10 74,50 9. 19 11 8,66 114 89,76 85,43 10. 20 7 5,51 121 95,28 92,52 11. 21 4 3,15 125 98,43 96,85 12. 22 2 1,57 127 100,00 99,22

    Tabel nr. 13. Coloanele tabelului indic etapele necesare calculrii valorilor percentile Avem n fa un exemplu simplu, deoarece n practic este foarte puin probabil s se gseasc

    un test la care s se poat obine doar 12 valori distincte. Procedura exemplificat de noi este folosit de autori reputai n domeniul psihometric ca David

    Magnusson19, J.J. Bernier i B. Pietrulewicz20. Prin aceast procedur se ncearc a se ameliora impreciziile metodei prezentate la calculul decilelor.

    Coloana notat cu X conine diferitele variante ale variabilei obinute n urma unei examinri cu un anumit test. A doua coloan, notat cu f , conine frecvenele diferitelor valori ale variabilei. n total au fost cuprini n analiz 127 de rezultate ale subiecilor. Cu f% a fost notat frecvena simpl relativ, care se obine prin nmulirea cu 100 a rezultatului mpririi fiecrei frecvene simpl la 127 (numrul total de subieci examinai). Cu fc a fost notat frecvena absolut cumulat ascendent, iar cu fc% frecvena relativ cumulat ascendent. Valorile din aceast coloan se obin prin nmulirea cu 100 a rezultatului mpririi fiecrei valori din coloana fc la 127. Ultima coloan conine transformarea n valori percentile a valorilor iniiale ale testului. Cum se obin aceste valori? Valoarea 13, de exemplu, este considerat mijlocul unui interval de clas care se ntinde de la 12,5 pn la 13,5. Ca atare, valoarea percentil este constituit din frecvena cumulat relativ anterioar valorii 13 i din adugarea din frecvena relativ din dreptul valorii 13.

    8,27 = 5,51 + 251,5

    15,36 = 11,02 + 268,8

    Ce ne spune o valoare percentil? Ea ne spune, de exemplu, c sub valoarea 16 se gsesc aproximativ 45% din totalul subiecilor, iar peste aceast valoare se gsesc aproximativ 55 % din totalul subiecilor. 19 vezi David Magnusson, Testtheorie, Verlag Fraanz Deutlicke Wien, 1973, pag 252 20 vezi J.J. Bernier, B. Pietrulewicz, La psychometrie, Gaetan Morin Editeur, Montreal, Casablanca, 1997, pag. 371-372

  • STATISTIC I

    123

    n cazul ordonrii valorilor variabilei pe intervale de variaie procedura este puin diferit. Folosim exemplul de la nceputul seciunii referitoare la gruparea datelor. Rubricile tabelului sunt cunoscute din comentariile noastre anterioare. n cazul n care dorim s construim o scal n quartile (trei quartile mpart distribuia n 4 clase) vom stabili n primul rnd quota, adic un cuantum procentual de subieci separat de valorile quartilelor. Deci, quartilele se refer la valorile distribuiei, iar quota la un cuantum procentual al efectivului total. Quota pentru primul quartil va fi de 25% din efectivul total (22,75 n valoare absolut), quota pentru cel de-al doilea quartil va fi de 50% (45,5 n valoare absolut) i quota pentru cel de-al treilea quartil va fi de 75% (68,25 n valoare absolut).

    Nr.crt Interval f Fc fc% 1 21 27 2 2 0,02 (2%) 2 28 34 6 8 0,09 (9%) 3 35 41 11 19 0,21 (21%) 4 42 48 17 36 0,40 (40%) 5 49 55 22 58 0,64 64%) 6 56 62 13 71 0,78 (78%) 7 63 69 12 83 0,91 (91%) 8 70 76 5 88 0,97 (97%) 9 77 83 3 91 1,00 (100%) Total N=91

    Tabelul 14. Coloanele tabelului conin etape de calcul pentru obinerea quantilelor i interquantilelor n condiiile gruprii de variante de variaie

    Valoarea primei quote va cuprinde 25% din rezultatele subiecilor examinai.. Dac privim la

    rubrica fc% a tabelului observm c primii 25% din subieci sunt delimitai de intervalul numrul 4 care cuprinde pn la el 40% din subieci (inclusiv intervalul 4). Intervalul anterior nu putea s fac o astfel de separaie, deoarece pn la el se gsesc doar 21% din rezultatele subiecilor (19 rezultate n valoare absolut). Formula de calcul pe care o aplicm pentru calculul quantilelor pentru date organizate pe variante de variaie este urmtoarea.

    Q = fdiX *sup + ;

    n care: Q = denumire generic pentru quantil; Xsup= valoarea superioar a intervalului anterior celui n care se afl quota; i = mrimea intervalului de variaie; d = diferena dintre valoarea absolut a quotei i frecvena cumulat absolut anterioar

    intervalului n care se afl quota; f = frecvena simpl absolut a intervalului n care se afl quota Pentru cazul nostru particular de calcul a quartilelor, form particular a quantilelor, vom nota

    quartilul 1 cu Q1, quartilul 2 cu Q2, quartilul 3 cu Q3. Pentru Q1 am amintit c valoarea procentual a quotei este de 25%, iar valoarea absolut este de 22,75 (25% din 91; 910,25=22,75). Valoarea absolut a quotei primului quartil se afl n intervalul 4.

    Xsup sau valoarea superioar a intervalului anterior celui n care se afl quota este egal cu 41. Intervalul anterior este intervalul 3 (35-41). Valoarea superioar sau limita superioar a acestuia este 41.

    Mrimea unui interval (i) este egal cu 7.

  • AUREL STAN

    124

    Diferena dintre valoarea absolut a quotei (22,75) i frecvena absolut cumulat ascendent a intervalului anterior celui n care se afl quota (19) este egal cu 3,75 (deci, d=22,7519=3,75).

    Frecvena intervalului n care se afl quota este egal cu 17. Intervalul 4 are frecvena egal cu 17.

    Avem la dispoziie toate datele necesare calculrii primului quartil.

    Q1 = 41+17

    75,3*7 = 41+ 54,4254,14117

    25,26=+=

    n continuare, trecem la calcularea celui de-al doilea quartil. Al doilea quartil separ primele 50% din rezultatele subiecilor de urmtoarele 50%. De aceast dat quota va fi egal cu 50% din efect


Recommended