Home >Documents >Statistica Psihologica

Statistica Psihologica

Date post:25-Jun-2015
Category:
View:3,624 times
Download:5 times
Share this document with a friend
Description:
Sinteza anul 2 sem. 1 Psihologie
Transcript:

CIPRIAN RULEA

STATISTIC PSIHOLOGICI PRELUCRAREA INFORMATIZAT A DATELORCURS INTRODUCTIV PENTRU STUDENII SPECIALIZRIILOR PSIHOLOGIE I TIINELE EDUCAIEI

2010

TEME PENTRU STUDIUCuvnt nainte Capitolul 1. Evoluia statisticii i obiectul ei de studiu 1.1. Evoluia istoric a statisticii 1.2. Obiectul de studiu i rolul statisticii 1.3. Programe-software utilizate n statistica social i psihologic 1.4. Noiuni introductive privind utilizarea programului SPSS Capitolul 2. Noiuni fundamentale folosite n statistic 2.1. Colectivitatea i unitatea statistic. 2.2. Variabile statistice. 2.3. Cuantificarea i msurarea fenomenelor psihosociale. 2.4. Scale de msur. 2.5. Definirea variabilelor statistice cu ajutorul SPSS. Capitolul 3. Ordonarea, gruparea i prezentarea datelor statistice 3.1. Serii (distribuii) statistice 3.2. Gruparea (sistematizarea) datelor 3.3. Prezentarea datelor sub form de tabele 3.4. Reprezentarea grafic a datelor statistice 3.5. Utilizarea SPSS pentru ordonarea i gruparea datelor statistice 3.6. Utilizarea SPSS pentru prezentarea datelor statistice sub form de tabele 3.7. Utilizarea SPSS pentru reprezentarea grafic a datelor statistice Capitolul 4. Indicatori ai tendinei centrale 4.1. Mediile 4.2. Quantilele: mediana, quartilele, decilele i centilele 4.3. Modul 4.4. Relaia dintre medie, median i modul 4.5. Reprezentri de tip Boxplots 4.6. Utilizarea SPSS pentru calcularea i reprezentarea indicatorilor de poziie Capitolul 5. Indicatori ai variaiei i indicatori ai formei 5.1. Indicatori simpli (elementari) ai variaiei 5.2. Indicatori sintetici ai variaiei 5.3. Indicatori ai formei distribuiei 5.4. Utilizarea SPSS pentru calcularea indicatorilor variaiei i ai formei

Capitolul 6. Distribuiile statistice 6.1. Distribuia normal 6.2. Distribuii simetrice i asimetrice 6.3. Distribuii unimodale i bimodale 6.4. Valori normate (scoruri z) 6.5. Distribuia normal standardizat Capitolul 7. Inferena statistic 7.1. Delimitri conceptuale 7.2. Probleme de estimare 7.2.1. Semnificaia unei medii. 7.2.2. Semnificaia frecvenei 7.3. Testarea ipotezelor 7.4. Testele parametrice t i z 7.4.1. Testele t i z pentru un eantion. 7.4.2. Testele t i z pentru dou eantioane independente 7.4.3. Testele t i z pentru dou eantioane dependente 7.5. Utilizarea SPSS pentru aplicarea testului t Capitolul 8. Corelaie i regresie 8.1. Noiunea de covarian 8.2. Coeficienii de corelaie 8.2.1. Clasificarea coeficienilor de corelaie. 8.2.2. Formula coeficientului de corelaie liniar simpl (Bravais-Pearson) 8.2.3. Reprezentarea grafic a corelaiei. Liniaritatea relaiei. 8.2.4. Interpretarea coeficientului de corelaie. Mrimea efectului. 8.3. Coeficieni de corelaie parametrici 8.3.1. Coeficientul de corelaie Pearson r. 8.3.2. Coeficientul rbis 8.4. Coeficieni de corelaie neparametrici: coeficientul de corelaie a rangurilor Spearman 8.5. Regresia simpl liniar 8.6. Utilizarea SPSS pentru determinarea coeficienilor de corelaie Bibliografie

4

1. EVOLUIA STATISTICII I OBIECTUL EI DE STUDIU1.1. 1.2. 1.3. 1.4. Evoluia istoric a statisticii Rolul i scopul statisticii Programe-software utilizate n statistica social i psihologic Noiuni introductive privind utilizarea programului SPSS

1.1. EVOLUIA ISTORIC A STATISTICIIPe msur ce omenirea a evoluat, statistica s-a ndeprtat radical de statutul de ramur a matematicii aplicate, n zilele noastre, fiind considerat att o tiin, o metod de cunoatere a realitii socio-economice, ct i o disciplin de nvmnt. Evoluia ei a cunoscut numeroase modificri, precizri, transformri n ceea ce privete obiectul ei de studiu dar i din perspectiva instrumentelor, metodelor sale de cercetare. Ca i alte tiine (matematica, de exemplu) i aceast disciplin a parcurs drumul lung i sinuos de la necesitile practicii la elaborrile teoretice. Lucrri cu caracter statistic, impuse de nevoile conducerii treburilor publice, apar nc din antichitate. n Egipt, Grecia i Roma antic erau realizate recensminte destinate evidenierii resurselor umane i materiale ale statelor respective. Aceste preocupri ns, au fost considerate naive i pretiinifice, adevratul neles al statisticii, acela de tiin, datnd doar de la jumtatea secolului al XVII-lea. Prima analiz statistic, n spirit tiinific, a unor date culese n prealabil, este datorat lui John Graunt (1662) care, pe baza datelor extrase din ntiinrile sptmnale cu privire la numrul John Graunt (1620 - 1674) deceselor nregistrate la Londra, a izbutit s trag concluzii valabile asupra unor comerciant englez, preocupat n timpul liber de fenomenele demografice din Londra, public n fenomene sociale, precum: natalitatea i 1662 articolul Natural and Political Observations mortalitatea, echilibrul numeric .a. Prin on the Bills of Mortality. Ideile sale au fost preluate Edmond aceste preocupri el este considerat de Sir William Petty i de astronomulSocietatea Halley i apoi recunoscute de ctre printele demografiei. Regal Englez n Anglia, alturi de Graunt, titlul de

inventator al statisticii i se atribuie i lui William Petty (1623-1687), care introduce conceptul de aritmetic politic definit ca studiul fenomenelor socialeconomice prin intermediul cifrelor, al msurilor i greutilor. Paralel cu aceste prime preocupri s-a creat, n Germania, un curent de gndire care i propunea s descrie situaia diferitelor state constituite la acea vreme din punct de vedere al populaiei, bogiilor, industriei, comerului i finanelor. Aceast preocupare se apropie mai mult de sensul etimologic al cuvntului statistic: n limba latin status, are sensul de stare sau stat. Astfel unii autori atribuie germanului Gottfried Achenwall (1719-1772) meritul de a fi ntrebuinat pentru prima dat termenul de statistic, dnd ntietate colii descriptive germane. Spre deosebire de coala englez a aritmeticii politice, care punea accentul pe colectarea cifrelor i analiza lor, coala descriptiv german era orientat spre alctuirea de monografii i spre compararea calitativ a resurselor statelor. Recunoscnd meritul ambelor curente de gndire, T. Rotariu (1999, p.15) consider c tiina statistici, aa cum arat ea astzi, datoreaz aproape totul colii engleze, ns contribuia universitar german nu poate fi neglijat chiar i numai pentru motivul c respectivei coli i datorm numele acestei tiine. n spiritul acestei coli descriptive, au fost elaborate i n rile romne n secolele XVIII i XIX o serie de lucrri ce au contribuit la dezvoltarea statisticii. Prima i cea mai reprezentativ lucrare de acest gen este Descriptio Moldaviae (1716) a lui Dimitrie Cantemir (1673-1723), o monografie cu caracter geografic, politic, economic, social i cultural, care l impune pe autorul ei printre fruntaii statisticii descriptive europene (D. Porojan, 1993). i ali cronicari precum Grigore Ureche sau Ion Neculce au avut preocupri asemntoare, iar n 1859, sub domnia lui Alexandru Ioan Cuza, se nfiineze primul Birou de Statistic al rii Romneti, condus de Dionisie Pop Marian (Popescu, 2000) Revenind la nceputurile statistici, reamintim faptul c coala descriptiv german era orientat spre descrierea verbal a caracteristicilor statelor, n timp ce aritmetica politic a fost orientat spre analiza fenomenelor sociale i cutarea legitilor respective pe baza datelor i calculelor numerice. Ambele curente au fost depite de Karl Friedrich Gauss (1777 - 1855) progresele realizate n domeniul astronom, matematician i fizician german. A fcut matematicii, n general i al calculului descoperiri importante n materie de mecanic celest, probabilitilor, n special. De altfel, electromagnetism, optic. A dezvoltat teoria numerelor. A pus premisele geometriei hiperbolice noneuclidiene dezvoltarea teoriei probabilitilor a constituit un pas-nainte nu numai pentru statistic, ci i pentru ntreaga creaie intelectual a omenirii.

6

nc din secolul al XVII-lea s-a observat c msurtorile repetate ale unui obiect oarecare pot fi reprezentate grafic sub forma unei curbe n form de clopot. Ecuaia curbei normale a fost publicat n 1733 de ctre Abraham de Moivre iar lucrrile acestuia au fost dezvoltate ulterior de Pierre Simon de Laplace i Karl Friedrich Gauss. n zilele noastre curba normal poart numele savantului german: clopotul/curba lui Gauss.

Exemplu: Calificativele obinute n urma examenului de statistic de 110 studeni, alei aleator. Odat cu progresele fcute n culegerea datelor i cu creterea interesului fa de observaia i msurtorile tiinifice, statistica a devenit un instrument indispensabil pentru toate tiinele sociale. Un nume de referin este cel al francezului Frdric Le Play (1806-1870). Acesta este recunoscut prin introducerea n analiza sociologic a mijloacelor cantitative (Rotariu et.al., 1999, p.15). ns, cea mai mare contribuie n aceast direcie o are belgianul Adolphe Qutelet (1796-1874), care, la nceputul secolului al XIX-lea, aplic teoria probabilitilor la studiul fenomenelor sociale, introducnd conceptul de statistic moral. Sub iniiativa sa s-a organizat n 1853 primul Congres Internaional de Statistic, la care s-a constituit Institutul Internaional de Statistic. Adevratul nceput al statisticii moderne poate fi fixat la nceputul secolului al XX-lea odat cu apariia lucrrilor lui Karl Pearson (creatorul statisticii infereniale sau inductive) i Ronald Aylmer Fisher (a elaborat teoria riguroas a tragerilor concluziilor din datele observate). Alte nume de referin n fundamentarea statisticii sociale sunt: C.E. Spearman, G.U. Yule, M.G. Kendall, A.A. Markov

7

1.2. OBIECTUL DE STUDIU I ROLUL STATISTICIIn dezvoltarea sa statistica s-a preocupat de acele fenomene i procese care se produc ntr-un numr mare de cazuri, denumite fenomene colective (de mas) sau, dac ne referim strict la tiinele sociale, fenomene sociale de mas. Aceste fenomene de mas se afl sub incidena legii numerelor mari1 potrivit creia variaiile ntmpltoare de la tendina general se compenseaz reciproc ntr-un numr mare de cazuri individuale. Aplicarea metodelor statisticii n vederea interpretrii datelor oferite de observarea fenomenelor de mas permite formularea unor legi statistice. Acestea exprim media strilor unei mase de evenimente, tendina dominant care-i face loc printr-un mare numr de abateri ntmpltoare de la aceast medie. Legea statistic poate fi evideniat numai dac este supus observrii unui numr suficient de mare de elemente ale ansamblului de studiat (legea numerelor mari). n concluzie, statistica studiaz aspectele cantitative ale fenomenelor de mas, fenomene care sunt supuse aciunii legilor statistice i care se manifest n condiii concrete, variabile n timp i spaiu. ncercnd o definiie sintetic, putem afirma c statistica reprezint un ansamblu de metode i tehnici utilizate pentru a colecta, a descrie i a analiza date obinute n urma unor investigaii tiinifice. Statistica a ptruns n toate domeniile tiinelor naturii i ale tiinelor sociale, formnd discipline de grani precum statistica matematic, statistica economic, statistica social, statistica psihologic, statistica medical, biostatistica etc. Dintre acestea, aa-zisa statistic social i/sau psihologic se suprapune mult timp i n mare msur peste statistica teoretic general, propunndu-i s culeag, prelucreze i s interpreteze informaiile numerice referitoare la fenomenele psihosociale2. Chiar dac vom folosi de multe ori termenul de statistic social (sau psihologic), nu considerm justificat pretenia unora de a considera statistica social ca o tiin de sine stttoare ci, mai degrab ca o disciplin preocupat de a ilustra modul specific n care statistica general se aplic n domeniul tiinelor sociale i comportamentale (vezi caseta 1.1.). Astfel, statistica reprezentnd un corp de metode tiinifice are rolul de a ne nva cum s organizm observarea fenomenelor de mas i s obinem datele necesare, cum s prelucrm aceste date i cum s formulm ipoteze cu privire la relaiile evideniate de aceste date. De asemenea, statistica ofer metode pentru testarea ipotezelor i pentru confruntarea realitii cu prediciile formulate pe baza ipotezelor.

1

Legea numerelor mari a fost formulat de J. Bernoulli n 1713, preciznd c ntr-un numr suficient de mare de cazuri individuale, influenele factorilor se pot compensa n aa fel nct s se ajung la o anumit valoare tipic pentru ntreaga colectivitate. 2 pentru mai mute informaii vezi Rotariu et. al., 1999, pp. 15-18.

8

n urma dezvoltrii istorice prezentate mai sus statistica modern s-a separat n dou pri distincte dar complementare: a) statistica descriptiv, se refer la regulile observrii statistice directe i la obinerea informaiilor ce rezult din prelucrarea datelor empirice. Aici sunt incluse mijloacele clasice ale statisticii: gruparea datelor, distribuiile de frecvene, corelaia i regresia, analiza relaiilor dinamice. b) statistica inductiv (inferena statistic), se refer la organizarea observrii statistice indirecte, prin metode i tehnici de estimare a nsuirilor unei populaii statistice din observaii efectuate asupra unei submulimi de uniti statistice, numit eantion. Include aplicaii statistice ale teoriei probabilitii.

1.3. PROGRAME-SOFTWARE UTILIZATE N STATISTICA SOCIAL IPSIHOLOGIC Cele mai cunoscute programe utilizate de cercettorii din psihologie, sociologie, asisten social, economie, pedagogie etc. atunci cnd realizeaz analize tiinifice i prelucrri statistice complexe sunt: SPSS, SYSTAT, STATISTICA, MINITAB, SuperLab .a. Vom descrie pe scurt dou din aceste software-uri i vom prezenta noiunile de baz necesare utilizrii unuia dintre ele (SPSS).

1.4. NOIUNI INTRODUCTIVE PRIVIND UTILIZAREA PROGRAMULUI SPSSn capitolele aplicative ne vom referi la programul SPSS versiunea 11.0 sub sistemul de operare Windows.3 Aceste capitole se vor a constitui un ghid de laborator care s-l orienteze i ndrume pe utilizator n dorina acestuia de a-i nsui procedurile i tehnicile oferite de programul SPSS pentru prelucrarea statistic a datelor. Deschiderea programului Pentru pornirea unei sesiuni de lucru n SPSS exist urmtoarele posibiliti: Daca pe desktop se afl shortcut-ul (icon-ul) SPSS se poziioneaz cursorul pe respectivul icon i se tasteaz dublu-clik pe butonul stnga al mouse-ului.

3

Unele dintre informaiile prezentate nu sunt integrate n versiunile mai vechi (de exemplu, versiunea 7.0) i sunt diferite sub alte sisteme de operare sau pentru sistemele Macintosh.

9

Dublu-clik pe butonul stnga al mouse-ului

Dup ce sistemul de operare Windows a fost ncrcat, se apas o singur dat pe butonul stnga al mouse-ului pe urmtorul traseu: Start Programs SPSS for Windows SPSS 11.0 for Windows Dup deschiderea programului SPSS, pe ecran va aprea o fereastr de ntmpinare. Este de fapt o fereastr de date (Data View) din cadrul editorului de date (SPSS Data Editor), fr titlu - denumit totui Untitled - i, atenie!, fr s fie salvat n memoria calculatorului. O a treia posibilitate de deschidere a SPSS-ului o reprezint accesarea (prin dublu-clik) a oricrui fiier acceptat de program. Exemple: bazele de date n SPSS sunt fiiere cu extensia *.sav; fiierele de tip syntax au extensia *.sps; fiierele de tip output au extensia *.spo etc. Ferestrele n SPSS SPSS folosete mai multe tipuri de ferestre, fiecreia dintre ele fiindu-i asociat un anumit tip de fiier. Iat cele mai importante dintre ele: Fereastra de editare a datelor (Date Editor) se deschide implicit la lansarea unui fiier de tip baz de date, fiier care n SPSS are extensia *.sav. n aceast fereastr sunt introduse i afiate datele de lucru sub forma unui tabel n care liniile reprezint cazurile (subiecii) iar coloanele variabilele cercetrii. Fereastra de editare este, la rndul ei, compus din dou foi (ferestre): - fereastra de date (Data View), folosit pentru introducerea i vizualizarea seriilor statistice simple (a datelor brute) vezi figura 1.1. - fereastra de gestionare a variabilelor (Variable View), folosit pentru definirea i modificarea variabilelor vezi figura 1.2. Accesarea uneia dintre aceste dou ferestre se realizeaz prin acionarea icon-ului corespunztor din partea stng-jos a ferestrei de ntmpinare.

10

Bar de titlu

Fereastr pentru introducerea datelor (Editor de celule)

Bar de meniuri Bara de instrumente Variabile (variables)

cazuri (cases) Bara de derulare (defilare)

celule (cells)

Figura 1.1. Fereastra de ntmpinare a programului SPSS Fereastra de gestionare a rezultatelor sau Fereastra de ieire (Output SPSS Viewer), folosit pentru afiarea i editarea rezultatelor prelucrrilor statistice (tabele, grafice, indicatori statistici) vezi figura 1.3. Fereastra Output Viewer este structurat n dou cadrane sau zone: cadranul din stnga cuprinsul prezint sub forma unei schie obiectele coninute n fereastr i cadranul/zona din dreapta coninutul n care sunt afiate rezultatele obinute prin respectiva analiz. Pentru apariia acestei ferestre ntlnim urmtoarele situaii: - SPPS deschide automat aceast fereastr atunci cnd este solicitat s fac prelucrri i analize statistice (Atenie: fiierul astfel format va avea denumirea OUTPUTx i nu este salvat n memoria calculatorului; pentru aceasta trebuie parcurs traseul File - Save sau File - SaveAs); - este deschis de ctre utilizator prin accesarea unuia dintre fiierele cu extensia *.spo salvate anterior n memoria calculatorului.

11

Figura 1.2. Fereastra de gestionare a variabilelor

Figura 1.3. Fereastra de gestionare a rezultatelor Fereastra de editare a comenzilor (Syntax Editor) permite scrierea comenzilor de ctre utilizator i salvarea acestora ntr-un fiier de tip sintax cu extensia *.sps. Variantele recente ale SPSS conin meniuri pull-down i casete de dialog care permit lansarea comenzilor fr a scrie sintaxa acestora.

12

2. NOIUNI FUNDAMENTALE FOLOSITE N STATISTIC2.1. 2.2. 2.3. 2.4. 2.5. Colectivitatea i unitatea statistic. Variabile statistice. Cunatificarea i msurarea fenomenelor psihosociale. Scale de msur. Definirea variabilelor statistice cu ajutorul SPSS.

Statistica aplicat n tiinele sociale are la baz principiile, tehnicile i metodele avansate de statistica teoretic general. Aceasta din urm, folosete un numr mare de noiuni i concepte, cu caracter general, care formeaz vocabularul de baz al statisticii. n statistica social, s-au ncetenit de-a lungul timpului, urmtoarele concepte fundamentale: COLECTIVITATEA (POPULAIA) STATISTIC reprezint totalitatea elementelor simple sau complexe supuse studiului statistic. (exemple: elevii unei coli, populaia unui ora) UNITATEA STATISTIC (INDIVIDUL STATISTIC) reprezint elementele componente (constitutive) ale colectivitilor statistice. Ele pot fi: - simple (exemple: elevul, studentul, muncitorul); - complexe, acestea sunt rezultatul organizrii sociale i economice a colectivitii (exemple: familia, echipa, clasa de elevi, grupa de studeni). CARACTERISTICA (VARIABILA) STATISTIC reprezint nsuirile sau trsturile ce definesc i delimiteaz unitile statistice (exemple: vrsta, notele colare) VALOAREA (VARIANTA), notat cu x, y reprezint forma concret de manifestare a caracteristicilor la nivelul fiecrei uniti statistice (exemple: 18 ani, nota 7). FRECVENA ABSOLUT, notat cu x, y reprezint numrul de uniti la care se nregistreaz aceeai variant (exemple: 12 elevii au 18 ani, 3 studeni au obinut nota 7). FRECVENA RELATIV (PONDEREA), notat cu rx, ry se obine prin ponderarea frecvenei absolute, altfel spus, reprezint procentul unei frecvene absolute din totalul frecvenelor. (exemplu: din 48 de elevii ai unei clase 12 au vrsta de 18 ani, deci ponderea acestora este de 25%) INDICATORII STATISTICI reprezint expresia numeric a unor determinri obiective ce rezult dintr-o cercetare statistic (exemple: media, mediana, abaterea standard).

2.1. COLECTIVITATEA (POPULAIA) I UNITATEA STATISTICDup cum am specificat n primul capitol (vezi subcapitolul 1.2.) statistica este preocupat de studierea fenomenelor de mas, a acelor ansambluri finite de elemente care sunt, n mod esenial, de aceeai natur calitativ, aparin aceluiai teritoriu i aceluiai timp, altfel spus, sunt statistic omogene. (Jaba & Grama, 2004) Aceste ansambluri sunt cunoscute sub denumirea de colectiviti, populaii, mulimi. COLECTIVITATEA STATISTIC (POPULAIA STATISTIC) reprezint totalitatea elementelor simple sau complexe supuse studiului statistic. n funcie de natura elementelor componente, colectivitile statistice pot fi formate din ansambluri de fiine, de obiecte sau de evenimente Exemple: - elevii unei coli, populaia unui ora, - numerele unui anumit ziar aprute ntr-o lun de zile, - accidentele rutiere comise pe raza unui jude, - opiniile electorale nregistrate ntr-un sondaj. Dup numrul elementelor componente, colectivitile statistice pot fi totale sau pariale. Primele cuprind totalitatea elementelor componente, n timp ce colectivitile pariale, cunoscute sub denumirea de EANTIOANE, cuprind un numr reprezentativ de uniti extrase dintr-o colectivitatea total. Din acest punct de vedere ntlnim cercetri exhaustive - n cazul populaiilor statistice totale - i cercetri selective ce folosesc proceduri de selecie a indivizilor ce vor inclui n eantion. UNITATEA STATISTIC (INDIVIDUL STATISTIC) reprezint elementele componente (constitutive) ale colectivitilor statistice. Ele pot fi fiine, lucruri, precum i fapte, evenimente referitoare la acestea. Dup gradul de complexitate se clasific n: - simple, formate dintr-un singur individ (exemple: elevul, angajatul); - complexe, acestea sunt rezultatul organizrii sociale i economice a colectivitii (exemple: familia, clasa de elevi, grupa de studeni). Dei, att termenul de individ ct i cel de populaie statistic ne duc cu gndul la natura uman a lucrurilor, exemplele de mai sus pot fi completate cu uniti statistice referitoare la lucruri (piesele unui lot supus controlului de calitate) sau la aciunea omului asupra lucrurilor (msurarea repetat a unui acelai obiect, aruncarea zarului).

2.2. VARIABILE STATISTICEVARIABILELE STATISTICE (CARACTERISTICILE STATISTICE) reprezint nsuirile ce definesc i delimiteaz unitile statistice. Ele exprim trsturile eseniale purtate de unitile statistice ale unei colectiviti, adic dimensiunile prin care se observ, se cuantific, se msoar i nregistreaz fiecare unitate din colectivitate. Populaiile umane, cele mai des ntlnite n studiile psihosociale, pot fi caracterizate, de exemplu, prin urmtoarele variabile: sex, vrst, nivel de colarizare, coeficient de inteligen, tip temperamental .a.

14

Valorile unei variabile statistice se mai numesc variante sau atribute ale variabilei i se obin prin aciuni concrete de cuantificare i msurare a unitilor unei colectiviti statistice. De exemplu, variabila mediul de provenien are ca variante: urban i rural; iar variabila notele la examenul de statistic are ca valori numerele ntregi de la 1 la 10. Caracteristicile statistice au proprietatea de a-i modifica nsuirile n timp i spaiu, de la o unitate la alta, n funcie de influenele exercitate de o multitudine de factori eseniali i ntmpltori care acioneaz la nivelul fiecrei uniti din colectivitate. Aceast proprietate d variabilelor statistice caracterul de variabil aleatorie. n practica de cercetare sunt luate n considerare numai acele variabile care prezint cel puin dou valori. Dac, dup o anumit caracteristic toate unitile ar fi identice, aceasta nu ar mai necesita nici un fel de analiz, nemaifiind nevoie s se investigheze cum se manifest indivizii statistici i care sunt cauzele acestei variaii. S presupunem c toi studenii ar obine nota 10 la disciplina statistic social; nu ar avea nici o relevan s verificm dac exist o legtur ntre aceste note i mediile acelorai studeni la examenul de bacalaureat! Aadar, cu ct o variabil mbrac forme mai diverse, cu att ea capt o valoare de cunoatere mai mare. Numai diversitatea formelor de manifestare a unei nsuiri i confer acesteia un interes din partea cercettorului. (Rotariu et.al., 1999) Dup modul de exprimare, variabilele statistice se clasific n: o variabile cantitative (sau numerice), exprimate prin numere stabilite prin numrare/msurare direct sau calcule ulterioare. Numrul stabilit este un numr cardinal ce red intensitatea cu care se manifest nsuirea respectiv n cazul individului respectiv. La rndul lor, variabilele cantitative se clasific dup natura variaiei n: - variabile discrete, cu variaie discontinu, care pot lua numai valori ntregi, de regul, pozitive. Exemple: numrul de membrii din gospodrie, numrul cuvintelor memorate la o prob de memorie. - variabile continue, cu variaie continu, care pot lua orice valoare ntr-un interval dat. Exemple: mediile colare anuale, venitul lunar. o variabile calitative (numite i variabile atributive, categoriale, nominale), sunt caracteristici ale cror variante de manifestare sunt exprimate atributiv, prin cuvinte. Exemple: sexul, mediul de provenien, tipul temperamental.

Atragem atenia c ntr-un studiu statistic sunt reinute numai acele caracteristici care prezint interes pentru cercetarea ntreprins. Pot fi zeci, chiar sute de variabile ce pot caracteriza indivizii unei populaii statistice. De mult ori ne limitm la a analiza doar cteva dintre ele. De asemenea, tot cercettorul este cel care stabilete, uneori, modul de exprimare i/sau natura variaiei unei variabile. O variabil cantitativ poate fi exprimat calitativ, dup cum i o variabil cantitativ continu poate fi transformat, prin rotunjire, ntr-o variabil discret. Exemplul clasic n susinerea observaiilor de mai

15

sus este cel al variabilei vrst: exprimat n ani-luni-zile reprezint o variabil cantitativ continu, exprimat n ani mplinii este o variabil cantitativ discret, iar atunci cnd folosim categoriile tnr-adult-vrstnic, avem o variabil calitativ. n fine, nu trebuie uitat faptul c de foarte multe ori variantele sau atributele variabilelor calitative sunt codificate cu ajutorul numerelor. Aceste coduri reprezint nite identificatori, acordarea lor fiind pur convenional, deci ele nu se supun operaiilor matematice sau prelucrrilor statistice bazate pe operaii matematice (Jaba & Grama, 2004). De exemplu, ntrebarea V place cursul de statistic social? poate fi codificat prin 0NU i 1DA sau Starea civil poate fi codificat prin 1-necstorit, 2-cstorit, 3-divorat, 4-vduv, 5-alte variante; n ambele exemple ar fi inutil calcularea mediei, a abaterii standard sau a oricrui alt indicator rezultat n urma unor calcule matematice.

2.3. CUANTIFICAREA I MSURAREA FENOMENELOR PSIHOSOCIALEDe foarte multe ori n sfer tiinelor sociale i comportamentale rezultatele obinute n urma unor demersuri empirice sunt exprimate calitativ. Partidul cu care a votat un alegtor, tipul temperamental al unui manager sau calificativul obinut de un elev de clasa I sunt exemple de exprimri calitative ale unor caracteristici. n toate aceste situaii vom putea utiliza aparatul statistic doar dac vom face apel la operaiile de cuantificare i msurare. Conform Dicionarului de Sociologie Zamfir & Vlsceanu (coord.), 1998, p.145, cuantificarea reprezint operaia teoretic de descriere cantitativ a fenomenelor i proceselor sociale n vederea msurrii i/sau evalurii acestora n acelai sens, Mrginean (1982) face distincie ntre cuantificare, desfurat cu preponderen la nivel teoretico-metodologic i msurare, operaie preponderent empiric, prin care se determin modalitatea de manifestare a fenomenului respectiv i prin care se atribuie valori numerice unor caracteristici i dimensiuni ale fenomenelor studiate. Sintetiznd o serie de consideraii referitoare la cele dou concepte, Luduan i Voiculescu (1997) consider cunantificarea ca o operaie complex, ce implic trecerea de la conceptele abstracte la dimensiuni i indicatori cantitativi, care, ulterior, prin aciuni concrete s fie nregistrai i, eventual, msurai. Cunatificarea, susin aceiai autori, este o operaie prin care pornindu-se de la analiza conceptelor tiinifice, pe de o parte i de la analiza naturii fenomenelor studiate, pe de alt parte sunt dezvluite i definite componentele, dimensiunile i expresiile cantitative ale domeniului cercetat, astfel nct s devin posibil colectarea, nregistrarea i exprimarea cantitativ a datelor i folosirea aparatului statistico-matematic de analiz a acestora (p.22). Mult mai contestat n tiinele sociale, termenul de msurare se refer la operaia de atribuire de valori (sub form de cifre sau simboluri) unitilor statistice ale unei colectiviti observate, pe baza unui set de reguli de atribuire a valorilor. Utilizarea acestor reguli este posibil numai prin intermediul instrumentelor de msur: termometru sau rigla, n cazul msurrii temperaturii sau lungimii; testul sau chestionarul, n cazul msurrii unor variabile psihologice sau sociologice. Odat

16

instrumentele construite, procesul de msurare const n citirea pe scalele acestor instrumente a unor valori reprezentnd numrul de uniti fundamentale de msur. (Clocotici & Stan, 2001) Scalele (nivelurile) de msur nu sunt altceva dect regulile prin care sunt atribuite valori unitilor statistice. Cunoaterea proprietilor nivelurilor de msur, susine Mrginean (1982, p.70), prezint importan deoarece s-a dovedit c o serie determinat de date permite, n mod legitim, s se adopte un anumit nivel de msur sau tip de scal i nu altul. Practica statistic, innd cont de natura variabilelor i, mai ales, de modul lor de exprimare (vezi cap. 2.2.), opereaz cu patru tipuri fundamentale de scale (niveluri de msurare): scala nominal, scala, ordinal, scala de interval i scala de raport. Fiecare dintre aceste scale se remarc prin procedee specifice de exprimare numeric, ceea ce determin utilizarea anumitor operaii de analiz i prelucrare a datelor, foarte puine pentru nivelul nominal i extrem de multe pentru cel de raport. ncheiem prin a remarca unele proprieti pe care trebuie s le ndeplineasc o scal de msur: - s fie consistent, - s fie corect, - s fie exhaustiv i - s fie mutual exclusiv. Scala are consisten intern dac produce rezultate (aproape) identice, atunci cnd este folosit n mod repetat pentru acelai obiect sau fenomen; este corect dac produce informaia pe care o ateptm de la ea; are proprietatea de a fi exhaustiv atunci cnd poate msura toate entitile crora le este destinat; i este mutual exclusiv atunci cnd, n urma msurrii, fiecare entitate primete o singur valoare (Clocotici & Stan, 2001).

2.4. SCALE DE MSURScala nominal. Este cel mai simplu tip de scal i presupune doar diferenierea calitativ a obiectelor i fenomenelor msurate. Aplicarea unei scale nominale la o colectivitate statistic nseamn, n esen, o clasificarea a indivizilor dup o caracteristic sau un atribut. Prin intermediul acestei scale se exprim apartenena unitilor statistice investigate la o categorie. Din aceste considerente, ntlnim acest tip de scal i cu denumirile de scal calitativ, categorial sau de clasificare. Condiia fundamental ce se cere unei scale nominale este, de fapt, cerina elementar impus oricrei clasificri: dat fiind mulimea claselor scalei i mulimea indivizilor, fiecare individ s se gseasc n una i numai una dintre clase (Rotariu et.al., 1999). Un exemplu clasic de variabil nominal utilizat n cercetrile psiho-sociale este caracteristica gen, ale crei variante (categorii, atribute) sunt: masculin i feminin. Chiar dac, n activitatea concret de nregistrare a datelor, celor dou categorii le sunt atribuite codurile 1 i 2 (la fel de bine putem codifica aceeai variabil prin m i f), aceste numere sunt doar nite simboluri, ntre ele existnd un

17

raport de echivalen i nu unul de ordine. Nu putem afirma c 2 este mai mult dect 1, ci doar c este diferit de acesta! Alte scala nominale utilizate n psihologie i sociologie sunt: - tipurilor temperamentale stabilite de Jung i Eycenck: introvertit, extravertit, ambivert; - starea civil: necstorit, cstorit, vduv, ; opiunea politic: partidul A, partidul B, Scala ordinal. Ca i cea nominal, scala ordinal se folosete pentru exprimarea strilor unor variabile calitative. n plus, acest tip de scal vine cu cerina ca ntre categoriile (clasele) scalei s existe o relaie de ordine. Aceste scalele sunt cunoscute i sub numele de scale de ordine, scale de rang sau scale ierarhice. O scal ordinal permite ordonarea observaiilor, persoanelor, situaiilor de la mic la mare, de la simplu la complex etc., permind astfel realizarea unor ierarhi (ranguri). n cazul scalelor ordinale putem stabili ierarhia celor n variante ale variabilei, ns nu putem preciza valoare diferenei dintre dou variante. Cel mai frecvent folosim acest tip de scal n studiul atitudinilor. Rspunsurile la o ntrebare de genul Ct de mulumit suntei de relaiile din colectivul din care facei parte? pot fi cuantificate printr-o scal ordinal, ale crei clase sunt: mulumit, i mulumit i nemulumit, nemulumit. Un alt exemplu de scal ordinal este ierarhia nevoilor umane n concepia psihologului american A. Maslow. Scala stabilit de el cuprinde urmtoarele categorii, ordonate de la simplu la complex: nevoi fiziologice; nevoi de securitate; nevoi sociale, de apartenen la grup; nevoia de stim, de a fi apreciat de ceilali; nevoia de autorealizare (Clocotici & Stan, 2001). Clasele pot fi i aici codificate prin cuvinte care s exprime semnificaia lor sau prin simboluri. Dac n cazul scalelor nominale simbolurile puteau fi atribuite oricum, de data aceasta ele trebuie s evidenieze ordinea claselor. Cel mai frecvent i simplu mod de a evidenia ordinea este folosire numerelor naturale: 1, 2, 3 . Atragem atenia c aceste simboluri numerice reprezint numere ordinale i nu cardinale, n consecin, operaiile aritmetice (adunarea, scdere, nmulirea i mprirea) nu pot fi utilizate nici de aceast dat (Rotariu et.al., 1999). Scala de intervale. mpreun cu scalele de rapoarte, sunt utilizate pentru msurarea variabilelor cantitative i presupune atribuirea de valori numerice unitilor colectivitii. Din acest motiv ele se mai numesc scri metrice sau numerice. Pe lng cele dou proprieti impuse de nivelurile anterioare de msurare, i anume: - fiecare individ s se gseasc n una i numai una dintre clase, - ntre categoriile (clasele) scalei s existe o relaie de ordine, scalele metrice adaug o a treia: - are sens luarea n considerare a distanelor dintre categoriile scalei. Aceast proprietate face ca datele experimentale obinute pe o scal metric s suporte aproape toate prelucrrile statistice posibile. Caracteristic pentru scala de interval este faptul c utilizeaz o valoare 0 convenional. Astfel, msurarea cu acest tip de scal este independent de originea aleas i de unitatea de msur folosit, putndu-se trece de la un sistem de msurare la altul.

18

Exemplul clasic l reprezint msurarea temperaturii n sistemul Celsius i n sistemul Fahreinheit. Trecnd de la un sistem de msurare la altul, deci schimbnd zeroul convenional i valorile temperaturii, raportul dintre dou modificri de temperatur rmne acelai (Jaba & Grama, 2004). Un alt exemplu de astfel de scal l reprezint scalele pentru msurarea inteligenei. Referindu-se la proprietile scalelor de interval, M. Popa (2004) atrage atenia asupra faptului c valorile obinute prin msurri de acest tip nu ne permit evaluri de genul: O temperatur de 10 grade este de dou ori mai mare dect una de 5 grade sau, O persoan care a obinut un scor de 30 de puncte este de dou ori mai inteligent dect una care a obinut 15 puncte. Aceasta, deoarece nici temperaturile msurate pe scala Celsius i nici inteligena nu au o valoare 0 absolut (dac acceptm c nici un om viu nu are inteligen nul). De asemenea, trebuie remarcat faptul c cele mai multe dintre variabilele psihologice sunt expresia unor evaluri subiective, aspect ce face greu de demonstrat egalitatea intervalelor dintre dou valori consecutive. Uneori, chiar i n cazul unor msurtori extrem de exacte este dificil de asumat acest lucru. De exemplu, dac msurm iubirea la un eantion de cupluri care se plimb, prin durata inerii de mn, nu putem fi siguri c diferena de iubire dintre cei care se in de mn 10 minute i cei care se in de mn 20 de minute este aceeai ca n cazul diferenei dintre 20 i 30 de minute. Cu toate acestea, multe dintre msurtorile studiilor psihologice sunt asimilate scalei de tip interval. (Popa, 2004) Scala de rapoarte sau scala de proporii (sau scala de interval cu origine raional). Face parte din categoria scalelor metrice, fiind folosit tot pentru exprimarea variabilele cantitative. Aceast scal de msur posed ca note distinctive existena unei origini naturale (a unui 0 absolut; altfel spus, nu exist nici o valoare mai mic dect valoarea 0) i precizarea clar a semnificaiei unitii de msur, ceea ce face posibil compararea raporturilor dintre gradaiile scalei. Scala de rapoarte se folosete pentru msurarea valorilor unor variabile precum venitul, nlimea, timpul de reacie .a. Dup uni autori (Kinnear i Gray, 2000, cf. Sava, 2004a) i dup cum reiese i din utilizarea programului SPSS, n care exist doar trei niveluri de msurare, tendina actual este de a renuna la diferenierea ntre ultimele dou tipuri de scale. Aceasta pentru c majoritatea procedurilor statistice utilizate n cazul scalelor de intervale sunt valabile i pentru scalele de rapoarte. Termenul generic sub care se reunesc cele dou tipuri de scale este cel de scal numeric sau metric.

2.5. DEFINIREA VARIABILELOR STATISTICE CU AJUTORUL SPSSPentru crearea unei baze de date se ncepe prin definirea variabilelor. Dup apariia ferestrei de ntmpinare din editorul de date SPSS se deschide fereastra de gestionare a variabilelor unde, pentru fiecare variabil, sunt specificate urmtoarele caracteristici:

19

Name numele variabilei (de exemplu: sex). Type tipul variabilei, poate fi numeric, dat calendaristic, string .a. (n exemplul nostru: numeric). Width numrul de caractere al variabilei (ex.: 1). Decimals pentru variabilele numerice trebuie specificat numrul de caractere dup virgul al variabilei (ex.: 0). Label comentariu (eticheta) ce nsoete variabila (ex.: sexul subiectului). Values valorile pe care le poate lua variabila i comentariile/etichetele ataate acestora (ex.: 1 = masculin; 2 = feminin). Missing specificarea cazurilor omise (ex.: None). Columns numrul de spaii alocat n editorul de date acestei variabile (ex.: 8). Align alinierea acestei variabile n editorul de date, poate fi aliniere la stnga, la dreapta sau centrat (ex.: Center). Measure Nivelul de msurare al variabilei (tipul scalei), poate fi numeric (scale), ordinal i nominal (ex.: Nominal).

20

3. ORDONAREA, GRUPAREA I PREZENTAREA DATELOR STATISTICE3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7. Serii (distribuii) statistice Gruparea (sistematizarea) datelor Prezentarea datelor sub form de tabele Reprezentarea grafic a datelor statistice Utilizarea SPSS pentru ordonarea i gruparea datelor statistice Utilizarea SPSS pentru prezentarea datelor statistice sub form de tabele Utilizarea SPSS pentru reprezentarea grafic a datelor statistice

3.1. SERII (DISTRIBUII) STATISTICEn cazul unui numr foarte mare de date este imposibil (i inutil) analiza fiecrei valori n parte. n aceast situaie, naintea prelucrrii i analizei datelor se procedeaz la ordonarea, gruparea i organizarea lor. Rezultatul ordonrii i gruprii datelor statistice l constituie seriile (distribuiile) statistice de frecvene. Acestea sunt formate din dou iruri paralele de date din care unul reprezint variantele/valorile variabilei (sau grupele de variante) iar cellalt numrul de uniti statistice corespunztoare fiecrei valori sau variante (frecvenele absolute sau relative). Fiecare frecven asociat valorii/variantei respective a caracteristicii studiate reprezint un termen al seriei statistice. variantele/valorile variabilei (sau grupele de variante) Exemplu: x (vrsta) f termen al seriei statistice 20 ani 14 30 ani 36 40 ani 47 50 ani 21

frecvenele absolute

n funcie de modul de prezentare al variantelor, seriile statistice, se mpart n: serii simple obinute prin simpla niruire a valorilor individuale. Acestea sunt ulterior supuse operaiilor de ordonare i grupare (dac numrul lor este suficient de mare), obinndu-se astfel unul din urmtoarele dou tipuri de serii.

serii de (pe) variante cnd fiecrei variante i revine un anumit numr de uniti. serii de (pe) intervale cnd fiecrui interval, mrginit de o limit inferioar i de una superioar, i revine un anumit numr de uniti. Ultimele dou tipuri se mai numesc i serii (repartiii) de frecvene i formeaz ceea ce numim o DISTRIBUIE STATISTIC. n funcie de natura i modul de manifestare ale variabilei studiate distingem dou tipuri principale de serii statistice: serii statistice cantitative sau calitative. La acestea putem aduga alte dou tipuri de distribuii statistice, la care criteriul dup care se face diferenierea este spaiul sau timpul: serii statistice spaiale i cronologice. Aceste criterii nu numai c realizeaz o clasificare a seriilor statistice dar, vom vedea n capitolele urmtoare, determin limitele i specificul prelucrrilor statistice complexe. Atunci cnd variabilele sunt cantitative vom vorbi despre tehnici statistice parametrice; n cellalt caz, al caracteristicilor calitative, prelucrrile ce le vom efectua vor fi de tip non-parametric. n concluzie, seria statistic de frecvene este rezultatul operaiilor de ordonare i grupare. Prezentarea seriilor statistice se face sub forma niruirii, pe orizontal sau pe vertical, a unor perechi de numere sau expresii, n care primul element reprezint caracteristica (ce poate fi cantitativ sau calitativ, spaial sau cronologic), iar al doilea frecvena, ntotdeauna numeric, a variantelor sau grupelor de variante ce delimiteaz caracteristica respectiv. n rapoartele de cercetare aceste distribuii statistice, unele reflectnd mai multe caracteristici concomitent, sunt ilustrate cu ajutorul tabelelor i al graficelor. Reamintim urmtoarele notaii cu care operm n prezentarea i prelucrarea distribuiilor statistice: - variantele sau grupele (clasele) de variante, xi: x1, x2, xk, - frecvena variantei xi (numrul de apariii), i: 1, 2, k, - numrul total de variante (total frecvene) n: n = i i = 1, 2, k, n cazul seriilor statistice de intervale se presupune c toate valorile din interiorul fiecrei grupe (clase) se concentreaz n valoarea central a clasei, notat tot cu xi. Aceast valoare va nlocui n seria statistic intervalul respectiv i se calculeaz ca medie aritmetic a valorilor extreme ale intervalului:

xi =

x max + x min 2

(3.1)

Menionm faptul c o distribuie statistic poate reda pe lng frecvenele absolute ( sau a) i pe cele relative (r). Acestea sunt absolut necesare cnd se dorete compararea unor eantioane cu numrul total de variante (n) diferit (de exemplu: n cazul a dou clase cu numr total de elevi diferit). Mai mult, atunci cnd prelucrrile statistici ulterioare o impun, putem determina i alte frecvene: - frecvena (absolut sau relativ) cumulat cresctor, dat de suma frecvenelor valorilor care apar pn la valoarea xi respectiv, inclusiv; - frecvena (absolut sau relativ) cumulat descresctor, dat de suma frecvenelor valorilor care apar de la valoarea xi respectiv, inclusiv.

22

3.2. GRUPAREA (SISTEMATIZAREA) DATELORGruparea statistic reprezint o operaie de sistematizare a populaiei pe pri statistic omogene n funcie de variaia1 unei variabile (sau a mai multora). Importana acestei operaii iniiale deriv din erorile ce pot fi induse fie n cazul stabilirii unui numr foarte mare de grupe (clase) situaie n care se ajunge la frmiarea colectivitii , fie n situaia alegerii unui numr prea mic de grupe, cu intervale foarte mari n cadrul lor situaie n care nu vom surprinde tipurile calitative existente. n cazul variabilelor numerice (cantitative) putem realiza 1) grupri pe variante utilizate n cazul variabilelor de tip discret, cnd ele pot lua doar valori ntregi (exemple: numrul membrilor unei familii, notele colare). 2) grupri pe intervale utilizate n cazul variabilelor de tip continuu, cnd ele pot lua orice valoare ntr-un interval finit sau infinit (exemple: timpul de reacie, mediile colare anuale, nlimea). Menionm faptul c i variabilele de tip discret pot fi supuse gruprilor pe intervale (exemplu: note ntre 2 i 4; 57; 810 etc.). n ambele situaii mrimea intervalului (K) se obine cu ajutorul formulei lui H.A. Sturges:K= x max x min 1 + 3,322 lg n

(3.2)

unde, n reprezint numrul total de variante. n situaia n care numrul de grupe este ales de cercettor (bazndu-se pe experien i intuiie), mrimea intervalului (K) rezult astfel: - n cazul variabilelor de tip continuu, prin raportarea amplitudinii variaiei (A = xmax - xmin) la numrul de grupe:

K=-

x max x min nr. grupelor

(3.3)

n cazul variabilelor de tip discret, prin raportarea numrului valorilor diferite ale variabilei (Nx = xmax - xmin +1 = A + 1) la numrul de grupe:

K=

x max x min + 1 nr. grupelor

(3.4)

1

Variaia reprezint proprietatea unei variabile de a nregistra mai multe valori (n cazul variabilelor cantitative) sau mai multe forme de manifestare (n cazul variabilelor calitative) (Blezu, 2002).

23

O atenie deosebit trebuie acordat precizrii limitelor sau capetelor intervalelor. n cazul caracteristicilor discrete limitele intervalelor ies foarte bine n eviden, ele fiind diferite (exemplu: intervalele 24; 57; 810). Mai delicat este cazul caracteristicilor continui, cnd trebuie precizat care dintre intervale include limita sau, altfel spus, care capt al intervalului este deschis/nchis (exemplu: intervalele (24]; (46]; (68] etc. sunt deschise n partea stng). Pentru evitarea confuziilor se procedeaz din start la departajarea limitelor, astfel: 2,014; 4,016; 6,018 etc.

3.3. PREZENTAREA DATELOR SUB FORM DE TABELEPrezentarea datelor sub forma unui tabel statistic permite att o bun vizualizare ct i, mai ales, efectuarea diverselor calcule n procesul de prelucrare a datelor. n elaborarea unui tabel pot fi identificate urmtoarele elemente i reguli principale (Novak, 1995): - titlul tabelului - care trebuie s fie clar, scurt i s defineasc exact fenomenul pe care l reprezint i, dup caz, perioada la care se refer; - macheta tabelului - format din liniile orizontale (rnduri) i liniile verticale (coloane) din ntretierea crora apar rubricile (celulele, csuele) care conin datele numerice i/sau denumirile textuale; - subiectul tabelului - nscris de obicei la captul rndurilor, este constituit din unitile populaiei statistice (ex.: grupe de note, grupe de puncte etc); - predicatul tabelului - nscris de obicei la captul coloanelor, cuprinde ansamblul indicatorilor care se nregistreaz la nivelul unitilor populaiei statistice; - indicarea obligatorie a sursei de date, atunci cnd este cazul (de obicei sub tabel); - se recomand indicarea unitilor de msur n care se exprim datele (de obicei, ntre titlul i macheta tabelului); - se recomand numerotarea tabelelor - pentru identificarea mai uoar a acestora n textul de analiz. n funcie de scopul ntocmirii, de coninutul lor i de numrul caracteristicilor studiate tabelele pot fi de mai multe tipuri. Astfel: a) Tabele ale unor serii statistice Pot fi ntocmite att pentru seriile de variante ct i pentru cele de intervale. Diferena este dat de rndurile tabelului care vor constitui variantele seriei, n primul caz, sau clasele de variante (eventual valorile centrale), n cel de-al doilea caz. n ambele situaii pe coloane vor fi trecute frecvenele, absolute sau relative, cumulate sau descresctoare. (Exemplu: a se vedea tabelul 3.3) b) Tabele centralizatoare Sunt utilizate n toate situaiile n care un numr mare de date trebuie stocate i conservate n vederea prelucrrii lor ulterioare. n lucrrile tiinifice aceste tabele sunt, de obicei, prezentate sub form de anexe, i conin pe coloane totalitatea variabilelor studiate, iar pe rnduri, totalitatea unitilor statistice (colectivitatea statistic) investigate.

24

c) Tabele comparative Cuprind fie datele obinute pe eantioane diferite pentru aceeai caracteristic, fie datele aceluiai eantion pentru caracteristici diferite. d) Tabele cu dubl sau tripl intrare n acest caz, i coloanele i rndurile exprim variaiile uneia sau a dou caracteristicii (variabile). Fiecare celul exprim numrul de uniti statistice caracterizate prin variantele corespunztoare tuturor caracteristicilor de pe orizontal i vertical.

3.4. REPREZENTAREA GRAFIC A DATELOR STATISTICECu ajutorul reprezentrilor grafice sunt vizualizate informaiile statistice, facilitndu-se perceperea pe ansamblu a datelor, sesizarea unor aspecte privind variaia valorilor observate, repartiia lor, legturile existente ntre ele .a. Graficul trebuie s cuprind: titlul - care poate fi plasat fie sub, fie deasupra graficului i trebuie s precizeze limpede fenomenul pe care l reprezint; legenda utilizat pentru specificarea anumitor simboluri sau convenii utilizate; sistemul axelor rectangulare (dac este cazul) - n care linia orizontal (abscis) cuprinde valorile variabile x, iar cea vertical (ordonat) cuprinznd frecvenele f; se recomand numerotarea graficelor - pentru identificarea mai uoar a acestora.

Graficele cel mai des utilizate sunt graficele de tip bar, histogramele, poligoanele de frecvene, i curbele de distribuie, pe abscis notndu-se intervalele de variaie (sau variantele), iar pe ordonat frecvenele corespunztoare acestor intervale (sau variante). Aceste reprezentri grafice se obin prin unirea interseciilor perpendicularelor ridicate din punctele perechi de pe cele dou axe. n cazul seriilor de intervale perpendiculara pentru desemnarea valorii frecvenei se ridic din mijlocul intervalului, respectiv din punctul corespunztor valorii centrale a clasei. Graficele de tip bar2 le folosim cnd dorim s reprezentm fie variabile cantitative discrete, fie variabile categoriale (msurate prin scale nominale sau ordinale). Caracteristic acestui tip de grafic este faptul c barele verticale sunt delimitate de un spaiu, iar ordinea barelor poate fi schimbat. Histogramele i poligoanele de frecvene sunt reprezentrile grafice utilizabile n cazul seriilor statistice cantitative, ns numai atunci cnd variabilele sunt continue. De exemplu, situaia absolvenilor de liceu dup examenul de admitere la facultate (exprimat prin dou variante: admis, respins) va fi reprezentat printr-un grafic de tip bar (deoarece avem de-a face cu o variabil calitativ, msurat printr-o scal2

n englez: bar graph.

25

nominal), iar mediile la bacalaureat ale acelorai absolveni printr-o histogram sau printr-un poligon de frecvene (deoarece avem o variabil cantitativ continu sau, altfel spus, o variabil msurat printr-o scal numeric). Pentru a evidenia i/sau compara structurile se utilizeaz diagramele de structur, construite cu ajutorul suprafeelor (cercuri, ptrate, dreptunghiuri), diagramele de comparaie i reprezentrile prin figuri simbolice .a.. n multe cazuri, sunt studiate mai multe caracteristicii folosindu-se reprezentri grafice complexe precum: piramide ale vrstelor, grafice comparative, grafice combinate.

Grafic de tip bar (Bar Graph)120

Nr. absolveni

100 80 60 40 20 0 respins admis

101

29

Histogramafrecvente40 38

30

26 20 20 23

14 10 9

0 5,01 6,01 7,01 8,00 9,00 10,00

medii la examenul de bacalaureat

26

n ce privete diagramele sub forma figurilor geometrice (cerc, ptrat, dreptunghi) utilizate att pentru prezentarea structurilor ct i/sau pentru compararea n timp a evoluiei fenomenelor se procedeaz astfel (Novak, 1995): - se construiesc cele dou figuri n aa fel, nct raportul dintre raze (sau laturi) s fie proporional cu nivelurile fenomenului studiat n cele dou perioade diferite de timp (n dou localiti etc.); - n cadrul fiecrei figuri geometrice se reprezint structura corespunztoare anului (spaiului geografic) respectiv.Structura eantionului dup notele la examen2-4 14% 8 - 10 35%

2-4 5-7 8 - 10

5-7 51%

3.5. UTILIZAREA SPSS PENTRU ORDONAREA I GRUPAREA DATELOR STATISTICE

ORDONAREA DATELOR STATISTICE CU AJUTORUL SPSS Se parcurge, n bara de meniuri, traseul: Data Sort cases... Va fi afiat fereastr de dialog din figura 3.1. Dup ce selectm variabila dup care dorim s facem ordonarea (prin trecere ei din stnga n fereastra intitulat Sort by:) ne mai rmne s alegem sensul ordonrii: cresctor/ascendent sau descresctor/descendent. Se poate realiza sortarea datelor dup mai multe variabile; n acest caz, se va ine cont de ordinea variabilelor n fereastra Sort by:.

27

Figura 3.1. Fereastr de dialog pentru sortarea (ordonarea) datelor

3.6. UTILIZAREA

PENTRU PREZENTAREA STATISTICE SUB FORM DE TABELE

SPSS

DATELOR

Pentru calcularea frecvenelor absolute i/sau relative ale unei serii statistice simple sau de variante, precum i pentru redarea sub form tabelar a distribuiei de frecvene, se parcurge, n bara de meniuri, traseul: Analyze Descriptive Statistics Frequencies Vom fi ntmpinai de fereastra urmtoare, n care, n partea stng sunt afiate toate variabilele din baza de date (n ordine alfabetic sau n ordinea definirii lor).

Figura 3.4. Fereastra de ntmpinare (de dialog) pentru calculul frecvenelor

3.7. UTILIZAREA SPSS PENTRU REPREZENTAREA GRAFIC ADATELOR STATISTICE

28

Pentru a obine o reprezentare grafic aferent seriei statistice respective, revenim la fereastra de ntmpinare pentru calculul frecvenelor (figura 3.4) i apsm butonul Charts.

Figura 3.7. Fereastr de opiuni pentru reprezentarea grafic a datelor statistice Va aprea o nou fereastr n care, nainte de a apsa butonul Continue, vom opta pentru una din urmtoarele situaii (Chart Type): - None, cnd nu se dorete reprezentarea grafic a variabilei; - Bar charts, reprezentare (printr-un grafic de tip bar) folosit pentru serii statistice calitative sau pentru seriile de frecvene (de variante sau de intervale) n care variabila este discontinu; aici putem opta pentru afiarea valorilor pe grafic (Chart Value) sub forma frecvenelor absolute (Frequencies) sau a celor relative (Percentages); - Pie charts, reprezentare grafic sub forma diagramei de structur prin arce de cerc folosit pentru serii statistice calitative sau pentru seriile de frecvene (de variante sau de intervale) cu numr redus de variante; avem posibilitatea acelorai opiuni de mai sus; - Histograms, reprezentare grafic sub form de histogram folosit pentru serii statistice cantitative simple sau de variante, n care variabila este de tip continuu; aici se poate opta pentru trasarea curbei distribuiei normale prin activarea csuei With normal curve.

29

4. INDICATORI AI TENDINEI CENTRALE4.1. 4.2. 4.3. 4.4. 4.5. 4.6. Mediile Quantilele: mediana, quartilele, decilele i centilele Modul Relaia dintre indicatorii tendinei centrale Reprezentri de tip Boxplots Utilizarea SPSS pentru calcularea i reprezentarea indicatorilor de poziie

n cele mai multe investigaii psihosociale sau educaionale prezentarea rezultatelor sub form tabelar sau prin reprezentri grafice nu este suficient. Prin intermediul unor indicatori statistici putem realiza o prelucrare mult mai riguroas a datelor, putem cunoate mult mai temeinic fenomenele studiate. Termenul de indicator se refer la acele valori ataate variabilelor statistice cantitative prin intermediul crora se ncearc exprimarea, de o manier sintetic a informaiei coninut n distribuia de frecvene respectiv (Rotariu et. al., 1999, p. 42). n funcie de natura informaiei oferit de indicatorii statisticii, acetia se clasific n trei mari categorii: - indicatori ai tendinei centrale (de poziie sau de nivel), - indicatori ai variaiei (de dispersie sau de mprtiere), - indicatori ai formei distribuiei. Pentru a determina modul n care datele statistice tind s graviteze n jurul unor valori centrale se folosesc indicatorii tendinelor centrale. Dintre acetia vom prezenta: media, quantilele (mediana, quartilele, decilele i centilele) i modul.

4.1. MEDIILEMrimile medii exprim ceea ce este comun i general n forma de manifestare a fenomenelor studiate. Pentru a ne fi de folos, ns, calculul mrimilor medii trebuie s ndeplineasc anumite condiii: - s se bazeze pe un numr suficient de mare de cazuri individuale; - valorile individuale ale caracteristicii s nu difere prea mult de la o unitate statistic la alta, adic s avem o colectivitate omogen;

-

mrimea medie aleas pentru calcul s corespund cel mai bine formei de variaie a caracteristicii studiate i s valorifice cel mai bine materialul cifric de care dispunem (Novak, 1995).

MEDIA ARITMETIC Media aritmetic (m, x sau 1), reprezint, n cazul datelor negrupate (serii simple), raportul dintre suma valorilor variabilei respective i numrul lor.m= x i n(4.1)

Dac datele sunt grupate (distribuii de frecvene), media - numit uneori medie aritmetic ponderat2 - va fi:

m=

x i f i f i

(4.2)

n cazul gruprii valorilor pe intervale, n formula de mai sus xi reprezint valoarea central a intervalului.

Proprietile mediei aritmetice: dac la toate valorile seriei statistice se adaug (scade) o constant c, atunci media se mrete (scade) cu acea valoare: dac y i = x i + c , atunci m x = m y + c dac toate valorile seriei statistice se nmulesc (divid) cu o constant c, atunci i media se va multiplica (divide) cu aceeai valoare c: dac y i = c xi , atunci

my = c mx suma abaterilor valorilor de la medie este ntotdeauna nul:

xi m = 0

suma ptratelor abaterilor de la medie va fi ntotdeauna mai mic dect suma ptratelor abaterilor de la oricare alt punct al distribuiei.

4.2. QUANTILE3O alt categorie de indicatori ai tendinelor centrale o reprezint quantilele. Acestea sunt indicatori de poziie i au rolul de a mprii seria de date ntr-un anumit numr de pri. Dintre quantilele cele mai des calculate amintim:

m i x (x barat) se folosesc atunci cnd ne referim la media unui eantion (situaia cea mai frecvent), iar (miu) atunci cnd calculm media ntregii populaii de referin. 2 Pentru a nelege corect sensul termenului de medie ponderat recomandm urmtoarea referin bibliografic: Rotariu et. al., 1999, pp. 43-44. 3 n limba englez, se numesc percentiles.1

32

Mediana (M sau Me), este valoarea care mparte seria ordonat de date n dou pri egale. Jumtate din valori (50%) se gsesc n partea stng a medianei iar cealalt jumtate n partea dreapt. Pentru calculul medianei este absolut necesar ordonarea seriei statistice, fie cresctor, fie descresctor (aspect fr importan n cazul calculului valorilor medii!). Pentru a afla al ctelea element al unei serii cu numr impar de termeni este mediana se calculeaz cota medianei dup formula; Cota M = (n+1)/2 (4.7) De exemplu, presupunnd c notele, ordonate cresctor, obinute de un lot de nou subieci sunt: 4 5 6 7 7 8 8 8 9 cota medianei va fi (9+1)/2 = 5, astfel nct mediana va corespunde celui de-al cincilea termen din serie, adic 7. Se observ c i n stnga i n dreapta acestei valori se afl un numr egal de termeni. Pentru seriile formate dintr-un numr par de valori formula (4.7) rmne valabil, numai c rezultatul nu va mai fi ntotdeauna un numr ntreg. Vom vorbi de doi termeni centrali, poziia medianei fiind ntre termenul n/2 i (n/2)+1. n acest caz, mediana se calculeaz fcnd media celor dou valori, putnd s coincid (dac valorile corespunztoare termenilor n/2 i (n/2)+1 sunt egale), sau nu (n caz contrar), cu una din valorile seriei. Dac n exemplu anterior mai apare un subiect cu nota 9 vom avea o serie cu zece termeni: 4 5 6 7 7 8 8 8 9 9 mediana va fi dat de media valorilor corespunztoare termenilor cinci i ase, adic 7,5. Lucrurile devin mult mai complicate dac ne referim la distribuii de frecvene4. Quartilele (Q) reprezint alte tipuri de quantile, ele mprind seria de date n patru pri egale, astfel: quartila 1 (Q1) mparte valorile n 25% (un sfert) i, respectiv, 75% (trei sferturi); quartila 2 (Q2 = M) mparte seria de date n dou jumti egale, ea fiind, de fapt, mediana; quartila 3 (Q3) mparte seria ordonat n 75% i, respectiv, 25%.4

Pentru unii indicatori ai tendinei centrale formulele de calcul sunt mai complexe atunci cnd datele sunt grupate. Tratatele de statistic aplicat prezint n amnunt toate aceste formule.

33

Analog, se definesc i celelalte quantile: decilele (mpart o serie ordonat n zece pri egale) i centilele (mpart o serie ordonat ntr-o sut de pri egale).

4.3. MODUL (VALOAREA MODAL)Modul sau valoarea modal (Mo), reprezint valoarea caracteristicii care prezint frecvena cea mai mare, care apare de cele mai multe ori n seria de date. De exemplu, n cazul unei serii simple de date de forma: 4 5 5 6 7 7 8 8 8 9 modul va fi 8, aceast valoare aprnd de cele mai multe ori n cadrul seriei. Pentru o serie de variante, modul este egal cu varianta care are cea mai mare frecven, iar pentru o serie de intervale, fie se calculeaz media intervalului cu cea mai mare frecven, fie rmnem doar la noiunea de interval modal. De cele mai multe ori seriile statistice au un singur mod, situaie n care spunem c avem o distribuie unimodal. Dac ntlnim dou sau mai multe valori modale vom avea distribuii bi- sau multimodale (vezi capitolul 6.3.).

4.4. RELAIA DINTRE MEDIE, MEDIAN I MODULn funcie de aspectul (grafic) al unei serii statistice cele trei valori medii pot s coincid, sau nu. n prima situaie vom vorbi de o distribuie normal (gaussian) sau vom afirma c populaia din eantionul studiat este distribuit normal, este omogen n raport cu variabil respectiv (vezi capitolul 6.3.). n cellalt caz, nu toi cei trei indicatori sunt reprezentativi; va trebui s inem seama de modul de exprimare al variabilei, motiv pentru care se impun urmtoarele precizri: - media este recomandat n cazul variabilelor numerice care ndeplinesc condiiile parametrice (distribuie normal, omogenitate .a.); - mediana se recomand pentru cazurile n care nu sunt ndeplinite condiiile parametrice (distribuii asimetrice, eterogenitate crescut etc) i n cazul variabilelor de tip ordinal - modul este utilizat mai rar pentru date numerice, fiind ns foarte util n cazul variabilelor de tip categorial (date calitative, nominale), deoarece nu putem calcula ceilali parametrii centrali (Sava, 2004b). ntre aceste trei caracteristici medii de baz exist o relaie aproximativ, stabilit de G.U. Yule i M.G. Kendall, valabil pentru distribuii moderat asimetrice: M o = M e 3(m M e ) (4.8)

34

4.5. REPREZENTRI TIP BOXPLOTO modalitate specific de a reprezenta tendina cazurilor unei serii statistice de a se grupa n jurul unor valori centrale o reprezint diagramele de tip Boxplot. Acestea marcheaz printr-un dreptunghi (o cutie) cele trei quartile Q1, Q2, i Q3 ale oricrei serii statistice i prin dou linii distincte cea mai mic, respectiv cea mai mare valoare a seriei. Din acest motiv, despre aceast reprezentare se mai spune c reprezint o rezumare prin cinci valori. ntre cele dou quartile Q1 i Q3 (n interiorul dreptunghiului) se regsesc 50% din cazuri. Mai mult, sunt reprezentate, atunci cnd este cazul, valorile extreme5 (mai mici/mari de 1.5, respectiv 3 lungimi de cutie6 simbolizate prin cerc, respectiv asterisc).508

Outlier (al 8-lea subiect are vrstamai mare dect 3 lungimi de cutie)

4021

Outlier (al 21-lea subiect are vrstamai mare dect 1,5 lungimi de cutie)

30

Q3 (quartila superioar) Q2 = Me (mediana)

20

Q1 (quartila inferioar)

10N= 32

varsta subiectilor

Figura 4.1. Reprezentare grafic de tip Boxplot a variabilei Vrsta subiecilor

5 6

n englez, outliers. Lungimea (nlimea) cutiei reprezint abaterea interquartil: I = Q3 Q1 - vezi cap. 5.1.

35

4.6. UTILIZAREA SPSS PENTRU CALCULAREA I REPREZENTAREAGRAFIC A INDICATORILOR DE POZIIE Cu ajutorul programului SPSS valorile tendinei centrale se obin cu mare uurin, existnd mai multe posibiliti. Una dintre posibiliti este amintit n capitolul anterior, presupunnd traseul:

Analyze Descriptive Statistics Frequencies Dup ce, n fereastra de dialog pentru calculul frecvenelor (vezi figura 3.4.), selectm variabila sau variabilele dorite, apsm butonul Statistics i vom ptrunde ntr-o nou fereastr de opiuni (figura 4.2).

Figura 4.2. Fereastr de opiuni pentru calculul unor indicatori statistici

La rubrica Percentile Values putem opta pentru calculul quartilelor sau a oricror altor quantile (Percentiles) care s mpart seria n intervale egale (equal groups), sau inegale. La rubrica Central Tendency se opteaz pentru calcularea mediei aritmetice (Mean), medianei (Median), Modului (Mode) sau sumei valorilor (Sum).

36

5. INDICATORI AI VARIAIEI I INDICATORI AI FORMEI5.1. Indicatori simpli (elementari) ai variaiei 5.2. Indicatori sintetici ai variaiei 5.3. Indicatori ai formei distribuiei 5.4. Utilizarea SPSS pentru calcularea indicatorilor variaiei i ai formei Utilizarea mediei pentru caracterizarea a ceea ce este comun i tipic n colectivitile statistice trebuie s fie nsoit de verificarea reprezentativitii acesteia pentru ntreaga serie de valori individuale. Vom analiza cu ajutorul unei alte categorii de indicatori, numii indicatori ai variaiei (de dispersie sau de mprtiere), msura n care valorile individuale variaz n jurul mediei sau, altfel spus, gradul de mprtiere (de dispersie) a indivizilor n cadrul seriei de valori pe care acetia le iau. Putem avea serii statistice cu aceeai medie, ns cu o distribuie a valorilor diferit, adic eantioane diferite din punct de vedere al variabilitii i omogenitii (vezi figura 5.1.). La rndul lor, indicatorii variaiei se mpart n indicatori simpli i indicatori sintetici.

m=100; s = 5

m=100; s = 15

55

70

85

100

115

130

145

Figura 5.1. Distribuii statistice cu aceleai valori centrale, dar cu grade diferite de variabilitate

5.1. INDICATORI SIMPLI (ELEMENTARI) AI VARIAIEISe obin prin compararea a doi termeni din serie sau prin compararea oricrui termen al seriei cu o valoare fix din cadrul seriei. Indicatorii simpli sunt amplitudinea, abaterea interquartil i abaterile individuale. Toi indicatori pot fi exprimai n mrimi absolute (adic n unitatea de msur a caracteristicii analizate) sau n mrimi relative, calculate n raport cu media sau mediana.AMPLITUDINEA Amplitudinea (A),1 se obine prin diferena dintre valoarea cea mai mare i cea mai mic a caracteristicii respective. Amplitudinea absolut:

A = x max x minAr = x max x min m

(5.1)

Amplitudinea relativ:

(5.1)

Acest indicator este cel mai simplu de calculat dar i cel mai dezavantajos, deoarece ine seama doar de dou valori, cele extreme, fr a oferii informaii despre termenii din interiorul seriei. Iat dou serii statistice (de exemplu: notele obinute de elevi unei clase la dou discipline diferite) care au aceeai amplitudine: prima serie: a doua serie: 2 3 4 4 4 5 5 6 6 6 6 7 7 8 8 8 9 9 10 2 5 5 5 5 5 6 6 6 6 6 6 6 6 7 7 7 7 10

n ambele cazuri amplitudinea va fi 8 (A = xmax xmin = 10 2 = 8), ns prima serie prezint o variaie real a notelor, pe cnd n cea de-a doua valorile extreme pot fi considerate excepii (atipice), nivelul redus al variaie nefiind reflectat deloc n valoarea amplitudinii. Din aceste motive, utilizarea amplitudinii n vederea caracterizrii omogenitii/eterogenitii unei serii statistice trebuie fcut cu rezerve, doar atunci cnd valorile extreme nu se abat foarte mult de la ceilali termeni ai seriei.ABATEREA INTERQUARTIL Abaterea interquartil (I) sau abaterea quartil, se obine prin diferena dintre quartila cea mai mare i cea mai mic a caracteristicii respective2. Dup cum am aflat n capitolul anterior, quartilele sunt n numr de trei (notate Q1, Q2, Q3); ele mpart seria statistic n patru pri egale (vezi cap. 4.2.). Reamintim c Q2 este de fapt mediana seriei.

1 2

n englez: Range. Similar pot fi definite abaterile interdecile sau intercentile.

38

Abaterea interquartil absolut:

I = Q3 Q1Ir = Q3 Q1 Q2

(5.2)

Abaterea interquartil relativ:

(5.2)

Prin utilizarea acestui indicator sunt eliminate valorile extreme, mai precis, valorile situate n primul sfert (ntre xmin i Q1) i ultimul sfert (ntre Q3 i xmax) al seriei, reducndu-se astfel influena acestora. Abaterea interquartil este preferat n locul amplitudinii atunci cnd valorile extreme din cadrul seriei sunt atipice, adic se abat prea mult de la ceilali termeni ai seriei. Acest indicator este reprezentat grafic cu ajutorul diagramelor de tip Boxplot (vezi capitolul 4.5.). Relund exemplul de mai sus, pentru a doua serie statistic abaterea interquartil este I = Q3 Q1 = 7 5 = 2, ceea ce reflect mult mai bine lipsa de variaie a valorilor seriei. 2 5 5 5 5 5 6 6 6 6 6 6 6 6 7 7 7 7 10 Q1 Q2 = Me Q3 xmax xmin Cu toate acestea, nici n acest caz nu avem informaii despre ce se ntmpl ntre cele dou quartile extreme, mai mult, apare dezavantajul eliminrii a jumtate din termenii seriei (din acest motiv, uneori calculm abaterea interdecil, care elimin o cincime dintre valori, sau chiar abaterea intercentil, aceasta eliminnd doar a cincizecia parte dintre valori). Toate aceste dezavantaje induse de amplitudine i de abaterea interquartil pot fi eliminate dac se calculeaz abaterile (diferenele) nu doar dintre dou valori, ci ntre toate valorile seriei respective. Se obine astfel un indicator cunoscut sub numele de indicele lui Gini3, mai puin folosit de ctre psihologi, sociologi sau pedagogi. Mai cunoscute sunt acele abateri calculate pentru toate valorile caracteristicii prin raportare la o valoare fix, de obicei media sau mediana.ABATERILE INDIVIDUALE Abaterile (deviaiile) individuale (di), mai precis abaterile individuale de la medie4, se obin prin diferena dintre fiecare valoare i media aritmetic a caracteristicii respective. La fel pot fi calculate abaterile individuale de la median sau de la oricare alt valoare din cadrul seriei. Conform proprietilor mediei (vezi capitolul 4.1.) suma acestor abateri individuale este ntotdeauna egal cu zero.3

4

Indicele lui Gini (dup numele statisticianului italian Corado Gini) este definit ca: media aritmetic a diferenelor dintre toate perechile de valorii, diferene luate n valoare absolut/n modul (pentru formule vezi T. Rotariu et. al., 1999, p. 52). n practica statistic cele mai dese abateri individuale sunt calculate n raport cu media aritmetic, din acest motiv de cele mai multe ori, pentru a simplifica, vom folosi termenul de abatere individual n locul celui de abatere individual de la medie.

39

Abaterile individuale absolute: Abaterile individuale relative:

d i = xi md ir = xi m m

(5.3) (5.3)

Abaterile individuale ne ofer informaii doar despre poziia unuia sau altuia dintre subieci n raport cu media seriei, fr ns a surprinde n mod sintetic gradul de variaie al caracteristicii. Pentru aceasta trebuie considerate toate abaterile individuale ale valorilor caracteristicii de la media lor, lucru posibil de realizat doar cu ajutorul indicatorilor sintetici ai variaiei.

5.2. INDICATORI SINTETICI AI VARIAIEIAceti indicatori au la baz calcularea valorii medii a tuturor abaterilor individuale ale variantelor de la media lor (se poate lua ca reper i mediana seriei sau oricare alt valoare a seriei!). Se realizeaz astfel o sintetizare a variaiei unei caracteristici printr-o singur expresie numeric. Indicatorii sintetici sunt abaterea medie liniar, dispersia, abaterea medie ptratic i coeficientul de variaie. Vom prezenta formulele pentru seriile simple i pentru seriile (distribuiile) de frecvene.ABATEREA MEDIE LINIAR Abaterea (deviaia) medie liniar (d) sau pur i simplu abaterea medie,5 se calculeaz ca o media aritmetic a tuturor abaterilor individuale, luate n valoare absolut (fr a lua n considerare semnul sau +). Abaterea medie n cazul seriilor simple:d=

xi mn

(5.4)

Abaterea medie n cazul seriilor de frecvene:

d=

xi m f i fi

(5.4)

Prin luarea n considerare a valorilor absolute se elimin, de fapt, acel inconvenient generat de proprietatea mediei aritmetice prin care suma abaterilor individuale este ntotdeauna egal cu zero, adic x i m = 0 . Abaterea medie ne arat cu ct se abate n medie fiecare valoare de la nivelul mediu i se exprim n unitatea de msur a caracteristicii studiate. Dezavantajul acestui indicator const n faptul c el acord aceeai importan tuturor abaterilor5

i de data aceasta, pentru simplificare, atunci cnd folosim termenul de abatere medie ne referim la abaterea medie de la medie. Se poate calcula abaterea medie de la median sau de la oricare alt valoare a seriei.

40

individuale, fr s in seama de abaterile individuale mai mari care, n valoare absolut, influeneaz n mai mare msur gradul de variaie.DISPERSIA Dispersia (s2 sau 2)6 sau variana,7 se calculeaz ca o medie aritmetic a ptratelor abaterilor individuale ale tuturor valorilor fa de media lor. Dispersia n cazul seriilor simple:

s

2

(x = (x =

i

m)

2

ni

(5.5)2

Dispersia n cazul seriilor de frecvene:

s

2

f

m) f ii

(5.5)

Estimarea dispersiei unei populaii, calculat pe baza unui eantion 8:

s2 =

(x i m )2n 1

(5.6)(5.6)

s2 =

( x i m )2 f i ( f i ) 1

Sunt autori care susin c termenul de dispersie ar trebui evitat deoarece el este unul generic, fiind utilizat pentru toi indicatorii din categoria celor care reflect mprtierea valorilor (Rotariu et.al., 1999, p. 42). Pe de alt parte, variana reprezint indicatorul sintetic de baz al dispersiei (Luduan et.al., 1997, p. 277) sau indicatorul statistic cel mai utilizat pentru aprecierea mprtierii datelor (Clocotici & Stan, 2000, p. 68). Dincolo de aceste opinii divergente, suntem de prere c el nu trebuie neglijat, oferindu-ne date despre gradul de omogenitate/eterogenitate al caracteristicii vizate; utilitatea lui o vom vedea la calculul urmtorului indicator i n capitolele de statistic inferenial.

6

Se folosete s2 cnd facem referire la un eantion i 2 (sigma la ptrat) cnd calculm abaterea standard pentru ntreaga populaie. Aceeai semnificaie o au i notaiile pentru abaterea standard: s i . 7 n englez: variance. 8 Programele statistice pentru prelucrarea informatizat a datelor (SPSS, Excel etc.) folosesc pentru calculul dispersie i abaterii standard formule ce au la numitor n-1. Este o corecie generat de considerente teoretice - vezi caseta 5.1. Prin aceste formule se obin estimri ale celor doi indicatori la nivelul ntregii populaii statistice, n condiiile n care valorile la care ne raportm aparin unui eantion extras din populaia respectiv.

41

ABATEREA STANDARD Abaterea standard9 (s sau ), numit i abaterea medie ptratic sau abaterea tip,10 reprezint rdcina ptrat din valoarea dispersiei. Abatere medie ptratic n cazul seriilor simple:

s = s2 =

(x

i

m)

2

n

(5.7)

Abaterea medie ptratic n cazul seriilor de frecvene:

s= s =2

(x

i

f

m) f i2 i

(5.7)

Estimarea abaterii standard a unei populaii, calculat pe baza unui eantion:

s= s =

2

( x i m )2n 1

(5.8)

s= s =

2

( x i m )2 f i ( f i ) 1

(5.8)

Proprietile abaterii standard: - dac la toate valorile seriei statistice se adaug (scade) o constant c, abaterea standard nu se modific: dac y i = xi + c sau y i = xi c , atunci

s y = sxdac toate valorile seriei statistice se nmulesc/divid cu o constant c, atunci i abaterea standard se va multiplica/divide cu aceeai valoare c: dac y i = c xi , atunci s y = c s x abaterea standard fa de medie este mai mic dect abaterea standard fa de oricare alt valoare (median etc.) a distribuiei.

-

Mult mai des folosit n analiza seriilor statistice, abaterea medie ptratic are acelai avantaj ca i abaterea medie liniar, i anume, se exprim n aceeai unitate de msur ca i datele iniiale pe care le studiem. De exemplu, dac studiul se bazeaz pe notele unui colectiv de elevi, abaterea tip se exprim tot n note,

9

n englez: standard deviation (SD). Abaterea standard se refer doar la abaterea medie ptratic fa de medie. Putem calcula i abaterea medie ptratic fa de median, prin nlocuirea mediei cu mediana. 10 n francez: cart type.

42

permind s se analizeze mai corect gradul de variabilitate al grupului (Radu et.al., 1993, p.72). Asemntor dispersiei, o valoarea sczut a abaterii standard reflect o serie statistic omogen; n caz contrar vorbim de eterogenitatea datelor. Mai mult, pe graficul distribuiei acest indice marcheaz punctele de inflexiune ale curbei. Totui, atunci cnd dorim s comparm serii statistice cu uniti de msur diferite, ultimii doi indicatori nu ne mai sunt de folos. Vom folosi un alt indicator: coeficientul de variaie.COEFICIENTUL DE VARIAIE (DE VARIABILITATE) Coeficientul de variaie (V) reprezint raportul dintre abaterea medie ptratic i media colectivitii studiate. Se folosete atunci cnd dorim s comparm gradul de mprtiere al unor serii statistice exprimate n uniti de msur diferite (de exemplu: nlimile a dou eantioane de subieci, exprimate n centimetrii, respectiv n inch). De asemenea, utilizm acest indicator i cnd seriile statistice au aceeai unitate de msur, dar nivelul general al valorilor caracteristicii studiate este total diferit (de exemplu: nlimile unor copii de la grdini i cele ale unor elevi de liceu, exprimate n centimetri). Coeficientul de variaie:

V =

s 100 m

(5.9)

Acest indicator se exprim n procente (se poate elimina nmulirea cu 100; vom obine valori ntre 0 i 1) i ne arat gradul de omogenitate/eterogenitate al colectivitii statistice studiate, astfel: cu ct valoarea coeficientului de variaie este mai aproape de zero, cu att variaia este mai mic, deci colectivitatea este mai omogen. Dac coeficientul de variaie este cuprins ntre 0 i 15%, nseamn c mprtierea datelor este foarte mic, iar media este reprezentativ, deoarece eantionul msurat este omogen. Dac valoarea lui este ntre 15 i 30%, mprtierea datelor este mijlocie, media fiind nc suficient de reprezentativ. Limita maxim admis pentru ca un eantion s fie considerat omogen iar media s fie reprezentativ pentru colectivitatea respectiv este de 35% (Novak, 1995). Nici acest ultim indicator nu este lipsit de contraindicaii! Cel puin dou atenionri trebuie fcute: - formula coeficientului de variaie este aplicabil doar n cazul variabilelor msurate pe scale de rapoarte, cu origine zero natural (rar ntlnite n psihologie i pedagogie); - nu oricare dou caracteristici pot fi comparate cu ajutorul coeficientului de variaie (de exemplu: este inutil s comparm un eantion dup salariul membrilor cu alt eantion n care avem n vedere numrul de la pantofi! cf. Rotariu et.al., 1999, p. 59).

5.3. INDICATORI AI FORMEI DISTRIBUIEIGradul de mprtiere a valorilor unor serii statistice determin i forme diferite ale reprezentrilor grafice ataate acestor distribuii statistice. Pentru a reflecta forma

43

unei distribuii, mai ales pentru a face comparaii ntre dou sau mai multe serii, ne folosim de o alt categorie de indicatori, numii indicatori ai formei. Cei doi indicatori folosii n statistica social sunt: oblicitatea i boltirea.INDICATORUL OBLICITII (DE ASIMETRIE) Oblicitatea11 a fost propus de ctre Pearson pentru aprecierea gradului de simterie/asimetrie a unei serii statistice. Se calculeaz cu una din formulele: Oblicitatea:

O=sau

3 (m M e ) s

(5.10)

O=sau

m Mo s

(5.10)

O=

(x

i

m) 3

ns 3

(5.10)

Prin ridicarea abaterilor individuale la puterea a treia (formula 5.10) se acord o mai mare importan valorilor extreme. Putem analiza astfel gradul de asimetrie al distribuiei, altfel spus, tendina valorilor de a se grupa spre una din cele dou extreme. n cazul distribuiilor simetrice, deoarece media i modul sunt identice, oblicitatea va fi 0. n cazul curbelor de distribuie asimetrice, alungite spre dreapta sau spre stnga, oblicitatea va avea o valoarea negativ, respectiv pozitiv (vezi cap. 6.2.).INDICATORUL BOLTIRII (DE EXCES, DE APLATIZARE) Boltirea12 exprim nlimea cocoaei curbei de distribuie, comparativ cu cea normal. Ne arat msura n care o distribuie este mai plat sau mai boltit. Boltirea:

(x B=

i

m) 4

ns 4

3

(5.11)

Pentru valori pozitive ale acestui indicator spunem c avem o distribuie leptokurtic (cu cocoa nalt). n cellalt sens, distribuia va fi platikurtic (cu cocoa aplatizat) vezi figura 5.1. Valori apropiate de 0 indic o distribuie mezokurtic11 12

n englez: skewness. n englez: kurtosis (=cocoa).

44

Sunt considerate distribuii relativ normale cazurile n care aceti indicatori nu depesc 1,96.

5.4. UTILIZAREA SPSS PENTRU CALCULAREA INDICATORILORVARAIEI I AI FORMEI

i de aceast dat dispunem de mai multe posibiliti pentru a calcula indicatorii variaiei sau pe cei ai formei unei serii statistice. Ca i n capitolele anteriore, prezentm pentru nceput soluia parcurgerii urmtoarelor comenzi:Analyze Descriptive Statistics Frequencies

Dup ce, n fereastra de dialog pentru calculul frecvenelor (vezi figura 2.1.), selectm variabila sau variabilele dorite, apsm butonul Statistics i vom ptrunde ntr-o nou fereastr de opiuni (figura 5.1).

Figura 5.1. Fereastr de opiuni pentru calculul unor indicatori statistici

La rubrica Dispersion putem opta pentru calculul abaterii standard (Std. deviation), a varianei, a amplitudinii (Range), a valorilor minime i maxime i a erorii standard a mediei (S.E. mean). La rubrica Distribution se opteaz pentru calcularea oblicitii (Skewness) sau boltirii (Kurtosis).

45

6. DISTRIBUIILE STATISTICE6.1. 6.2. 6.3. 6.4. 6.5. Distribuia normal Distribuii simetrice i asimetrice Distribuii unimodale i bimodale Valori normate (scoruri z) Distribuia normal standardizat

Dup cum am artat n capitolele anterioare (capitolul 3), prin asocierea variantelor (valorilor) unei variabile statistice cu frecvenele (absolute sau relative) cu care acestea apar se obine o DISTRIBUIE STATISTIC. Pentru exprimarea sintetic a informaiilor coninute de aceste iruri de date putem calcula o mulime de indicatori statistici, astfel nct, printr-o simpl analiz a lor s putem spune dac distribuiile statistice sunt simetrice sau asimetrice, unimodale sau multimodale, aplatizate sau nalte.

6.1. DISTRIBUIA NORMALCunoscut i sub denumirea de curba (clopotul) lui Gauss, este o distribuie simetric, spre care tind toate irurile de date obinute n practica statistic i care se caracterizeaz prin aceea c valorile centrale sunt ct mai apropiate, iar de o parte i de alta a lor avem un numr aproximativ egal de valori. ntr-o distribuie perfect normal1 media, mediana i modul sunt identice, iar celelalte valori sunt dispuse perfect simetric de o parte i de alta a acelei valori centrale.

m = Me = MoFigura 6.1 Curba distribuiei normale

x

1

Distribuia perfect normal este o distribuie teoretic unimodal, simetric i continu.

Matematicianul K.F. Gauss a constatat urmtorul aspect: cu ct obinem mai multe valori ale caracteristicii respective, cu att curba distribuie tinde spre cea perfect normal (sau teoretic). De altfel, acest tip de curb este considerat de cele mai multe ori ca un reper, normalitatea unei distribuii verificndu-se fa de aceast curb perfect simetric sau, altfel spus, distribuia normal reprezint o bun aproximaie pentru distribuiile multor variabile ntlnite n aplicaiile statistice curente. Caracteristicile curbei normale i frecvena cu care se face apel la aceasta n studiile statistice determin adesea interpretri greite. Atragem atenia c distribuiile reale pe care le descoper psihologii n studiile lor nu au niciodat parametrii unei curbe normale perfecte. Acest lucru este practic imposibil dac ne gndim c o curb normal are limitele deschise, mergnd spre infinit, n timp ce distribuiile reale sunt finite (Popa, 2004).

6.2. DISTRIBUII SIMETRICE I ASIMETRICEn analiza fenomenele psihosociale distribuiile devin simetrice (vezi distribuia normal), de cele mai multe ori, doar dac cercettorul analizeaz un numr suficient de mare de cazuri, astfel nct indicatorii tendinelor centrale s coincid, iar de o parte i de alta a lor s avem un numr aproximativ egal de valori.s=5

s = 15 m=Me=Mo=10055 70 85 100 115 130 145

Figura 6.2. Curbe de distribuie simetrice

n foarte multe situaii, ns, variantele cu cele mai mari frecvene (valorile sau intervalele modale) nu coincid cu celelalte valori centrale (media sau mediana) nregistrndu-se o polarizarea spre dreapta sau spre stnga a acestora. Pot aprea urmtoarele dou situaii: m > Me > Mo spunem c distribuia prezint o asimetrie de stnga sau pozitiv; m < Me < Mo spunem c distribuia prezint o asimetrie de dreapta sau negativ (figura 6.3).

48

asimetrie pozitiv f f

asimetrie negativ

Mo Me m

x

m Me Mo

x

Figura 6.3. Curbe de distribuie asimetrice

Reamintim c acest grad de asimetrie ne este dat i de un indicator al formei distribuiei i anume, oblicitatea (vezi 5.3.). Acesta, prin valorile pozitive sau negative pe care le ia, ilustreaz asimetria pozitiv sau negativ. O asimetrie accentuat spre stnga sau spre dreapta determin apariia unor tipuri particulare de distribuii, cunoscute cu numele de distribuii n form de i i n form de j (figura 6.4.). De exemplu, erorile pe parcursul unui proces de formare a unei deprinderi sau timpul de execuie al unei aciuni n procesul exerciiului vor nregistra valori constant descresctoare, astfel nct, reprezentarea grafic a variaiei lor va avea forma literei i (Radu et.al., 1993).distribuie n form de i f f distribuie n form de j

xFigura 6.4. Curbe de distribuie n form de i i j

x

6.3. DISTRIBUII UNIMODALE I BIMODALEn unele serii statistice media i pierde reprezentativitatea deoarece colectivitatea are tendina de a se grupa n dou (sau mai multe) grupe distincte. De data aceasta modul este indicatorul de poziie cel mai relevant. Din acest motiv, vom spune c avem de-a face cu o DISTRIBUIE BIMODAL (uneori chiar multimodal).

49

La rndul lor, distribuiile bimodale pot fi simetrice sau asimetrice, negative sau pozitive (figura 6.5.)distribuie bimodal negativ f f distribuie bimodal simetric f distribuie bimodal pozitiv

m Me Mo

x

Mo m=Me Mo

x

Mo Me m

x

Figura 6.5. Curbe de distribuie bimodale

ncheiem aceast prezentare a tipurilor de distribuii statistice cu precizarea c n cazul curbelor simetrice se recomand determinarea mediei i a abaterii standard, n timp ce pentru seriile statistice asimetrice sunt preferate valorile medianei i oblicitii. n cazul curbelor de distribuie n form de i, a celor n form de j i a celor bimodale este bine s ne mulumim cu un grafic i s determinm modul, respectiv frecvenele (Radu et.al., 1993).

6.4. VALORILE NORMATE (STANDARDIZATE) SCORURI ZDe foarte multe ori suntem pui n situaia de a compara valori ale unor caracteristici psihologice despre care nu cunoatem mare lucru. De exemplu, scorul de 17 puncte obinut de un subiect pe scala de introversie/extraversie nu ne ndreptete s afirmm c este un scor mare sau mic, i nici c este mai bun sau mai ru dect cel de 9 puncte obinut, de acelai subiect, pe scala de stabilitate/instabilitate. n situaia n care nu cunoatem semnificaia datelor colectate n form brut putem recurge la transformarea acestora din cote brute n valori normate (standardizate), transformare ce se bazeaz pe proprietile mediei i abaterii standard, n cazul unei distribuii normale. Scorul normat z (numit i cota z sau scor z) exprim semnificaia unei anumite valori dintr-o distribuie prin raportare la parametrii distribuiei (medie i abatere standard). Altfel spus, aceasta msoar distana dintre o anumit valoare i media distribuiei, n abateri standard. Formula de calcul este:

z=unde

xm s

(6.1)

x reprezint oricare dintre valorile distribuiei, m i s reprezint media, respectiv abaterea standard.

50

Scorul z se numete i scor standardizat z (not standardizat z). Aceasta pentru c poate fi utilizat pentru a compara valori care provin din distribuii diferite, indiferent de unitatea de msur a fiecreia. Exemplu (apud Sava, 2004a): Un subiect a obinut 43 de rspunsuri corecte la un test de acuitate vizual (TAV) i 18 puncte la un test de atenie concentrat (TAC). Dac transformm n cote z cele 43 de puncte obinute la TAV, vom obine valoarea -1,71 (tiind c m = 55, s = 7). Similar, dac vom transforma n cote z rezultatul obinut la TAC, vom obine -0,96 (m = 21, s = 3,11). Pe baza acestor transformri putem afirma c, dei ambele rezultate sunt sub medie, performana la TAC este mai bun dect cea obinut la TAV. Utiliznd proprietile de transformare a formulei de definiie a scorului z, putem calcula o anumit valoare atunci cnd cunoatem valoarea lui z i parametrii distribuiei, astfel:

x= zs+mProprietile scorurilor z

(6.2)

1. Media unei distribuii z este ntotdeauna egal cu 0. Pentru a explica aceast afirmaie facem apel la una dintre proprietile mediei, i anume: scderea unei constante la fiecare valoare determin scderea mediei cu acea valoare (vezi 4.1.). Formula de calcul pentru z implic scderea unei constante din fiecare valoare a distribuiei. Aceasta nseamn c i media noii distribuii (z) se va reduce cu constanta respectiv. Dar aceast constant este nsi media distribuiei originale, ceea ce nseamn c distribuia z va avea media egal cu zero, ca rezultat al diminurii mediei cu ea nsi. 2. Abaterea standard a unei distribuii z este ntotdeauna 1. Acest fapt decurge prin efectul cumulat al proprietilor abaterii standard (vezi 5.2.). Prima proprietate afirm c n cazul scderii unei constante (n cazul scorurilor z, media) din valorile unei distribuii, abaterea standard a acesteia nu se modific. A doua proprietate afirm c n cazul mpririi valorilor unei distribuii la o constant, noua abatere standard este rezultatul raportului dintre vechea abatere standard i consta